发布日期:2026-02-13 06:56 点击次数:52

2月11日,智谱追究发布新一代大模子GLM-5。摩尔线程基于SGLang推理框架,在旗舰级AI训推一体全功能GPU MTT S5000上,Day-0就完成了全进程适配与考证。如斯“发布即适配”的情况,有望成为改日国产GPU生态构建的常态。
凭借MUSA架构粗鄙的算子粉饰与普遍的生态兼容才智,摩尔线程成效买通了模子推理全链路,并深度开释MTT S5000的原生FP8加快才智,在确保模子精度的同期显耀裁汰了显存占用,完了了GLM-5的高性能推理。这次快速适配,不仅印证了MUSA软件栈的熟谙度,更充分展现了国产全功能GPU对最新大模子即时、高效的因循才智。
摩尔线程方面期待,GLM-5与MTT S5000的国产双强连合,将为缔造者带来可对标外洋顶尖模子的极致编程体验。无论是在函数补全、短处检测如故Debug场景中,该组合均进展超卓,以显耀增强的逻辑筹画才智,平缓支吾各样复杂的长程任务挑战。
在此类适配中,摩尔线程中枢上风在于可提供“软硬协同的全栈算力底座”。MTT S5000是专为大模子查考、推理及高性能联想而联想的全功能GPU智算卡,基于第四代MUSA架构“平湖”打造。其单卡AI算力最高可达1000 TFLOPS,配备80GB显存,显存带宽达到1.6TB/s,卡间互联带宽为784GB/s,好意思满因循从FP8到FP64的全精度联想。据接近测试表情的行业东谈主士夸耀,MTT S5000在产物精度上已非凡H100,更接近英伟达Blackwell架构。在近期一次数千亿参数模子的全进程查老练证中,该卡进展出了与H100集群极高的抑止一致性,最终模子要道认识差错仅守护在千分之几的范畴内,全体查考成果甚而完了小幅非凡。
摩尔线程关联负责东谈主告诉记者,据来自互联网厂市场景的实测信息反馈,MTT S5000在典型端到端推理及查考任务中,性能可达竞品H20的2.5倍支配。分析指出,这主要成绩于其高达1000 TFLOPS的单卡算力,在绝大多量联想密集型场景中,该卡不仅能提供更强盛的算力输出,也在全体性价比上展现出显耀上风。
MUSA软件栈的敏捷性是完了Day-0适配的要道。基于MUSA架构的TileLang原生算子单位测试粉饰率已越过80%,使得绝大多量通用算子可径直复用,显耀裁汰移植老本,并能快速跟进前沿模子结构与新特质演进。
通过高效算子交融及框架极致优化,MTT S5000在确保代码生成质地的同期显耀裁汰了反应延长。无论是科罚复杂的代码库分析,如故驱动长周期的智能体(Agent)任务,均能保握首字延长(TTFT)低、生成速率快的深切体验。MTT S5000与GLM-5的软硬双强组合,在函数补全、短处检测等中枢场景的进展非凡同级,充分开释模子的筹画才智和Debug才智,是引申长程缔造任务的理思吸收。
不雅察:从GLM-4.6、GLM-4.7到GLM-5,摩尔线程已将“发布即适配”化为常态,这种对主流软件栈的无缝兼容与敏捷反应,充分阐发:国产全功能GPU及MUSA软件栈也曾具备格外高的熟谙度与沉稳性,确保缔造者能第一时辰触达最新模子才智,从而联袂共建富贵发展的国产AI生态。
文/广州日报新花城记者:钟达文 现金万博manbext体育官网app平台
