摩尔线程携手无问芯穹：0到1端到端大模型实训在国产GPU首次突破

2024-05-27 17:36:40 来源：千龙网

观看：97

摩尔线程联合无问芯穹宣布，双方在近日正式完成基于国产全功能GPU千卡集群的3B规模大模型实训。该模型名为“MT-infini-3B”，在摩尔线程夸娥（KUAE）千卡智算集群与无问芯穹AIStudio PaaS平台（https://cloud.infini-ai.com/aistudio）上完成了高效稳定的训练。本次实训充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性，同时也在行业内率先开启了国产大语言模型与国产GPU千卡智算集群深度合作的新范式。

MT-infini-3B模型训练总用时13.2天，经过精度调试，实现全程稳定训练不中断，集群训练稳定性达到100%，千卡训练和单机相比扩展效率超过90%。目前，实训出来的MT-infini-3B性能在同规模模型中跻身前列，相比在国际主流硬件上训练而成的其他模型，在C-Eval，MMLU，CMMLU等3个测试集上均实现性能领先。

MT-infini-3B性能表现

无问芯穹联合创始人兼CEO夏立雪表示：“国内大模型与国产芯片的软硬件协同发展，最终目标是构建一个成熟的生态系统。无问芯穹正在打造‘M种模型’和‘N种芯片’间的‘M×N’中间层产品，实现多种大模型算法在多元芯片上的高效、统一部署。摩尔线程是第一家接入无问芯穹并进行千卡级别大模型训练的国产GPU公司，而‘MT-infini-3B’的训练是行业内首次实现基于国产GPU芯片从0到1的端到端大模型实训案例。”

摩尔线程创始人兼CEO张建中表示：“无问芯穹在夸娥千卡智算集群上实现的从零开始的大模型训练，不仅是对摩尔线程技术实力的有力认证，更是实现了国内大模型训练的国产化闭环。摩尔线程夸娥千卡智算集群以全功能GPU为底座，提供软硬一体化的全栈解决方案，具备高兼容性、高稳定性、高扩展性等综合优势，我们致力于成为AGI时代大模型训练坚实可靠的先进基础设施。”

此前，摩尔线程与无问芯穹已达成深度战略合作。无问芯穹大模型开发与服务平台“无穹Infini-AI”和摩尔线程大模型智算千卡集群夸娥已完成系统级融合适配，该平台可以灵活调用夸娥的集群能力以完成大模型的训练、微调与推理任务。未来，双方还将开展更多适配与测试，推动国产大模型技术的快速发展与应用普及，为中国人工智能产业的蓬勃发展贡献力量。

摩尔线程联合无问芯穹宣布，双方在近日正式完成基于国产全功能GPU千卡集群的3B规模大模型实训。该模型名为“MT-infini-3B”，在摩尔线程夸娥（KUAE）千卡智算集群与无问芯穹AIStudio PaaS平台（https://cloud.infini-ai.com/aistudio）上完成了高效稳定的训练。本次实训充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性，同时也在行业内率先开启了国产大语言模型与国产GPU千卡智算集群深度合作的新范式。

MT-infini-3B模型训练总用时13.2天，经过精度调试，实现全程稳定训练不中断，集群训练稳定性达到100%，千卡训练和单机相比扩展效率超过90%。目前，实训出来的MT-infini-3B性能在同规模模型中跻身前列，相比在国际主流硬件上训练而成的其他模型，在C-Eval，MMLU，CMMLU等3个测试集上均实现性能领先。

MT-infini-3B性能表现

无问芯穹联合创始人兼CEO夏立雪表示：“国内大模型与国产芯片的软硬件协同发展，最终目标是构建一个成熟的生态系统。无问芯穹正在打造‘M种模型’和‘N种芯片’间的‘M×N’中间层产品，实现多种大模型算法在多元芯片上的高效、统一部署。摩尔线程是第一家接入无问芯穹并进行千卡级别大模型训练的国产GPU公司，而‘MT-infini-3B’的训练是行业内首次实现基于国产GPU芯片从0到1的端到端大模型实训案例。”

摩尔线程创始人兼CEO张建中表示：“无问芯穹在夸娥千卡智算集群上实现的从零开始的大模型训练，不仅是对摩尔线程技术实力的有力认证，更是实现了国内大模型训练的国产化闭环。摩尔线程夸娥千卡智算集群以全功能GPU为底座，提供软硬一体化的全栈解决方案，具备高兼容性、高稳定性、高扩展性等综合优势，我们致力于成为AGI时代大模型训练坚实可靠的先进基础设施。”

此前，摩尔线程与无问芯穹已达成深度战略合作。无问芯穹大模型开发与服务平台“无穹Infini-AI”和摩尔线程大模型智算千卡集群夸娥已完成系统级融合适配，该平台可以灵活调用夸娥的集群能力以完成大模型的训练、微调与推理任务。未来，双方还将开展更多适配与测试，推动国产大模型技术的快速发展与应用普及，为中国人工智能产业的蓬勃发展贡献力量。

本文链接：摩尔线程携手无问芯穹：0到1端到端大模型实训在国产GPU首次突破http://www.llsum.com/show-2-6255-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：电粒世界第二次会议暨电粒世界展望论坛在清华大学成功举办

下一篇： “数字时代出版人才发展”分论坛——顺应数字时代之变培养更多名编大家

摩尔线程携手无问芯穹：0到1端到端大模型实训在国产GPU首次突破

热门资讯

推荐资讯

科技最热文章