首页家电百科实时讯息常识

首页 > 实时讯息 >

华为发布准万亿大模型

0次浏览发布时间：2025-05-31 00:03:00

近日，华为在MoE模型训练领域再进一步，重磅推出参数规模高达7180亿的全新模型——盘古UltraMoE，这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。华为同时发布盘古UltraMoE模型架构和训练方法的技术报告，披露众多技术细节，充分体现了昇腾在超大规模MoE训练性能上的跨越。

训练超大规模和极高稀疏性的MoE模型极具挑战，训练过程中的稳定性往往难以保障。针对这一难题，盘古团队在模型架构和训练方法上进行了创新性设计，成功地在昇腾平台上实现了准万亿MoE模型的全流程训练。

此外，近期发布的盘古ProMoE大模型，在参数量仅为720亿，激活160亿参数量的情况下，通过动态激活专家网络的创新设计，实现了以小打大的优异性能，甚至可以媲美千亿级模型的性能表现。在业界权威大模型榜单SuperCLUE最新公布的2025年5月排行榜上，位居千亿参数量以内大模型排行并列国内第一。

华为盘古UltraMoE和盘古ProMoE系列模型的发布，证明华为不仅完成了国产算力+国产模型的全流程自主可控的训练实践，同时在集群训练系统的性能上也实现了业界领先。这意味着国产AI基础设施的自主创新能力得到了进一步验证，为中国人工智能产业的发展提供了一颗“定心丸”。

（来源：观察者网）

本文分类：实时讯息
本文标签：盘古模型华为性能参数实现了流程架构
浏览次数：0 次浏览
发布日期：2025-05-31 00:03:00
本文链接：https://m.kybk.net/news/MB2na3O7dL.html

上一篇 > 端午龙船赛、乡村咖啡、火山营地，这是德庆哪个村？
下一篇 > 《爱，死亡和机器人》为什么成功？为什么失败？

相关文章