今日,深圳河套学院AI训练平台项目团队联合哈尔滨工业大学(深圳)、深圳市大数据研究院、华为等机构,共同完成了1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练。这一成果依托昇腾910C国产AI算力集群实现,标志着国产AI芯片已具备支撑世界级超大参数模型训练的能力。项目团队通过协同深智城AI算力平台,实现了模型算力利用率超过30%,关键训练算子效率提升14%,各项指标均达到工业级运行标准。
此次实践不仅为全球第三方机构在国产算力平台上完成该级别模型训练的相关探索积累了重要经验,也验证了国产AI芯片的高性能和可靠性。从技术应用角度来看,调用已有模型开展业务推理与从零完成模型全参数训练在技术难度、硬件要求上存在明显区别。本次试验结果表明,国产AI算力已可承担顶级大模型训练任务,相关技术路径具备可行性。

来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。