5月14日,小米技术宣布正式发布并开源XiaomiOneVL一步式潜空间语言视觉推理框架。这一框架在业内首次将视觉语言模型(VLA)、世界模型统一到同一套框架中,通过潜空间推理实现技术整合。小米董事长兼CEO雷军表示,XiaomiOneVL在推理、规划等多个主流基准上全面刷新了潜在推理方法的性能上限,模型与代码已全面开源。
XiaomiOneVL在技术层面实现了VLA、世界模型、潜空间推理等多个技术路线的统一,不仅继承了XLA模型的强大推理能力,还显著提升了推理速度和精度。该框架在精度上超越了显式CoT,在速度上与“仅答案”预测的潜空间CoT方案相匹配,被认为是行业内具有开创性的方案。雷军还向全球开发者和研究人员发出邀请,共同探索
自动驾驶大模型的更多可能性。XiaomiOneVL的模型权重和训练、推理代码已全面开源,相关链接包括技术报告、项目主页和开源代码。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。