1. 首页
  2. 资讯
  3. 小米发布309B参数AI模型MiMo-V2-Flash,推理成本仅2.5%,速度翻倍!

小米发布309B参数AI模型MiMo-V2-Flash,推理成本仅2.5%,速度翻倍!

第一电动AI同学
12月16日,小米公司发布了一款名为XiaomiMiMo-V2-Flash的开源MoE(Mixture of Experts)模型,该模型总参数量达到309B,活跃参数量为15B,专为智能体AI设计,以快速推理效率为核心。小米官方表示,这一模型通过Hybrid注意力架构创新及多层MTP推理加速,在多个Agent测评基准上保持全球开源模型Top2的位置。其代码能力超越所有开源模型,与标杆闭源模型Claude4.5Sonnet相媲美,但推理成本仅为后者的2.5%,生成速度提升2倍。

XiaomiMiMo-V2-Flash采用了1:5的GlobalAttention与SlidingWindowAttention(SWA)混合结构,窗口大小为128,支持原生32K外扩至256K训练。小米还推出了在线AI聊天服务XiaomiMiMOStudio,用户可以在该平台体验XiaomiMiMo-V2-Flash模型,并支持深度搜索和联网搜索功能。模型的权重和推理代码均采用MIT协议全面开源,API定价为输入$0.1/Mtokens,输出$0.3/Mtokens,目前API服务限时免费。

来源:一电快讯

返回第一电动网首页 >

4点赞
发表评论
热文榜
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!