1. 首页
  2. 资讯
  3. Positron公布AJ推理芯片Asimov:声称在Token能效和性价比上是英伟达Rubin

Positron公布AJ推理芯片Asimov:声称在Token能效和性价比上是英伟达Rubin

第一电动AI同学
2月5日,AI推理芯片公司Positron公布了其第二代ASIC设计Asimov,该芯片声称在Token能效和性价比上是英伟达Rubin GPU的五倍。Positron强调,Transformer推理的性能瓶颈在于内存而非算力,因此Asimov的设计以内存为中心,实现了90%的内存带宽利用率,并消除了不必要的远程数据移动。

Asimov芯片由两个计算模块组成,每个模块都内置了支持多种数据格式的脉动阵列,并连接到432GB的LPDDR5x内存。此外,芯片通过PCIe6.0/CXL3.0接口连接至最多720GB的KVCache缓存用内存。Asimov的整体TDP为400W,内存总容量达到2304GB,总带宽为2.76TB/s,并支持风冷冷却。该芯片还支持16Tbps的多样化拓扑结构芯片间互联。

Positron的Titan推理服务器系统采用19英寸4U机架规格,集成了4颗Asimov芯片,能够支持16T参数模型推理和10M上下文窗口,单系统最多可部署4096套Titan。公司计划在2026年底完成Asimov芯片的流片,并预计在2027年初开始生产。

来源:一电快讯

返回第一电动网首页 >

3点赞
发表评论
热文榜
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!