2月5日,AI推理芯片公司Positron公布了其第二代ASIC设计Asimov,该芯片声称在Token能效和性价比上是英伟达Rubin GPU的五倍。Positron强调,Transformer推理的性能瓶颈在于内存而非算力,因此Asimov的设计以内存为中心,实现了90%的内存带宽利用率,并消除了不必要的远程数据移动。
Asimov芯片由两个计算模块组成,每个模块都内置了支持多种数据格式的脉动阵列,并连接到432GB的LPDDR5x内存。此外,芯片通过PCIe6.0/CXL3.0接口连接至最多720GB的KVCache缓存用内存。Asimov的整体TDP为400W,内存总容量达到2304GB,总带宽为2.76TB/s,并支持风冷冷却。该芯片还支持16Tbps的多样化拓扑结构芯片间互联。
Positron的Titan推理服务器系统采用19英寸4U机架规格,集成了4颗Asimov芯片,能够支持16T参数模型推理和10M上下文窗口,单系统最多可部署4096套Titan。公司计划在2026年底完成Asimov芯片的流片,并预计在2027年初开始生产。


来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。