5月19日,特斯拉CEO埃隆·
马斯克发布推文,邀请用户测试CursorComposer2.5模型。该模型部分基于Colossus2训练而成,Cursor官方称其为最强大的AI模型。Composer2.5基于月之暗面的KimiK2.5模型训练,重点提升长任务稳定性、复杂指令遵循能力和协作体验。技术上,Composer2.5的关键改动之一是基于文本反馈的定向RL(强化学习),通过在错误发生位置插入简短反馈提示,更精准地纠正错误工具调用、混乱解释和不符合要求的风格。
为了提升编码能力,Cursor将合成任务规模扩大到Composer2的25倍,并在训练中动态筛选更难任务。一种方法是从真实代码库中删除可测试功能,再要求模型补回去,测试结果直接作为奖励信号。官方承认,大规模合成训练带来奖励作弊风险,高强度RL训练必须配合更严密监控。在训练基础设施上,Composer2.5使用分片Muon与双网格HSDP,优化器单步耗时控制在0.2秒。
价格方面,Composer2.5标准版为每百万token输入0.50美元,每百万token输出2.50美元。另有一个智能水平相同、但速度更快的fast版本,价格为每百万token输入3.00美元,每百万token输出15.00美元。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。