8 月 21 日消息,DeepSeek 发布 DeepSeek-V3.1 版本,带来多项升级。新版本采用混合推理架构,支持思考模式与非思考模式切换,提升思考效率,能在更短时间内给出答案。Agent 能力也显著增强,通过 Post-Training 优化,工具使用与智能体任务表现大幅提升。
DeepSeek-V3.1 的官方 App 与网页端模型已同步升级,用户可自由切换思考模式。API 也已升级,deepseek-chat 对应非思考模式,deepseek-reasoner 对应思考模式,上下文扩展至 128K,Beta 接口支持 strict 模式的 Function Calling。此外,新增对 Anthropic API 格式支持,可接入 Claude Code 框架。
在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 相比之前版本有明显提高。在多项搜索评测指标上,DeepSeek-V3.1 取得较大提升,特别是在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,性能大幅领先 R1-0528。
DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度,对分词器及 chat template 进行了较大调整,与 DeepSeek-V3 存在明显差异。UE8M0 FP8 是针对即将发布的下一代国产芯片设计,旨在优化性能与兼容性。
来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。文中图片源自互联网或AI创作,如有侵权请联系邮件删除。