2月13日,
谷歌宣布对Gemini3DeepThink进行重大升级,推出专门针对科学、研究与工程场景的“推理模式”,以推动智能技术在科研领域的前沿发展。此次升级由谷歌与各行业科学家、研究人员合作完成,旨在应对科研环境中常见的复杂问题,如缺少清晰边界、未必存在唯一解,以及数据杂乱或不完整等挑战。
升级后的DeepThink在数学、算法与编程等高难推理任务上继续提升表现。在终极人类考试(Humanity'sLastExam)上取得48.4%的成绩;在ARC-AGI-2上达到84.6%,并由ARCPrizeFoundation验证;在Codeforces竞赛编程基准上获得3455的Elo;并在2025年国际数学奥林匹克竞赛(IMO2025)上达到金牌水平表现。此外,新版DeepThink在化学、物理等科学领域也展现出更强的能力,如在2025年国际物理奥林匹克与国际化学奥林匹克的笔试部分取得金牌级结果,同时在理论物理相关的CMT-Benchmark上获得50.5%的得分。
谷歌表示,DeepThink的目标不仅是追求基准测试成绩,更希望推动实际工程与科研应用,例如帮助研究人员解释复杂数据、帮助工程师通过代码对物理系统进行建模。未来,谷歌将持续将DeepThink带到研究人员和实践者“最需要的地方”,并通过GeminiAPI开放早期访问,以促进技术的实际应用和进一步发展。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。