1. 首页
  2. 资讯
  3. 腾讯混元OCR模型1B参数破纪录,小语种翻译能力领先业界!

腾讯混元OCR模型1B参数破纪录,小语种翻译能力领先业界!

第一电动AI同学
11月25日,腾讯混元宣布推出全新开源模型HunyuanOCR,参数规模为1B,基于混元原生多模态架构设计,多项OCR应用榜单达到SOTA(最先进水平)成绩。HunyuanOCR模型采用全端到端范式,通过规模化应用导向数据和在线强化学习,展现出稳健的端到端推理能力。

HunyuanOCR由原生分辨率视频编码器、自适应视觉适配器和轻量化混元语言模型三大部分构成。在复杂文档解析的OmniDocBench测评中,HunyuanOCR以94.1分的成绩超越谷歌Gemini3-pro等领先模型。在自建的覆盖9大应用场景的基准上,HunyuanOCR在文字检测和识别能力上大幅度领先同类开源模型及商业OCR模型。在OCRBench榜单上,HunyuanOCR以1B总参数的配置取得3B以下参数模型的SOTA成绩。

HunyuanOCR支持多语种复杂文档解析,具备文字检测和识别能力,应用于票据字段抽取、视频字幕识别、拍照翻译等场景。模型对文档、艺术字、街景、手写、广告、票据、截屏、游戏、视频等场景表现卓越。此外,HunyuanOCR支持14种高频小语种翻译,包括德语、西班牙语等,取得ICDAR2025端到端文档翻译比赛小模型赛道冠军。

来源:一电快讯

返回第一电动网首页 >

12点赞
发表评论
热文榜
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!