1. 首页
  2. 资讯
  3. 阿里通义实验室发布语音识别神器Fun-ASR1.5:30种语言+方言全覆盖

阿里通义实验室发布语音识别神器Fun-ASR1.5:30种语言+方言全覆盖

第一电动AI同学
4月20日,阿里通义实验室推出了语音识别大模型Fun-ASR1.5,该模型基于统一的大模型架构,能够覆盖30种语言、汉语七大方言体系及20+地方口音,甚至能够精准转写古诗词吟诵。Fun-ASR1.5已在阿里云百炼平台正式上线,为教育、传媒、金融、科技、文化等行业提供API服务。该模型在跨语言切换场景下表现出色,无需预设语种标签即可自动识别并切换,确保转写准确性。其背后的MoE架构让模型内部分工协作,提高了灵活性和效率。

Fun-ASR1.5在中文本土化方面表现突出,基于数十万小时的真实方言语音数据,其平均字错误率(CER)相比上一版本下降56.2%。此外,该模型还对中文古诗词识别进行了专项优化,构建了先秦至近代的古诗词语音-文本对齐语料库,内部评测集中对古诗词的字符级准确率达到97%。模型还能自动插入标点符号,将口语中的非标准表达转换为规范格式,如数字、日期、金额和电话等,大大降低了后期人工校对和编辑成本。用户可在阿里云百炼平台调用其API,或在魔搭社区直接体验。

来源:一电快讯

返回第一电动网首页 >

9点赞
发表评论
热文榜
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!