4月20日,阿里通义实验室推出了语音识别大模型Fun-ASR1.5,该模型基于统一的大模型架构,能够覆盖30种语言、汉语七大方言体系及20+地方口音,甚至能够精准转写古诗词吟诵。Fun-ASR1.5已在阿里云百炼平台正式上线,为教育、传媒、金融、科技、文化等行业提供API服务。该模型在跨语言切换场景下表现出色,无需预设语种标签即可自动识别并切换,确保转写准确性。其背后的MoE架构让模型内部分工协作,提高了灵活性和效率。
Fun-ASR1.5在中文本土化方面表现突出,基于数十万小时的真实方言语音数据,其平均字错误率(CER)相比上一版本下降56.2%。此外,该模型还对中文古诗词识别进行了专项优化,构建了先秦至近代的古诗词语音-文本对齐语料库,内部评测集中对古诗词的字符级准确率达到97%。模型还能自动插入标点符号,将口语中的非标准表达转换为规范格式,如数字、日期、金额和电话等,大大降低了后期人工校对和编辑成本。用户可在阿里云百炼平台调用其API,或在魔搭社区直接体验。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。