4月16日,阶跃星辰公司发布了新一代语音生成模型StepAudio2.5TTS,该模型被宣传为能够使每个人都成为配音导演。官方强调,StepAudio2.5TTS首次将语境理解能力整合到语音生成的全流程中,通过GlobalContext(全局语境)和InlineContext(文中语境)的双档控制,结合Zero-shot音色复刻技术,使得AI能够不仅仅是念文本,而是能够演绎文本。
StepAudio2.5TTS的核心能力包括全局语境控制,允许用户自定义整段语音的情绪基调、角色状态和场景氛围,以实现更统一和连贯的表达。此外,文中语境控制功能能够让用户不仅控制一句话的表达方式,还能进一步调节语气、节奏、停顿、轻重变化、角色感和场景感,使得声音表达更加精准。零样本复刻与全音色控制功能则在保留目标音色特征的同时,支持对情感、风格和表达方式进行灵活调节,使得同一种声音能够表达出更多不同的感觉。
官方演示网址为:
网页链接。



来源:一电快讯
返回第一电动网首页 >
以上内容由AI创作,如有问题请联系admin#d1ev.com(#替换成@)沟通,AI创作内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网或AI创作,如有侵权请联系邮件删除。