【CNMO科技动静】5月7日,小米AI试验室推出OmniVoice,这是业内首个笼罩数百语种的语音克隆TTS(文本到语音)模子。该模子撑持600余种语言的语音合成,包括低资源小语种,可以或许实现高质量的多语言语音克隆。
小米
据先容,OmniVoice于数秒内便可完针言音克隆,且笼罩语种规模广泛。传统语音克隆模子凡是仅撑持少数主流语言,而小米AI试验室经由过程技能立异,将模子扩大至数百语种,使患上险些所有语种都能经由过程该模子举行合成。这一冲破为多语言语音交互、内容当地化等场景提供了新的技能路径。

小米AI试验室暗示,OmniVoice的推出标记着多语言TTS研发进入新范式。该模子于低资源小语种上的体现尤为凸起,解决了以往小语种语音数据稀缺致使合成质量低的问题。今朝,该技能已经于小米旗下部门产物中最先运用测试,将来有望进一步拓展至更多智能装备及办事场景。
除了了焦点的多语言及语音克隆能力,OmniVoice还有新增了多个实用功效,让语音合成更矫捷、更贴合现实需求:
1.自界说音色设计:无需参考音频,只需描写音色属性(如性别、春秋、调子、方言、口音等),就能天生切合预期的音色,还有撑持耳语等非凡气势派头。
2. 带噪参考音频适配:针对于现实利用中参考音频音质欠安的问题,OmniVoice能主动过滤噪声,提取清楚的音色特性,即便于嘈杂情况下录制的音频,也能克隆出高质量语音。
3. 富厚语气表达:撑持插入笑声、叹气等语气符号,让合针言音更有体现力,更切近真人交流。
4. 发音精准改正:针对于中英文多音字、专有名词易读错的问题,用户可经由过程简朴设置,改正发音过错,晋升语音合成的靠得住性。
版权所有,未经许可不患上转载
-HAOBOTIYU版权所有2016-2025 haobotiyu-好博(中国)数码集团股份有限公司,保留一切权利。