HAOBOTIYU-业内首个！小米开源模型OmniVoice可覆盖600+语种

2026 / 05 / 28

HAOBOTIYU-业内首个！小米开源模型OmniVoice可覆盖600+语种

【CNMO科技动静】5月7日，小米AI试验室推出OmniVoice，这是业内首个笼罩数百语种的语音克隆TTS（文本到语音）模子。该模子撑持600余种语言的语音合成，包括低资源小语种，可以或许实现高质量的多语言语音克隆。

小米

据先容，OmniVoice于数秒内便可完针言音克隆，且笼罩语种规模广泛。传统语音克隆模子凡是仅撑持少数主流语言，而小米AI试验室经由过程技能立异，将模子扩大至数百语种，使患上险些所有语种都能经由过程该模子举行合成。这一冲破为多语言语音交互、内容当地化等场景提供了新的技能路径。

业内首个！小米开源模型OmniVoice可覆盖600+语种

小米AI试验室暗示，OmniVoice的推出标记着多语言TTS研发进入新范式。该模子于低资源小语种上的体现尤为凸起，解决了以往小语种语音数据稀缺致使合成质量低的问题。今朝，该技能已经于小米旗下部门产物中最先运用测试，将来有望进一步拓展至更多智能装备及办事场景。

除了了焦点的多语言及语音克隆能力，OmniVoice还有新增了多个实用功效，让语音合成更矫捷、更贴合现实需求：

1.自界说音色设计：无需参考音频，只需描写音色属性（如性别、春秋、调子、方言、口音等），就能天生切合预期的音色，还有撑持耳语等非凡气势派头。

2. 带噪参考音频适配：针对于现实利用中参考音频音质欠安的问题，OmniVoice能主动过滤噪声，提取清楚的音色特性，即便于嘈杂情况下录制的音频，也能克隆出高质量语音。

3. 富厚语气表达：撑持插入笑声、叹气等语气符号，让合针言音更有体现力，更切近真人交流。

4. 发音精准改正：针对于中英文多音字、专有名词易读错的问题，用户可经由过程简朴设置，改正发音过错，晋升语音合成的靠得住性。

版权所有，未经许可不患上转载

-HAOBOTIYU

推荐阅读

2025 / 06 / 20

案例解码，智能破局，数云原力AI for Process系列直播日即将来袭！
2025 / 06 / 18

haobotiyu-好博(中国)数码×思科：AI实验室开幕，共启无限可能
2025 / 06 / 17

haobotiyu-好博(中国)数码郭为出席2025 INNOTECH大湾区科创投资论坛，再谈AI时代企业管理

版权所有2016-2025 haobotiyu-好博(中国)数码集团股份有限公司，保留一切权利。