如何让 AI 语音有效模仿人类对话的丰富动态与情感,已成为全球研究者的共同挑战。
据微软官方消息,就在不久前,微软 Azure Neural TTS(神经网络文本转语音)推出的新一代模型“Uni-TTS v4”在这一领域取得了里程碑式的重大突破。
在“2021 国际语音合成大赛(Blizzard Challenge 2021)”的测试中,Uni-TTS v4 的语音表现与通用数据集上的自然语音相比几乎没有明显差别,展现出足以“叫板”真人对话的实力。
“耳听”为实,微软官方还放出了几段 TTS 和真人对话的对比。
IT之家了解到,作为微软 Azure 认知服务中的强大语音合成功能,Neural TTS 可用于帮助开发者将文本转换为真人一般的逼真自然语音。
常被用于语音助手场景、文字朗读功能,及作为辅助工具等等。