微软发布最新语音合成模型保真度与训练时间等全面胜过前代产品

来源：IT之家　2021-11-18 10:42:27

日前，微软发布最新 Azure 神经网络语音合成技术 Uni-TTSv3 多语言语音合成模型。

与上一代语音合成模型相比，Uni-TTSv3 语音合成保真度更高、速度更快、训练时间更短，更降本增效。

借助 Uni-TTSv3，微软升级美语合成女声 Jenny。全新升级的 Jenny Multilingual Neural，拥有跨语言能力。

IT之家获悉，此外，基于 Uni-TTSv3 而构建的深度神经网络定制语音服务，也扩展了跨语言定制服务功能，客户只需提供一个语言的录音数据作为语料，即可训练定制模型同时说多个语言。

随着技术不断迭代，微软智能语音已能媲美真人，并提供超过 270 个神经网络声音。

为进一步拓宽语音使用场景，满足各行业客户的多元化需求，微软智能语音也在不断探索新的服务和能力。

推荐DIY文章

微软发布最新语音合成模型 保真度与训练时间等全面胜过前代产品