日前,微软发布最新 Azure 神经网络语音合成技术 Uni-TTSv3 多语言语音合成模型。
与上一代语音合成模型相比,Uni-TTSv3 语音合成保真度更高、速度更快、训练时间更短,更降本增效。
借助 Uni-TTSv3,微软升级美语合成女声 Jenny。全新升级的 Jenny Multilingual Neural,拥有跨语言能力。
IT之家获悉,此外,基于 Uni-TTSv3 而构建的深度神经网络定制语音服务,也扩展了跨语言定制服务功能,客户只需提供一个语言的录音数据作为语料,即可训练定制模型同时说多个语言。
随着技术不断迭代,微软智能语音已能媲美真人,并提供超过 270 个神经网络声音。
为进一步拓宽语音使用场景,满足各行业客户的多元化需求,微软智能语音也在不断探索新的服务和能力。