首页>科技动态 > 科技前沿 > 正文

微软发布最新语音合成模型 保真度与训练时间等全面胜过前代产品

日前,微软发布最新 Azure 神经网络语音合成技术 Uni-TTSv3 多语言语音合成模型。

与上一代语音合成模型相比,Uni-TTSv3 语音合成保真度更高、速度更快、训练时间更短,更降本增效。

借助 Uni-TTSv3,微软升级美语合成女声 Jenny。全新升级的 Jenny Multilingual Neural,拥有跨语言能力。

IT之家获悉,此外,基于 Uni-TTSv3 而构建的深度神经网络定制语音服务,也扩展了跨语言定制服务功能,客户只需提供一个语言的录音数据作为语料,即可训练定制模型同时说多个语言。

随着技术不断迭代,微软智能语音已能媲美真人,并提供超过 270 个神经网络声音。

为进一步拓宽语音使用场景,满足各行业客户的多元化需求,微软智能语音也在不断探索新的服务和能力。

标签: 微软 语音合成模型

推荐DIY文章
性能旗舰一加 10 Pro首销战报出炉 1秒破亿
一加 10 Pro重磅发布,最强性能旗舰10至名归
千万销量千家售后 一加多触点布局国内市场
科技加持,未来已来,“头号玩家”不再是科幻
一加 10 Pro发布在即,性能屏幕影像全方位提升
一加中国区新任总裁李杰 :做好品牌与用户之间的连接器
精彩新闻

超前放送