首页>科技动态 > 科技前沿 > 正文

微软推出AI合成语音新玩法 一键完成模型训练API布局更迅速

智能语音技术的飞速发展,让 AI 合成语音的听感更加自然、逼真,让越来越多企业实现了与客户的多模态互动。

基于微软 Azure 创建声音定制服务定制的专属声音,已被广泛应用在诸如语音助手、聊天机器人、有声读物或新闻播报等多种使用场景。

传统上,完成一个定制声音时间周期长、复杂度高。需要发音人录制成千上万句语料作为训练数据,再由拥有深度神经网络和语音合成专业背景的专家针对客户的语音数据进行声学模型和语音合成器的训练及调优,整个过程往往需要数月的时间。

微软推出基于深度神经网络的声音定制服务,所需训练数据更少,只要 300 至 2000 句语料数据(约 30-120 分钟);训练调优的难度和复杂度更加简化,即使没有深度神经网络和语音合成专业背景的用户也可实现自助训练,得到媲美人类发音的效果。

用户需注册 Azure Speech Studio,申请获得深度神经网络声音定制权限后,即可一键完成声音模型的训练,并快速部署 API,适用于各种场景的应用开发。

标签: AI 合成语音 微软 Azure

推荐DIY文章
性能旗舰一加 10 Pro首销战报出炉 1秒破亿
一加 10 Pro重磅发布,最强性能旗舰10至名归
千万销量千家售后 一加多触点布局国内市场
科技加持,未来已来,“头号玩家”不再是科幻
一加 10 Pro发布在即,性能屏幕影像全方位提升
一加中国区新任总裁李杰 :做好品牌与用户之间的连接器
精彩新闻

超前放送