使用由 Google 的 AI 技术提供支持的 API,将文字转换为自然而逼真的语音。
通过智能、逼真的响应改善客户互动
让用户在设备和应用程序中使用语音用户界面
根据用户对语音和语言的偏好对您的交流进行个性化设置
优势
高保真度语音
部署 Google 的 AI 技术,可突破性生成宛如真人发声的语音。该 API 基于 DeepMind 的语音合成专业技术打造而成,可提供接近真人音质的语音。
最广泛的语音选择
从40多种语言和变体的220多种语音中进行选择,包括普通话、印地语、西班牙语、阿拉伯语、俄语等。选择最适合您的用户和应用程序的声音。
独一无二的语音
创建一个独特的声音,在所有客户接触点上代表你的品牌,而不是使用与其他组织共享的共同声音。
主要特性
定制声音(Beta 版)
用您自己录制的音频来训练一个自定义语音模型,从而为组织制作独一无二并且听起来更加自然的语音。您可以定义和选择适合组织的语音配置文件,根据语音需求的变化来快速调整,而不必录制新的语句。
WaveNet 语音
利用基于 DeepMind 的突破性研究成果打造的 90 多种 WaveNet 语音,生成极其接近真人音质的声音。
语音调整
个性化您所选声音的音高,最多可从默认音高增加或减少 20 个半音。调整你的语速,使其比正常语速快 4 倍或慢 4 倍。
文本和 SSML 支持
使用 SSML 标签定制您的语音,这些标签允许您添加停顿、数字、日期和时间格式,以及其他发音说明。
使用场景
呼叫中心内的语音聊天机器人
Dialogflow 的语音机器人可动态生成语音,而非播放预先录制的静态音频,可帮助您提供更好的客服语音体验。使用高质量的合成语音,让来电者有一种熟悉感和个性化。
在设备中生成语音
让您的设备发出类似真人的语音作为文字阅读器,为用户带来自然而逼真的交流体验。结合 Speech-to-Text 和 Natural Language 打造端到端语音界面,并通过轻松且吸引人的互动提升用户体验。
无障碍 EPG(电子节目单)
轻松让设备读出电子节目单的文字内容,以便为您的客户提供更好的用户体验,并满足您的服务和应用的无障碍功能要求。在EPGs中轻松实现文本到语音功能,为客户提供更好的用户体验,并满足服务和应用程序的可访问性要求。
文章信息
相关推荐
