使用由 Google 的 AI 技术提供支持的 API,将文字转换为自然而逼真的语音。

  • 通过智能、逼真的响应改善客户互动

  • 让用户在设备和应用程序中使用语音用户界面

  • 根据用户对语音和语言的偏好对您的交流进行个性化设置

优势

  • 高保真度语音

部署 Google 的 AI 技术,可突破性生成宛如真人发声的语音。该 API 基于 DeepMind 的语音合成专业技术打造而成,可提供接近真人音质的语音。

  • 最广泛的语音选择

从40多种语言和变体的220多种语音中进行选择,包括普通话、印地语、西班牙语、阿拉伯语、俄语等。选择最适合您的用户和应用程序的声音。

  • 独一无二的语音

创建一个独特的声音,在所有客户接触点上代表你的品牌,而不是使用与其他组织共享的共同声音。

主要特性

  • 定制声音(Beta 版)

用您自己录制的音频来训练一个自定义语音模型,从而为组织制作独一无二并且听起来更加自然的语音。您可以定义和选择适合组织的语音配置文件,根据语音需求的变化来快速调整,而不必录制新的语句。

  • WaveNet 语音

利用基于 DeepMind 的突破性研究成果打造的 90 多种 WaveNet 语音,生成极其接近真人音质的声音。

  • 语音调整

个性化您所选声音的音高,最多可从默认音高增加或减少 20 个半音。调整你的语速,使其比正常语速快 4 倍或慢 4 倍。

  • 文本和 SSML 支持

使用 SSML 标签定制您的语音,这些标签允许您添加停顿、数字、日期和时间格式,以及其他发音说明。

使用场景

呼叫中心内的语音聊天机器人

Dialogflow 的语音机器人可动态生成语音,而非播放预先录制的静态音频,可帮助您提供更好的客服语音体验。使用高质量的合成语音,让来电者有一种熟悉感和个性化。

在设备中生成语音

让您的设备发出类似真人的语音作为文字阅读器,为用户带来自然而逼真的交流体验。结合 Speech-to-Text 和 Natural Language 打造端到端语音界面,并通过轻松且吸引人的互动提升用户体验。

无障碍 EPG(电子节目单)

轻松让设备读出电子节目单的文字内容,以便为您的客户提供更好的用户体验,并满足您的服务和应用的无障碍功能要求。在EPGs中轻松实现文本到语音功能,为客户提供更好的用户体验,并满足服务和应用程序的可访问性要求。

相关推荐