Text-to-Speech：将文字转换为自然而逼真的语音- Google Cloud

使用由 Google 的 AI 技术提供支持的 API，将文字转换为自然而逼真的语音。

优势

部署 Google 的 AI 技术，可突破性生成宛如真人发声的语音。该 API 基于 DeepMind 的语音合成专业技术打造而成，可提供接近真人音质的语音。

从40多种语言和变体的220多种语音中进行选择，包括普通话、印地语、西班牙语、阿拉伯语、俄语等。选择最适合您的用户和应用程序的声音。

创建一个独特的声音，在所有客户接触点上代表你的品牌，而不是使用与其他组织共享的共同声音。

主要特性

用您自己录制的音频来训练一个自定义语音模型，从而为组织制作独一无二并且听起来更加自然的语音。您可以定义和选择适合组织的语音配置文件，根据语音需求的变化来快速调整，而不必录制新的语句。

利用基于 DeepMind 的突破性研究成果打造的 90 多种 WaveNet 语音，生成极其接近真人音质的声音。

个性化您所选声音的音高，最多可从默认音高增加或减少 20 个半音。调整你的语速，使其比正常语速快 4 倍或慢 4 倍。

使用 SSML 标签定制您的语音，这些标签允许您添加停顿、数字、日期和时间格式，以及其他发音说明。

使用场景

呼叫中心内的语音聊天机器人

Dialogflow 的语音机器人可动态生成语音，而非播放预先录制的静态音频，可帮助您提供更好的客服语音体验。使用高质量的合成语音，让来电者有一种熟悉感和个性化。

在设备中生成语音

让您的设备发出类似真人的语音作为文字阅读器，为用户带来自然而逼真的交流体验。结合 Speech-to-Text 和 Natural Language 打造端到端语音界面，并通过轻松且吸引人的互动提升用户体验。

无障碍 EPG（电子节目单）

轻松让设备读出电子节目单的文字内容，以便为您的客户提供更好的用户体验，并满足您的服务和应用的无障碍功能要求。在EPGs中轻松实现文本到语音功能，为客户提供更好的用户体验，并满足服务和应用程序的可访问性要求。

关注【谷歌云服务】
微信公众号

微信咨询：

周一至周五早上 9 点到晚上 6 点

联系我们

Text-to-Speech：将文字转换为自然而逼真的语音