为了向世界各地的用户提供专为智能电视打造的声控系统,VIDAA 使用 Dialogflow 快速开发出支持多国语言、意图识别准确率达 90% 的声控功能。
使用成效
协助在六个月内开发出支持 13 种语言的智能电视声控系统
通过 Dialogflow 简化 ML 模型的训练流程,推出创新的进阶声控功能
借助 Dialogflow 的 Multilingual Agent,快速拓展语音助手支持的语种
语音意图识别准确率超过93%
随着智能电视在全世界的普及度增加,越来越多人使用语音助手来控制电视。除了音量调整、切换频道等基本控制功能之外,消费者也期待智能电视上的语音助手能提供更多专为电视设计的进阶功能,像是亮度调整、内容搜索等等。
VIDAA 致力于满足这些市场需求。该公司于 2019 年成立, 主要业务目标是打造一个顶尖的智能电视平台,提供最佳用户体验。2020年初,VIDAA 发布了自主研发的 VIDAA 智能电视操作系统,目前用户分布在超过 100 个国家和地区。
起初,VIDAA 将其智能电视操作系统与第三方语音助手整合,以提供声控服务。然而,这些第三方语音助手仅为一般用途设计,促使 VIDAA 团队想要扩大其电视操作系统的功能和支持语种数量。为了向全世界用户提供一个专为智能电视打造的声控系统,VIDAA 决定自主研发电视语音助手。2021 年初,VIDAA 选择使用 Dialogflow 来开发声控系统,因为 Dialogflow 支持的语种丰富,且 Google Cloud 一直在不断提升其语音识别技术。
“我们智能电视操作系统的用户分布在许多不同国家,因此我们需要一个能支持最多常用语种——特别是东南亚地区语种——的语音助手开发工具。Dialogflow 是唯一符合我们需求的产品,此外,Google Cloud 一向致力于不断提升其语音识别技术,让我们相信在 Google Cloud 的技术支持下,我们可以持续用最新技术改善我们的声控系统。”
– VIDAA 产品副总裁 Rajin Persuad在六个月内推出支持 13 种语言的电视语音助手
VIDAA 的开发团队使用 Dialogflow 的 ML 模型来开发自有的声控系统。在 Dialogflow 上,开发团队只需要搜集并输入不同语言的 10 多个语料,就可以开发出一个声控功能,而不需要费心管理 ML 模型。Rajin Persuad 指出,和自行构建 ML 模型相比,使用 Dialogflow 来开发语音助手大幅降低了所需的时间和资源。
Dialogflow 清晰的文档和易于使用的界面设计,也协助提升了VIDAA 的开发效率。该公司的工程师总是能轻易地在文档中找到详细的说明,除了避免犯不必要的错误之外,也在短时间内就熟悉 Dialogflow 的 ML 模型训练系统。最终,VIDAA 的 开发团队得以在六个月内就成功开发出支持 13 种语言的电视语音助手。
“Dialogflow 非常易于使用,且简化了 ML 模型的训练流程,这对我们带来了极大的帮助,因为我们想要在最短时间内推出我们的电视语音助手,有了我们声控系统一开始支持的 13 种语言,我们就已经能够在许多不存在类似产品的国家为用户提供电视声控服务。”
– VIDAA 产品副总裁 Rajin Persuad意图识别准确率超过 93%、具备进阶功能的声控系统
自从推出了电视语音助手之后,VIDAA 已经在基本的电视控制功能之上,又添加了许多进阶功能,像是用演员或电影推出年份进行内容搜索。在开发较为复杂的声控功能时,VIDAA 的开发团队需要用更多的语料实体来训练 ML 模型,以确保语音助手能正确理解用户的意图。在开发过程中,VIDAA 的开发团队想输入的语料实体数量一度超过 Dialogflow 系统的上限。在取得 Google Cloud 的技术建议之后,VIDAA 的工程师便得以绕过系统限制,完成进阶功能的开发工作,并达到极高的意图识别准确度。
此外,Dialogflow 不需要语音指令的内容完全符合语音助手接受训练的语料,就可以理解用户的意图,也协助提升了VIDAA 电视语音助手的意图识别能力。目前,VIDAA 声控系统理解用户意图的准确率超过 93%。
“为了提供最佳的用户体验,确保我们的电视语音助手有极高的意图识别准确率非常重要。通过 Dialogflow,我们不只打造了极佳的意图识别能力,也能在开发进阶功能的同时,继续努力提升意图识别准确度,”Rajin Persuad 表示。
持续扩大支持语种和声控功能
VIDAA 仍持续使用 Dialogflow 来扩大其电视语音助手支持的语种和功能。有了 Dialogflow 的 Multilingual Agent 功能,VIDAA 的开发团队可以直接在已经训练好的 ML 模型中添加新的语言,而不需要重新训练模型。如此一来,VIDAA 便可以在短时间內将其声控系统支持的语言种类从 13 种拓展到超过 20 种。未来,VIDAA 也计划提升其电视语音助手的搜索功能,让用户得以用更多种类的关键词来搜索内容。
“在 Dialogflow 的协助下,我们得以在短时间内就开发出一个成熟的声控系统。随着 Google Cloud 的语音识别技术不断提升,Dialogflow 支持的语种数量持续增加,我们相信我们拥有足够的技术支持,在未来继续扩大我们的用户基础,提供更好的声控服务。”
– VIDAA 产品副总裁 Rajin Persuad文章信息
相关推荐
