今天,我们很高兴地宣布,由生成式 AI 提供支持的 Document AI 自定义提取器已正式发布 (GA),面向所有客户开放,并可以通过 API 和 Google Cloud Console 在生产环境中使用。自定义提取器采用 Google 的基础模型构建,有助于快速、准确地解析结构化和非结构化文档中的数据。
过去,开发人员需要为每种文档类型使用数千个样本来训练单独的模型,并需要花费大量时间才能达到生产所需的精度。相比之下,生成式 AI 可以从大量文档中提取数据,训练数据要少得多,并且所需时间也很短。
尽管这项新技术带来了很多好处,但跨文档处理的过程中实施基础模型依然很繁琐。开发人员需要管理各个方面,例如将文档转换为文本、管理文档块、优化提取提示、开发数据集、管理模型生命周期等等。
由生成式 AI 提供支持的自定义提取器有助于解决这些挑战,让开发人员可以更快、更有效地创建提取处理器。新产品允许基础模型开箱即用、微调或通过简单的过程用于自动标记数据集。此外,生成式 AI 预测现已包含在 Document AI SLA 中。
因此,客户和合作伙伴能够以更快、更有效的方式为其文档处理工作流程实施生成式 AI 。无论是从自由格式文本(例如合同)还是复杂布局(例如发票或税务表)的文档中提取字段,客户和合作伙伴现在都可以在企业级水平上使用生成式 AI 的强大功能。开发人员只需将文档发布到端点即可获得结构化数据,而无需经过训练。
用户对 Workbench 的评价
在公开预览期间,开发人员缩短了生产时间,获得了更高的准确性,并解锁了新的用例,例如从合同中提取数据。让我们直接听听一些来自于客户的声音:
“我们与 Google Cloud 的合作将继续为 Iron Mountain的智能文档处理 (IDP) 和 Iron Mountain InSight® 支持的工作流程自动化功能提供创新解决方案。Document AI 的自定义提取器使我们能够利用生成式 AI 的力量,以更快、更有效的方式对非结构化文档进行分类和提取数据。通过使用这款新产品以及自动标记等功能,我们能够在数小时而不是数天或数周内实施文档处理程序。随后,我们能够构建可重复的解决方案,为跨多个行业和地区的客户大规模交付。”
- Adam Williams,Iron Mountain 副总裁兼平台负责人
“我们与 Google 的合作标志着智能文档处理 (IDP) 领域的变革性飞跃。通过将 Google Cloud 的 Document AI 自定义提取器与 Automation Anywhere 的文档自动化和 Co-Pilot 产品相集成,我们正在利用生成式 AI 为客户提供提供颠覆性的解决方案。通过集成自定义提取器,我们不仅提高了文档字段提取率,还将部署时间缩短了两倍以上,并将长期的系统维护成本削减了一半。我们很高兴与 Google 合作,共同打造下一代智能文档处理解决方案,并彻底改变组织密集型业务流程的自动化流程。”
- Michael Guidry,Automation Anywhere 智能文档处理战略主管
Document AI Workbench 还提供了哪些新功能
此外,最新的 Workbench 更新使自动化文档处理变得更加容易:
微调 - 自定义提取器支持微调(现已提供预览),因此您可以针对特定文档自定义基础模型结果,将准确性提升到一个新的水平。只需确认数据集中的提取结果,然后单击按钮或调用 API 即可进行微调。该功能目前在美国地区可用。有关详细信息,请参阅按文档类型微调和训练。
扩大区域可用性:使用生成式 AI 的自定义提取器进行的预测现已在欧洲和美洲蒙特利尔(northamerica-northeast1)区域提供。有关更多信息,请参阅自定义提取器区域可用性。
版本生命周期管理:随着 Google 对基础模型的持续改进,旧的基础模型将被弃用。同样,在新的稳定版本发布 6 个多月后旧的处理器版本将被弃用。我们正在开发自动升级功能以简化生命周期管理。有关详细信息,请参阅管理处理器版本。
采取下一步行动
要快速了解具有生成式 AI 的自定义提取器的功能,请查看 Document AI 产品页面上最新的演示。只需加载示例文档(演示限制为 15 页)。几秒钟后,您就会看到生成式 AI 提取的强大功能,如下所示。
如果您是开发人员,请前往 Google Cloud Console 上的 Workbench 创建新的提取器并管理复杂的字段或为您的文档自定义基础模型的预测。
或者,如需了解更多信息,请查看具有生成式 AI 的自定义提取器的文档、查看 Document AI 发行说明,或了解有关 Document AI 和 Workbench 的更多信息。
文章信息
相关推荐
