今天,数据存在的形式多种多样,以实时流的形式提供,并跨越世界各地的许多不同的数据中心和云。从分析到数据工程,再到 AI/ML,再到数据驱动的应用程序,我们利用和共享数据的方式不断拓展。数据已经不再只被分析师岁所使用,现在也影响着每一位员工、每一位客户和每一位合作伙伴。随着数据、工作负载和用户的数量和类型的急剧增长,我们正处于一个转折点,传统的数据架构即使部署在云中也无法充分发挥其潜力。因此,数据与价值之间的差距正在扩大。

为了应对这些挑战,我们今天推出了几项数据云创新,让我们的客户能够处理所有工作负载的无限数据,并使数据触达到每个人。这些最新的宣布包括 BigLake 和 Spanner Change Stream 以进一步统一客户数据,同时确保其实时交付,以及 Vertex AI Workbench 和模型注册表以缩小数据与 AI 价值之间的差距。为了让任何人都能获得数据,我们宣布推出统一的商业智能 (BI) 体验,其中包括新的 Workspace 集成,以及进一步支持我们的数据云合作伙伴生态系统的新计划。

消除所有数据限制

今天,我们宣布推出数据湖存储引擎 BigLake 的预览版,通过统一数据湖和数据仓库来消除数据限制。跨不同的湖和仓库管理数据会产生孤岛并增加风险和成本,尤其是在需要移动数据时。BigLake 允许公司统一他们的数据仓库和湖来分析数据,而无需担心底层存储格式或系统,这消除了从源复制或移动数据的需要,并降低了成本并提高了效率。

借助 BigLake,客户可以获得精细颗粒度的访问控制,其 API 接口涵盖 Google Cloud 中的文件格式 和 Parquet 等开放文件格式,以及 Apache Spark 等开源处理引擎。 这些功能将 BigQuery 十年来的创新价值扩展到 Google Cloud Storage 上的数据湖,以实现灵活且经济高效的开放式 Lake House 架构。

Twitter 已经使用 BigQuery 的存储功能来消除数据限制,以更好地了解人们如何使用他们的平台,以及他们可能感兴趣的内容类型。因此,他们能够每天为数万亿个事件提供内容 每秒运行超过 300万聚合的广告管道。

我们今天宣布的另一项重大创新是 Spanner 变更流。这款新产品即将推出,将为我们的客户进一步消除数据限制,让他们能够实时跟踪 Spanner 数据库中的变化,从而释放新价值。Spanner 更改流跟踪 Spanner 插入、更新和删除,以在客户的整个 Spanner 数据库中实时流式传输更改。 这可确保客户始终能够访问最新数据,因为他们可以轻松地将更改从 Spanner 复制到 BigQuery 以进行实时分析,使用 Pub/Sub 触发下游应用程序行为,或将更改存储在 Google Cloud Storage (GCS) 中以实现合规性。 随着变更流的增加,目前在峰值时每秒处理超过 20 亿个请求且可用性高达 99.999% 的 Spanner 现在为客户提供了处理数据的无限可能。

消除数据工作负载的限制

我们的 AI 产品组合由 Vertex AI 提供支持,Vertex AI 是一个托管平台,包含构建、部署和扩展模型所需的所有 ML 工具,并且经过优化,可与 BigQuery 及其他领域的数据工作负载无缝协作。今天,我们宣布推出新的 Vertex AI 创新,将为客户提供更加简化的体验,从而更快地将 AI 模型投入生产,并使维护更加轻松。

Vertex AI Workbench 现已正式发布,它将数据和 ML 系统整合到一个界面中,以便团队拥有跨数据分析、数据科学和 ML 的通用工具集。通过 BigQuery、Serverless Spark 和 Dataproc 之间的原生集成,Vertex AI Workbench 使团队能够以比传统笔记本快 5 倍的速度构建、训练和部署 ML 模型。 事实上,一家全球零售商能够通过 Vertex AI Workbench 推动数百万美元的销售额增长,并将上市速度提高 15%。

借助 Vertex AI,客户可以定期更新他们的模型。但是管理所涉及的大量工件很快就会失控。为了更轻松地管理模型维护的开销,我们宣布了带有 Vertex AI 模型注册表的新 MLOps 功能。Vertex AI 模型注册表目前已经能够预览,它提供了一个中央存储库,用于发现、使用和管理 ML 模型,包括 BigQuery ML 中的模型。这使数据科学家可以轻松共享模型和应用程序开发人员使用它们,最终使团队能够将数据转化为实时决策,并在面对不断变化的市场动态时更加敏捷。

扩大数据的覆盖面

今天,我们将推出适用于 Looker 的 Connected Sheets,以及在 Data Studio 中访问 Looker 数据模型的功能。客户现在可以根据自己的选择与数据进行交互,无论是通过 Looker Explore、Google Sheets 还是使用拖放式 Data Studio 界面。 这将使每个人都可以更轻松地访问和挖掘数据洞察力,以推动创新,并使用这个新的统一谷歌云商业智能 (BI) 平台做出数据驱动的决策。这种统一的 BI 体验使您可以轻松利用受监管的、受信任的企业数据,整合新的数据集和计算,以及与同行协作。

Mercado Libre 是拉丁美洲最大的在线商务和支付生态系统,是 Looker 的 Connected Sheets 的早期采用者。使用这种集成,他们能够通过员工已经熟悉的电子表格界面提供对数据的更广泛访问。通过降低进入门槛,他们已经能够建立一种数据驱动的文化,在这种文化中,每个人都可以用数据为他们的决策提供信息。

在数据云合作伙伴生态系统上加倍努力

如果没有我们出色的合作伙伴生态系统,就不可能通过这些数据创新来弥合数据与价值之间的差距。如今,有 700 多家软件合作伙伴使用 Google 的数据云为其应用程序提供支持。Bloomreach、Equifax、Exabeam、Quantum Metric 和 ZoomInfo 等许多合作伙伴已经开始使用我们的数据云功能以及“使用 BigQuery Initiative ”计划,该计划提供了对专门工程团队的访问、联合营销和上市支持。

我们的客户需要与 BigQuery 等产品紧密集成和优化的合作伙伴解决方案。 因此,今天,我们宣布推出 Google Cloud Ready - BigQuery,这是一项新的验证,旨在认可来自 Fivetran、Informatica 和 Tableau 等满足一系列核心功能和互操作性要求的合作伙伴解决方案。今天,我们已经在这项新的 Google Cloud Ready - BigQuery 计划中认可了超过 25 家合作伙伴,该计划降低了客户评估新工具的相关成本,同时还增加了对新客户用例的支持。

我们还宣布了一项新的数据库迁移计划,以帮助我们的客户高效、有效地加速从本地和其他云迁移到 Google 行业领先的托管数据库服务。 这包括来自德勤等联盟的工具、资源和知识经验,以及来自谷歌的激励措施,以抵消迁移数据库的成本。

我们将继续致力于与客户投资的领先数据和分析公司进行持续创新。本周 Databricks、Fivetran、MongoDB、Neo4j 和 Redis 都在为 Google Cloud 上的客户宣布重要的新功能。

所有这些公告及更多内容将在我们的 Data Cloud Summit 上详细分享。请务必观看数据云战略会议、分组讨论,并获得动手内容。 毫无疑问,数据的未来拥有无限的可能性,我们很高兴能够踏上这一数据云之旅。

相关推荐