继 2025 年传音携手 Google Cloud 开启“新一代 Agent 框架”战略合作以来,双方的联合创新已从愿景走向深水区。传音持续洞察新兴市场用户诉求,与 Google Cloud 强强联手,致力于定义智能体(Agent)行业标准,构筑传音手机 AI 核心竞争力。与此同时,双方正合作打造开放的 AI 应用与 Agent 开发者生态,旨在汇聚全球创新动能,开启移动智能新纪元。

如果说上一阶段的目标是让 AI“听懂”指令,那么现在的挑战则是让 AI 在复杂的云端环境中“协同”作战。

作为传音旗下的智能语音助手,Ella 正在经历一次关键的技术重构:通过引入 Google Cloud ADK (Agent Development Kit) A2A (Agent-to-Agent) 协议,Ella 成功推出基于静态图片的‘图生视频’Sub-Agent 模块,标志着其多模态创作能力的进一步跃升。该功能精准覆盖了社交互动、知识分发及商业营销等多元场景,能够根据不同平台的风格特征,实现视频内容的个性化、高效率适配生成,深度赋能个人创作者的内容生产力。

这不仅是一个功能的落地,更是一套跨云、异步、零信任安全的标准化 Agent 架构范本。

架构瓶颈:异构多云环境下的复杂任务编排

在新兴市场,用户渴望通过 Ella 将静态图片一键转化为短视频,这可以让他们在社交媒体上更生动的展示自己的生活。但这背后隐藏着极高的工程挑战:

1. 异构多云协同:Ella 的中控大脑(Orchestrator Agent)与负责高算力视频生成的子智能体(Sub-Agent)往往部署在不同的云环境中。

2. 长耗时任务编排:视频生成依赖复杂的 CV 模型,耗时较长。传统的同步调用会让助手“卡死”,无法响应用户其他指令。

3. 严格的数据主权:业务跨越欧盟、印度等多个司法管辖区,数据如何在跨云流转中严守合规红线?

破局之道:Google Cloud ADK + A2A 标准化架构

为了解决上述难题,传音利用 Google Cloud 的技术栈,构建了一套模块化的“中控-子智能体”架构。

A2A 协议:打破物理边界的“通用语”

传音采用了标准化的 A2A 协议来连接分布在不同云端的 Agent。

  • 智能分发:当 Ella 的中控 Agent 识别到“图生视频”意图时,会通过 A2A 接口调用部署在 Google Cloud 上的 Agent Runtime

  • 无缝对接:A2A 协议确保了任务指令与上下文(Context)的无损传递,实现了真正的异构互通。

ADK 赋能:极速构建 Sub-Agent

“图生视频”子智能体完全基于 Google Cloud ADK 构建。

  • 逻辑封装:开发者只需专注于 ADK Logic Code(处理 CV 任务的核心逻辑),ADK Server Wrapper 会自动将其封装为标准服务。

  • 模型调度:Sub-Agent 在 Google Cloud 上直接调用高性能 CV 模型与 Gemini 模型进行推理,生成结果直接存入 Google Cloud Storage (GCS)。

异步编排:让等待“无感”

针对视频生成的时延,架构引入了 Agent Notification Service。

  • 即时释放:Sub-Agent 接收任务后立即反馈“处理中”状态,不阻塞 Ella 的前台交互。

  • 结果找人:任务完成后,后台通过总线服务主动推送通知,实现“异步处理,同步感知”的流畅体验。

安全底座:基于 SPIRE 的零信任与数据回流

在跨云协作中,Google Cloud 助力传音构建了基于 SPIFFE/SPIRE 标准的统一身份与数据安全体系。

  • 身份统一 (Identity):无论 Agent 身处哪个云,启动时均通过 SPIRE Server 获得短期的 SVID 凭证,实现跨云平台的身份互认。

  • 通信加密 (mTLS):所有跨组件通信强制使用 mTLS 双向加密,彻底摒弃对网络边界的依赖,实现零信任安全。

  • 数据主权 (Sovereignty):针对欧盟、印度等区域,架构设计了独立的 Regional Hub。敏感数据在本地闭环处理,仅将脱敏后的控制指令回传至 Global Control Plane,从物理链路上确保合规。

通过 Ella“图生视频”功能,用户无需再学习复杂的视频生成和剪辑工具,也无需为昂贵的视频编辑软件付费,大大降低了新兴市场用户视频创作的门槛。

从“通用愿景”到“架构落地”,传音与 Google Cloud 的合作正在为行业树立新的标杆。

通过 ADK 与 A2A 协议,传音不仅解决了一个“图生视频”的单点问题,更沉淀出了一套可复制、可扩展的 Agent 开发范式。未来,这套架构将支撑更多多模态AI创新在新兴市场“生而全球”。作为智能体生态演进的关键实践,Ella‘图生视频’功能标志着传音与 Google Cloud在 Agent领域的深度合作突破。双方正基于 A2A 及多智能体(Multi-Agent),紧扣 Ella 核心应用场景,共同构筑海外新兴市场 Agent 生态。这一布局将驱动更多创新 AI 产品的涌现,实现用户体验的跨越式升级。

相关推荐

精选内容

关注【谷歌云服务】
微信公众号
微信咨询:
周一至周五 早上 9 点到晚上 6 点
联系我们