面向开发者和企业的 Gemini 时代
Gemini 的产品和模型生态系统可以帮助开发者和企业充分利用 Google AI,从使用 Gemini 模型进行构建到将 Gemini 用作 AI 助理,不一而足。
试用 Gemini 2.5 模型 —— 我们迄今推出的最智能 AI 模型。Gemini 2.5 系列模型现为思考型
AI,具备先推理再响应的能力,性能表现大幅提升。
Gemini 主要功能
使用 Gemini 模型构建内容:
Google AI Studio
进行实验、设计原型并部署。对于想要试用 Gemini 模型并开始使用 Gemini Developer API
构建应用的开发者、学生和研究人员而言,Google AI Studio 是快捷途径。
Vertex AI
构建 AI 智能体并将生成式 AI 集成到您的应用中。Google Cloud 提供 Vertex
AI,这是一个全托管式统一开发平台,可供大规模使用 Gemini 模型和其他第三方模型。
在业务中使用 Gemini:
为每位员工带来 Google AI 的最佳体验。Gemini Enterprise 使团队能够在一个安全平台上发现、创建、共享和运行 AI 智能体。
AI 赋能的助理直接内置于 Gmail 以及 Google 文档、幻灯片、表格等产品中,可助您提高工作效率和创造力。
Gemini 模型系列
我们的多功能模型高效运行于各种环境,从数据中心到端侧设备。
性能表现
Gemini 3 在广泛的基准测试中处于业界领先地位
我们迄今为止最智能的模型,为 AI 模型性能树立了新的标杆
| 基准测试 |
|
Gemini 3.1 Pro Thinking (High) |
Gemini 3 Pro Thinking (High)
|
Sonnet 4.6 Thinking (Max)
|
Opus 4.6 Thinking (Max)
|
GPT-5.2 Thinking (xhigh)
|
GPT-5.3-Codex Thinking (xhigh)
|
Humanity's Last Exam
学术推理 (full set, text + MM)
|
No tools |
44.4% |
37.5% |
33.2% |
40.0% |
34.5% |
— |
| 支持联网搜索和代码运行 |
51.4% |
45.8% |
49.0% |
53.1% |
45.5% |
— |
ARC-AGI-2
视觉推理谜题
|
ARC Prize 认证 |
77.1% |
31.1% |
58.3% |
68.8% |
52.9% |
— |
GPQA Diamond
科学认知
|
No tools
|
94.3% |
91.9% |
89.9% |
91.3% |
92.4% |
— |
Terminal-Bench 2.0
智能体终端编程
|
Terminus-2 测试 |
68.5% |
56.9% |
59.1% |
65.4% |
54.0% |
64.7% |
| 其他最佳自测框架 |
— |
— |
— |
— |
62.2% (Codex) |
77.3% (Codex)
|
SWE-Bench Verified
智能体编程
|
单次尝试 |
80.6% |
76.2% |
79.6% |
80.8% |
80.0% |
— |
SWE-Bench Pro (Public)
多样化智能体编程任务
|
单次尝试 |
54.2% |
43.3% |
— |
— |
55.6% |
56.8% |
LiveCodeBench Pro
来自 Codeforces、ICPC 和 IOI 的竞赛级编程题目
|
Elo 评分,越高越好 |
2887 |
2439 |
— |
— |
2393 |
— |
SciCode
科学研究编程
|
|
59% |
56% |
47% |
52% |
52% |
— |
APEX-Agents
长期专业任务
|
|
33.5% |
18.4% |
— |
29.8% |
23.0% |
— |
GDPval-AA Elo
专家任务
|
|
1317 |
1195 |
1633 |
1606 |
1462 |
— |
τ2-bench
智能体及工具使用
|
零售业
|
90.8%
|
85.3%
|
91.7%
|
91.9%
|
82.0%
|
— |
| 电信业 |
99.3%
|
98.0% |
97.9% |
99.3%
|
98.7% |
— |
MCP Atlas
基于 MCP 协议的多步工作流自动化
|
|
69.2%
|
54.1% |
61.3% |
59.5% |
60.6%
|
— |
BrowseComp
智能体搜索
|
搜索 + Python 代码执行 + 网页浏览 |
85.9%
|
59.2% |
74.7%
|
84.0% |
65.8% |
— |
MMMU-Pro
多模态理解与推理
|
No tools |
80.5%
|
81.0%
|
74.5%
|
73.9%
|
79.5% |
— |
MMMLU
多语言问答
|
|
92.6%
|
91.8%
|
89.3%
|
91.1%
|
89.6% |
— |
MRCR v2 (8-needle) 长上下文性能
|
128k (平均值)
|
84.9%
|
77.0%
|
84.9%
|
84.0%
|
83.8%
|
— |
| 1M (逐点)
|
26.3%
|
26.3%
|
Not supported
|
Not supported
|
Not supported
|
— |
客户和案例研究
Moloco:将 ML 驱动的零售媒体广告技术快速扩展至全球
Best Buy、Google Cloud 和Accenture 携手合作,利用生成式AI打造更好的客户服务体验
涂鸦:在云上构建开放的生态系统,提供全面的 loT 解决方案
创维:提供易于部署、运行顺畅的 OTT 解决方案,提升观看及运营体验
Moloco:将 ML 驱动的零售媒体广告技术快速扩展至全球
Best Buy、Google Cloud 和Accenture 携手合作,利用生成式AI打造更好的客户服务体验
涂鸦:在云上构建开放的生态系统,提供全面的 loT 解决方案
创维:提供易于部署、运行顺畅的 OTT 解决方案,提升观看及运营体验