最新动态
客户案例
白皮书
技术指南
查看更多 >

Gemini 主要功能

使用 Gemini 模型构建内容:
Google AI Studio
进行实验、设计原型并部署。对于想要试用 Gemini 模型并开始使用 Gemini Developer API 构建应用的开发者、学生和研究人员而言,Google AI Studio 是快捷途径。
Vertex AI
构建 AI 智能体并将生成式 AI 集成到您的应用中。Google Cloud 提供 Vertex AI,这是一个全托管式统一开发平台,可供大规模使用 Gemini 模型和其他第三方模型。
在业务中使用 Gemini:
为每位员工带来 Google AI 的最佳体验。Gemini Enterprise 使团队能够在一个安全平台上发现、创建、共享和运行 AI 智能体。
AI 赋能的助理直接内置于 Gmail 以及 Google 文档、幻灯片、表格等产品中,可助您提高工作效率和创造力。

Gemini 模型系列

我们的多功能模型高效运行于各种环境,从数据中心到端侧设备。

3.1 Pro

助力处理复杂任务,将创意构想变为现实

3 Flash

最适合用于快速获取前沿情报

3.1 Flash-Lite

胜任海量任务处理,兼顾卓越能效与智能表现

Gemini 视频

性能表现
Gemini 3 在广泛的基准测试中处于业界领先地位
我们迄今为止最智能的模型,为 AI 模型性能树立了新的标杆
基准测试 Gemini 3.1 Pro
Thinking (High)
Gemini 3 Pro
Thinking (High)
Sonnet 4.6
Thinking (Max)
Opus 4.6
Thinking (Max)
GPT-5.2
Thinking (xhigh)
GPT-5.3-Codex
Thinking (xhigh)
Humanity's Last Exam
学术推理 (full set, text + MM)
No tools 44.4% 37.5% 33.2% 40.0% 34.5%
支持联网搜索和代码运行 51.4% 45.8% 49.0% 53.1% 45.5%
ARC-AGI-2
视觉推理谜题
ARC Prize 认证 77.1% 31.1% 58.3% 68.8% 52.9%
GPQA Diamond
科学认知
No tools 94.3% 91.9% 89.9% 91.3% 92.4%
Terminal-Bench 2.0
智能体终端编程
Terminus-2 测试 68.5% 56.9% 59.1% 65.4% 54.0% 64.7%
其他最佳自测框架 62.2%
(Codex)
77.3%
(Codex)
SWE-Bench Verified
智能体编程
单次尝试 80.6% 76.2% 79.6% 80.8% 80.0%
SWE-Bench Pro (Public)
多样化智能体编程任务
单次尝试 54.2% 43.3% 55.6% 56.8%
LiveCodeBench Pro
来自 Codeforces、ICPC 和 IOI 的竞赛级编程题目
Elo 评分,越高越好 2887 2439 2393
SciCode
科学研究编程
59% 56% 47% 52% 52%
APEX-Agents
长期专业任务
33.5% 18.4% 29.8% 23.0%
GDPval-AA Elo
专家任务
1317 1195 1633 1606 1462
τ2-bench
智能体及工具使用
零售业 90.8% 85.3% 91.7% 91.9% 82.0%
电信业 99.3% 98.0% 97.9% 99.3% 98.7%
MCP Atlas
基于 MCP 协议的多步工作流自动化
69.2% 54.1% 61.3% 59.5% 60.6%
BrowseComp
智能体搜索
搜索 + Python 代码执行 + 网页浏览 85.9% 59.2% 74.7% 84.0% 65.8%
MMMU-Pro
多模态理解与推理
No tools 80.5% 81.0% 74.5% 73.9% 79.5%
MMMLU
多语言问答
92.6% 91.8% 89.3% 91.1% 89.6%
MRCR v2 (8-needle)
长上下文性能
128k (平均值) 84.9% 77.0% 84.9% 84.0% 83.8%
1M (逐点) 26.3% 26.3% Not supported Not supported Not supported

Gemini 功能点