Gemini 主要功能

使用 Gemini 模型构建内容:
Google AI Studio
进行实验、设计原型并部署。对于想要试用 Gemini 模型并开始使用 Gemini Developer API 构建应用的开发者、学生和研究人员而言,Google AI Studio 是快捷途径。
Vertex AI
构建 AI 智能体并将生成式 AI 集成到您的应用中。Google Cloud 提供 Vertex AI,这是一个全托管式统一开发平台,可供大规模使用 Gemini 模型和其他第三方模型。
在业务中使用 Gemini:
为每位员工带来 Google AI 的最佳体验。Gemini Enterprise 使团队能够在一个安全平台上发现、创建、共享和运行 AI 智能体。
AI 赋能的助理直接内置于 Gmail 以及 Google 文档、幻灯片、表格等产品中,可助您提高工作效率和创造力。

Gemini 模型系列

我们的多功能模型高效运行于各种环境,从数据中心到端侧设备。

3 Pro

最适合处理复杂任务和帮助用户实现任何创意

3 Flash

最适合用于快速获取前沿情报

2.5 Flash-Lite

高容量、高性价比任务的最佳选择

Gemini 视频

性能表现
Gemini 3 在广泛的基准测试中处于业界领先地位
我们迄今为止最智能的模型,为 AI 模型性能树立了新的标杆
基准测试 Gemini 3 Flash Thinking
Gemini 3 Pro Thinking
Gemini 2.5 Flash Thinking
Gemini 2.5 Pro Thinking
Claude Sonnet 4.5Thinking
GPT-5.2Extra high
Grok 4.1 FastReasoning
输入价格 $/1M tokens $0.50 $2.00
$4.00 > 200k tokens
$0.30 $1.25
$2.50 > 200k tokens
$3.00
$6.00 / MTok > 200k tokens
$1.75 $0.20
输出价格 $/1M tokens $3.00 $12.00
$18.00 > 200k tokens
$2.50 $10.00
$15.00 > 200k tokens
$15.00
$22.50 > 200k tokens
$14.00 $0.50
学术推理
Humanity's Last Exam
No tools 33.7% 37.5% 11.0% 21.6% 13.7% 34.5% 17.6%
支持联网搜索和代码运行 43.5% 45.8% 45.5%
视觉推理谜题
ARC-AGI-2
ARC Prize 认证 33.6% 31.1% 2.5% 4.9% 13.6% 52.9%
科学认知
GPQA Diamond
No tools 90.4% 91.9% 82.8% 86.4% 83.4% 92.4% 84.3%
数学
AIME 2025
No tools 95.2% 95.0% 72.0% 88.0% 87.0% 100% 91.9%
支持代码运行 99.7% 100% 75.7% 100%
多模态理解与推理
MMMU-Pro
81.2% 81.0% 66.7% 68.0% 68.00% 79.50% 63.00%
界面理解
ScreenSpot-Pro
除非另有说明,否则不使用工具 69.1% 72.7% 3.9% 11.4% 36.2% 86.3%
with python
复杂图表信息综合
CharXiv Reasoning
No tools 80.3% 81.4% 63.7% 69.6% 68.5% 82.1%
OCR
OmniDocBench 1.5
Overall Edit Distance, lower is better 0.121 0.115 0.154 0.145 0.145 0.143
视频知识获取
Video-MMMU
86.9% 87.6% 79.2% 83.6% 77.8% 85.9%
来自 Codeforces、ICPC 和 IOI 的竞赛级编程题目
LiveCodeBench Pro
Elo 评分,越高越好 2316 2439 1143 1775 1418 2393
智能体终端编程
Terminal-Bench 2.0
Terminus-2 测试框架 47.6% 54.2% 16.9% 32.60% 42.8%
智能体编程
SWE-Bench Verified
单次尝试 78.0% 76.2% 60.4% 59.6% 77.2% 80.0% 50.6%
智能体工具使用
τ2-bench
90.2% 90.7% 79.5% 77.8% 87.2%
长周期真实软件工程服务
Toolathlon
49.4% 36.4% 3.7% 10.5% 38.9% 46.3%
基于 MCP 协议的多步工作流自动化
MCP Atlas
57.4% 54.1% 3.4% 8.8% 43.8% 60.6%
长周期智能体任务
Vending-Bench 2
净值(平均值),越高越好 $3,635 $5,478 $549 $574 $3,839 $3,952 $1,107
涵盖基准事实、参数化知识、搜索以及多模态的事实性基准测试
FACTS Benchmark Suite
61.9% 70.5% 50.4% 63.4% 48.9% 61.4% 42.1%
参数化知识
SimpleQA Verified
68.7% 72.1% 28.1% 54.5% 29.3% 38.0% 19.5%
多语言问答
MMMLU
91.8% 91.8% 86.6% 89.5% 89.1% 89.6% 86.8%
跨越 100 种语言和文化的常识推理
Global PIQA
92.8% 93.4% 90.2% 91.5% 90.1% 91.2% 85.6%
长上下文性能
MRCR v2 (8-needle)
128k (平均值) 67.2% 77.0% 54.3% 58.0% 47.1% 81.9% 54.6%
1M (逐点) 22.1% 26.3% 21.0% 16.4% not supported not supported 6.1%

Gemini 功能点

Gemini 文章推荐

最新动态

查看更多

白皮书

查看更多

技术指南

查看更多

客户案例

查看更多