
作者:Boxu Li
Gemini 3 Pro 从一开始就被设计为多模态 AI,这意味着它可以在一个模型中无缝处理和结合文本、图像、音频、视频,甚至代码blog.google。谷歌宣称 Gemini 3 Pro 是“世界上最好的多模态理解模型”,在所有主要 AI 基准测试中超越了其前身macrumors.com。与早期的 AI 系统将不同媒体的单独模块拼接在一起不同,Gemini 的架构本质上是多模态的——它在预训练时就同时使用多种数据类型,使其能比拼凑模型更流畅地推理复杂输入blog.google。实际上,这意味着它可以例如,解读手写的家庭食谱并将其转化为格式化的数字食谱,甚至分析你的体育比赛视频,提供改进建议blog.google。凭借其先进的视觉和空间理解能力以及庞大的 100 万 token 上下文窗口,Gemini 3 Pro 可以一次性摄取并理解大量多模态输入,提供比仅文本模型更丰富、更具上下文意识的输出blog.google。
虽然 Gemini 3 Pro 的多模态功能令人印象深刻,但其最深刻的优势在于逻辑、数学、编码和一般问题解决方面的纯粹推理能力。谷歌最新的旗舰模型被设计为“思维模型”,使用增强的思维链技术来处理复杂任务[1][2]。结果是在推理能力上取得了巨大的飞跃,这在严格的基准测试中显而易见。事实上,谷歌报告称,Gemini 3 Pro 提供的响应具有新的深度和细微差别——逐步分析问题,并在最少的人类指导下处理棘手的提示[3]。作为一位观察 AI 进步 20 年的观察者,我发现这种推理能力的进化飞跃就像从一名天才学生进化为一名真正的专家助手。这不仅仅是回答琐事或解析文本的问题——而是以早期模型无法实现的方式解决新的、多方面的问题。

在关键推理测试中,Gemini 3 Pro 与 OpenAI 的 GPT-5.1 和 Anthropic 最新的 Claude 模型的性能对比(分数越高越好)。Google 和 OpenAI 的最新模型在学术基准测试中达到了接近专家的分数,而 Gemini 3 Pro 在复杂推理和数学方面略胜一筹[4][5]。编码任务仍然具有挑战性,即使是最好的模型,准确率也仅在 ~75–80% 左右[6]。基准数据来源:Google DeepMind、OpenAI、Anthropic。
在广泛的知识和逻辑测试中,如MMLU(大规模多任务语言理解),Gemini已经取得了历史性的成绩。早期的Gemini Ultra模型是第一个超越人类专家水平的模型,在MMLU上得分为57个科目中的90.0%(相比之下,GPT-4得分约为86.4%)[4]。实际上,这意味着在从历史到生物学的领域中,以前所未有的准确性回答大学水平的问题。OpenAI最新的GPT-5.1模型(如今天的ChatGPT Pro中所见)也接近了这一里程碑——通过高级提示,GPT模型在MMLU上已接近高80%的水平[7]。总的来说,Gemini 3 Pro和GPT-5.1现在在MMLU上的表现几乎难分伯仲,基本上与人类考生的平均水平相匹配或略有超越。Anthropic最新的Claude,尽管较早期版本有所改进,但在这一领域仍略显逊色(Claude 2在MMLU上得分约为76%,最新的Claude 4据称已升至80+%的范围)。简而言之,在一般知识推理方面,这三大AI巨头都处于非常高的水平——但在这个“书本聪明”的基准上,谷歌的Gemini在准确性上有着微弱但显著的领先优势[4]。
Gemini 3 Pro 旨在通过最先进的编码能力和与流行工具的深度集成来提升开发者的工作流程。此模型在编码基准测试中表现优于其前代产品,能够胜任复杂的编程任务和类似代理的工作流程,超越了 Gemini 2.5 Pro 的处理能力[1][2]。例如,Gemini 3 Pro 在 Terminal-Bench 2.0 上得分 54.2%,该测试衡量模型使用计算机终端的能力——这一得分显著高于以往的模型,甚至在这一指标上超过了其他顶级 AI[3][4]。这意味着它不仅是一个强大的编码助手,可以自动补全代码行,还能遵循复杂指令、操控开发环境,并自主管理多步骤编码任务。
与开发工具的集成是 Gemini 3 设计的基石。 Google 已通过 Google AI Studio 和 Vertex AI 提供了 Gemini API,方便团队轻松将其集成到自己的应用程序或管道中[2][5]。它还直接融入了许多开发者日常使用的 IDE 和云服务中。例如,Gemini Code Assist 扩展将 Gemini 的 AI 助手无偿引入 VS Code、JetBrains IDE 和 Android Studio[6][7]。在这些 IDE 中,您可以获得智能代码补全、从注释生成整个函数或模块,甚至与 AI 聊天以了解您的打开文件。令人印象深刻的是,Gemini Code Assist 能引用相关文档或依赖的源码片段,帮助开发者信任并验证建议[8][9]。模型庞大的上下文窗口(可达 100 万个标记)意味着它能同时摄取和理解大型代码库或多个文件,在提供帮助时保持对项目上下文的感知[10][11]。这是一种能力的飞跃——如同拥有一位阅读过您整个仓库和所有文档的 AI 配对程序员。
除了 IDE 插件外,Gemini 3 Pro 还扩展到其他开发者平台。例如,在 Google Colab Enterprise 中,它支持“帮助我编写代码”功能:用户可以要求 Gemini 完成代码单元格、解释代码的功能,甚至在笔记本中生成用于数据分析的新代码[12][13]。同样,该模型集成到 Google 的云服务中;Vertex AI 的开发人员可以通过 API 调用 Gemini 3 来自动化云工作流中的代码生成或重构等任务[14]。这种广泛的影响力类似于 GitHub Copilot 工具,但更进一步——而 Copilot(由 OpenAI 模型支持)主要关注编辑器中的代码建议,Gemini 3 在 Google 的生态系统中可用(从 Android Studio 到 Cloud),不仅建议代码,还执行命令和协调任务。例如,Gemini CLI 将模型引入终端:您可以与 CLI 对话以生成代码、运行 shell 命令,甚至从提示中生成整个应用程序框架[15][16]。Google 报告称,Gemini 3 的代理编码使其能够接受高层次目标、创建详细计划并生成多文件项目——不仅仅是单个文件——全部在一次性操作中完成[16][17]。这种能力,被称为*“氛围编码”,意味着自然语言是您需要的唯一语法*来构建软件[18]。例如,通过一个描述性提示,一位开发人员看到 Gemini 生成了一个完整的 Three.js 3D 网络应用程序,处理从设置图形库到编写 HTML/JS,甚至包括交互控件[19][20]。这些壮举表明 Gemini 不只是完成代码行——它将抽象的想法转化为工作原型。
另一个关键整合是Google AI Studio 的 Build 模式,它本质上是一个使用 Gemini 快速开发应用的游乐场。在这里,你可以勾画一个想法(即使是餐巾纸上的草图或语音笔记),然后让 Gemini 3 Pro 生成一个完整的工作应用程序[21]。该模型对设计和代码的高级理解使其能够根据需要创建UI 元素、后端逻辑,甚至 AI 功能。在一个演示中,用户提供了一个复古风格游戏的粗略概念,Gemini 在一个提示中构建了游戏[21]。这展示了Gemini 3 如何降低从概念到代码的障碍,自动化样板代码和繁重工作,让开发者专注于高层次创意。所有这些整合——IDE 插件、Colab、云、CLI 和 Studio——都展示了 Gemini 3 Pro 的深度开发者整合。它旨在通过融入现有工作流程和工具来*“在你所在之处与您相会”*[22][14]。无论你是在 IDE 中编码、在 Jupyter 笔记本中工作,还是管理云基础设施,Gemini 的功能都触手可及。这种普遍性,加上企业友好的产品(如带有安全和合规的 Vertex AI 集成),标志着 Google 努力使 Gemini 3 成为开发者的通用编码副驾。简而言之,Gemini 3 Pro 提供了先进的编码功能——从智能自动补全到一次性应用生成——并将其无缝集成到开发者堆栈中,预示着一个新的 AI 辅助软件开发水平[23][24]。
Gemini 3 Pro 的一项突出进步是其代理能力——简单来说,该模型可以作为一个自主代理来计划和执行任务,而不仅仅是回答提示。这意味着 Gemini 可以在指示下使用工具、导航系统并独立执行多步操作,这一能力是 Google 自早期 Gemini 版本以来就不断改进的[25][26]。在基准测试和实践中,Gemini 3 在这些长时间、多步骤任务中表现出色。它在 Terminal-Bench 2.0 中取得了54.2%的成绩,是所有模型中最高的,表明其在使用计算机终端解决问题(例如发出命令、管理文件等)方面具有一流的技能[3][4]。这表明 Gemini 不仅在理论上具备代理能力——它在实际中已证明能比竞争对手更好地处理现实世界的工具使用。另一个指标,Vending-Bench 2,测试长时间决策能力(模拟代理通过扩展交互获得“净资产”);在这里,Gemini 3 以很大优势显著超越了其他模型[27]。在实际应用中,这些得分意味着 AI 可以在最少监督下执行复杂的动作序列——这是朝着可靠的 AI“助手”能够承担更大工作量的重大进展。
谷歌正在积极利用这些能力,通过新的平台如 Google Antigravity,专门打造来展示和利用 Gemini 的代理能力[28]。Antigravity 被描述为一个*“代理开发平台”,在这里开发者可以像架构师一样在高层次上操作,而多个由 Gemini 驱动的代理负责处理 IDE、终端和浏览器中的细节[29]。在这种设置中,你可以将类似“构建新功能并部署”*的任务委托给 AI,Gemini 代理将协作规划工作,在编辑器中编写代码,在终端中运行测试/命令,甚至根据需要从网络获取信息——同时保持你了解他们的进度[30]。这标志着“AI 配对程序员”概念的重大进化,变得更加自主化。代理通过工件(如代码差异、日志或摘要)传达他们的计划和结果,因此你始终参与其中并可以给予反馈[31]。本质上,Gemini 3 的代理框架不仅允许它生成代码,还可以循环执行和验证该代码并相应调整其计划——就像一个可以运行和测试自己的工作然后自行修复错误的初级开发人员一样。
这些自主规划能力引发了与最近出现的其他自主AI框架的比较。例如,AutoGPT是一个早期实验,旨在通过串联GPT-4的推理来实现用户定义的目标,且需要的人工输入最少。它遵循一个计划 → 执行 → 评估 → 改进的循环,迭代使用网页浏览或代码执行等工具来实现其目标[32][33]。AutoGPT的用户观察到它的潜力和局限性:它确实可以自主分解复杂问题并使用工具,但它经常陷入困境,无法在一次会话中学习,并且效率低下(常常重复运行昂贵的GPT-4调用而没有过去运行的记忆)[34]。Gemini 3 Pro在长远任务的处理方法上显得更为稳健,得益于其巨大的上下文窗口和结构化工具集成。它可以在非常长的会话中保留“思考”(甚至达到100万标记的上下文),意味着它可以记住以前步骤中发生的事情并在此基础上进行构建[35][36]。这缓解了像早期AutoGPT这样的系统中观察到的一个弱点,即有限的上下文会迫使代理遗忘或重复工作。此外,Gemini的API支持结构化输出和函数调用,因此开发者可以定义模型使用的工具(如网页搜索或代码编译器),并让模型输出包含计划或结果的JSON[37][38]。这种设计使得其自主性更可控和可靠:与AutoGPT那种有些“开放循环”的特性不同,Gemini的代理模式可以通过工具定义甚至“思考签名”来引导,确保其推理方式可追踪[5]。
另一个值得注意的比较是 Devin —— 由一家初创公司 (Cognition) 引入的 AI 软件代理,被称为“第一个 AI 软件工程师”。Devin 专为代码中的长期推理而构建:它可以计划并执行数千个决策来完成一个编码项目,在每一步都记住上下文并从错误中学习[39]。像 Gemini 一样,Devin 配备了诸如 shell、代码编辑器和浏览器等工具,并在沙盒环境中运行,以便它可以实际运行代码、浏览文档并自主修改文件[40]。早期结果令人印象深刻:在一个基准测试 (SWE-bench) 中,Devin 能够自主解决约 13.9% 的真实 GitHub 问题,而之前的模型需要更多指导,仅解决了约 ~2% 的问题[41]。这表明加入长期计划和工具使用可以极大地提升 AI 在软件工程中的能力。 Gemini 3 Pro 与 Devin 在同一创新领域运作 —— 实际上,谷歌的基准测试结果包括一个指标 (SWE-Bench Verified),其中 Gemini 3 也表现出色,表明它可以通过最少的提示解决复杂的错误修复或功能请求[42]。不同之处在于,Gemini 的代理能力集成在谷歌更广泛的生态系统 (Antigravity, Code Assist 等) 中,可能使其在更大规模上获得更多曝光和实际测试。还值得注意的是,Gemini 3 的 代理计划不限于编码:其改进的空间推理和多模态理解意味着它可以驱动机器人或 UI 自动化等领域的代理。比如,谷歌强调了 Gemini 如何解读用户的 GUI 操作或屏幕布局,这可以让代理智能地控制计算机用户界面(想象一个像人类一样使用图形界面的 AI)。这暗示着 Gemini 是一个通用的代理大脑,而许多早期的代理 (AutoGPT, Devin) 专注于文本或代码环境。
Gemini 3 Pro 是谷歌最新和最先进的 AI 模型,代表了能力上的重大飞跃。它将早期 Gemini 模型的所有优点(多模态理解、先进的推理和工具使用)结合成一个强大的系统[1]。实际上,Gemini 3 Pro 能够处理文本、图像、代码等复杂任务,以最先进的推理将“任何想法变为现实”[1][2]。下面,我们将介绍普通用户如何通过谷歌生态系统访问 Gemini 3 Pro,并提供开发人员的详细入门指南。让我们深入了解吧!
谷歌已将 Gemini 3 Pro 整合到其生态系统中,通过Gemini 应用程序(前身为 Bard)、Android 设备和Google Workspace 应用广泛提供给用户。以下是在每个领域的入门指南:
Google Bard 已发展为「Gemini 应用」,这是与 Gemini 3 Pro 交流的主要界面。Gemini 应用提供网络服务和移动应用:
示例:Android 上的 Gemini 应用界面,显示了对话提示和高级功能选项。在这里,用户选择了「思考」模式(右上角)来利用 Gemini 3 Pro,并启用了 Agenttool 进行自动化任务。Gemini 应用按名字问候用户,并准备好帮助处理查询或多步骤任务。[4][3]
提示: 你也可以在提示中使用语音输入或图片——Gemini 3 是多模态的。例如,你可以让 Gemini 分析照片或回答有关截图的问题。只需通过聊天输入中的图片图标附上图片并提问。Gemini 3 Pro 的高级多模态理解能力允许它同时理解文本和图像。
在现代 Android 手机上,Google 已将 Gemini AI 集成到操作系统中,作为下一代助手:
在 Android 上使用 Gemini 示例: 试着问你的手机 “我下周的日程安排是什么?” Gemini 可以读取你的 Google 日历并给出摘要(在你授权后)。或者说 “帮我找一个晚餐食谱并制定购物清单” ——Gemini 可以搜索食谱,提取食材,并为你创建清单,展示其使用工具和规划任务的能力。
Google Workspace(Gmail、Docs、Sheets、Slides、Meet 等)现已内置 Gemini AI 功能以提高生产力。以下是访问和使用这些功能的方法:
注意: 许多这些 Workspace AI 功能最初是为 Google Workspace 商业用户提供的(作为 Duet AI 的一部分,现在已合并到 Gemini )。截至 2025 年,Google 已开始在标准 Workspace 版本中包含这些功能[9][10]。如果您是商业用户,请确保您的管理员已启用 AI 功能。如果您是免费用户,您可能可以通过 Google 的实验室或测试计划访问某些功能(如帮助我写作)。在这些应用中寻找提示或图标以指示 AI 协助——这就是您通往 Gemini 的门户。
Gemini 3 Pro 不仅适用于终端用户应用程序——开发人员也可以在自己的项目中利用其强大功能。Google 提供多种方式让开发人员访问 Gemini 3 Pro,包括 Gemini API、集成到 Google Cloud (Vertex AI) 中,以及像 Google AI Studio 这样的工具用于快速原型制作。请按照以下步骤开始:
from google import genai # Google Generative AI SDK
client = genai.Client(api_key="YOUR_API_KEY")
response = client.models.generate_content(
model="gemini-3-pro-preview",
contents="Hello Gemini, how can I get started with your API?"
)
print(response.text)
这段代码创建了一个客户端,并使用示例提示调用 Gemini 3 Pro 模型(model="gemini-3-pro-preview")。[15] 然后打印模型的回复文本。在 Node.js 中,存在类似的库 (@google/genai),你可以使用 API 密钥来调用 generateContent[16][17]。如果你更喜欢 cURL 或 REST,可以使用你的 API 密钥和 JSON 格式的提示向 Google 的生成语言 API 端点发送 POST 请求[18]——文档为所有这些方法提供了示例。
利用 Vertex AI(Google Cloud) [可选]: 如果您是企业开发者或需要更多集成,Gemini 3 Pro 也可以通过 Google Cloud 上的 Vertex AI 获取[19][20]。在 Cloud Console 中,您可以在 Vertex AI 的 Model Garden 下找到 Gemini 模型。您可以将模型部署到端点或使用 Vertex AI API 直接调用。如果您需要企业级数据安全性、扩展性或将 Gemini 与其他云服务集成使用,这条路径可能更适合。但对于大多数个人开发者而言,上述直接使用 Gemini API 的方式简单快捷。
实验功能: Gemini 3 Pro 提供了您想尝试的高级功能:
长上下文: 该模型支持极大的上下文窗口(最多约 100 万个标记的输入上下文)[21]。这意味着您可以将非常大的文档甚至多个文件输入到一个提示中。尝试提供长度较长的文本或多条数据,并请求模型进行集体分析。
多模态输入: 您可以将图像(甚至音频或视频帧)与文本一起发送到 API。例如,您可以发送 base64 编码的图像,并请求分析或生成标题。API 有提示中的媒体部分等参数,您可以在其中包含图像数据,甚至可以调整 media_resolution 以决定使用多少细节[22][23]。这对于构建如图像标注、文档 OCR 识别或视频摘要等应用非常有用。
工具和功能: Gemini 3 具有“代理”能力——启用后可以使用工具。通过 API,您可以允许函数(例如,计算器或数据库查询)或启用 Google 搜索结果集成[14][24]。探索文档的 功能调用 和 工具使用 部分,看看如何让模型执行代码、获取 URL 或在对话中使用其他 API。这就是 Gemini 强大的“代理”行为的实现方式。虽然这是一个更高级的话题,但请记住,随着您对基础知识的熟悉,它是可用的。
参数调整: Gemini 3 引入了新的设置,如 thinking_level,以控制模型使用的推理时间。默认情况下,它设置为高(深度推理),但您可以将其设置为低以获得更快、更短的答案[25][26]。您还可以使用通常的参数(温度等)来调整输出风格。入门的一部分是调整这些参数以查看响应的变化。
在 Google Colab 中测试: 使用 Google Colab 是一个方便的方式来尝试 Gemini API。您可以创建一个 Colab 笔记本,安装 google-genai 库,并使用您的 API 密钥在交互式笔记本环境中与 Gemini 3 Pro 互动。这对于快速原型设计或探索模型的能力非常有用(如果需要进行任何繁重的计算,您还可以免费获取 GPU/TPU)。
构建和部署: 一旦您掌握了基础知识,就可以将 Gemini 集成到您的应用程序中。也许您会使用 Gemini 3 构建一个网站上的聊天机器人,或者创建一个内部工具,用 AI 辅助处理文档或电子表格。Google 的生态系统提供了进一步的支持,例如与 Gemini 3 一起推出的 Antigravity(一个代理开发平台)[27] 和用于在终端中测试的 Gemini CLI 工具。作为一名新开发者,您可能暂时不需要这些,但它们值得在 Google 的开发者博客上探索[28]。
开发者提示: 注意你的使用量和配额。Gemini 3 Pro 是一个强大的模型,如果你超出免费限制,使用成本将与处理的令牌数量成比例——记住它的大上下文可能会无意中发送大量数据。Google Cloud 的仪表板或 AI Studio 将显示你的令牌使用情况。此外,请注意最佳实践:在提示中始终清晰地包含用户说明,并考虑在允许模型采取行动时添加一些限制或验证(例如,Gemini Agent 在执行关键步骤如发送电子邮件前会要求确认[29][30])。
最后,加入 Google AI 开发者社区(如果有的话,可以是论坛或 Discord)——由于 Gemini 3 处于前沿,Google 和其他开发者不断分享新技巧和更新。Google 的官方文档和示例库(GitHub 上的 AI Studio Cookbook)提供了丰富的学习样本。
Gemini 3 Pro 为日常用户和开发者提供了广泛的可能性。作为普通用户,你可以通过 Google 自己的应用立即开始使用它——从在 Gemini 应用中聊天,到在 Android 上获得 AI 帮助撰写电子邮件或规划日程。关键是在 Google 生态系统中寻找 Gemini 或“Help me…”功能,并尝试使用它们。另一方面,如果你是开发者,Google 已经使得通过 Gemini API 和 Vertex AI 将这一强大的 AI 集成到你的项目中变得简单。获取 API 密钥,使用提供的工具或库,你就能轻松使用全球最先进的 AI 模型之一。
借助 Gemini 3 Pro 的高级推理和多模态技能,你可以比以往更轻松地进行头脑风暴、创作、编程和解决复杂问题[31][32]。无论你是让它起草文档,还是构建由 AI 驱动的下一代应用,开始仅需几个点击和提示。享受探索 Gemini 3 Pro 的乐趣,并将你的创意变为现实!
资料来源:
https://blog.google/products/gemini/gemini-3-collection/
[2] [15] [16] [17] [18] [21] [22] [23] [25] [26] [31] Gemini 3 开发者指南 | Gemini API | Google AI for Developers
https://ai.google.dev/gemini-api/docs/gemini-3
https://en.wikipedia.org/wiki/Google_Gemini
[4] [29] [30] Gemini 应用推出 Gemini 3 Pro 和「Gemini Agent」
https://9to5google.com/2025/11/18/gemini-3-pro-app/
[6] [7] [8] [9] [10] Gemini AI 功能现在包含在 Google Workspace 订阅中 - Google Workspace 管理员帮助
https://support.google.com/a/answer/15756885?hl=en
[11] [12] [13] [14] [24] Google AI Studio 快速入门 | Gemini API | Google AI for Developers
https://ai.google.dev/gemini-api/docs/ai-studio-quickstart
[19] [20] [32] Gemini 3 已适用于企业 | Google Cloud 博客
https://cloud.google.com/blog/products/ai-machine-learning/gemini-3-is-available-for-enterprise
开发者的 Gemini 3:全新推理与代理能力
[1] [2] [3] [5] [14] [18] [21] [22] [23] [24] [28] [29] [30] [31] [38] [43]
https://blog.google/technology/developers/gemini-3-developers/
[4] 尝试使用 Gemini 3 Pro 进行音频转录和新的 pelican ...
https://simonwillison.net/2025/Nov/18/gemini-3/
[6] [7] [8] [9] [12] Gemini Code Assist 概览 | Google for Developers
https://developers.google.com/gemini-code-assist/docs/overview
[10] [11] [27] [35] [36] [37] Gemini 3 Pro - Google DeepMind
https://deepmind.google/models/gemini/pro/
[13] 使用代码补全和代码生成 | Colab 企业版 | Google Cloud 文档
https://docs.cloud.google.com/colab/docs/use-code-completion
[15] [16] [17] [19] [20] 在 Gemini CLI 中尝试 Gemini 3 Pro 的 5 件事 - Google 开发者博客
https://developers.googleblog.com/en/5-things-to-try-with-gemini-3-pro-in-gemini-cli/
[25] [26] Gemini 3:谷歌最新的 Gemini AI 模型介绍
https://blog.google/products/gemini/gemini-3/
[32] [33] [34] 深入探讨AutoGPT:改变游戏规则的自主AI | 作者:Peter Chang | Medium
[39] [40] [41] Cognition | 介绍Devin,首位AI软件工程师
https://cognition.ai/blog/introducing-devin
来源: Google DeepMind公告[1][12]; OpenAI GPT-5报告[14]; TechCrunch和WIRED报道[9][22]; 来自学术和行业评估的基准测试结果[4][21]。
[1] [2] [12] [17] Gemini 2.5:我们最新的具有思维能力的 Gemini 模型
https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/
[3] [9] Google 推出 Gemini 3,带有新的编码应用程序和创纪录的基准得分 | TechCrunch
[4] 推出 Gemini:Google 最强大的 AI 模型
https://blog.google/technology/ai/google-gemini-ai/
[5] [6] [7] [8] [21] Google Gemini 与 GPT-4 比较 - Addepto
https://addepto.com/blog/google-gemini-vs-gpt-4-comparison/
[10] [11] [18] [19] [23] [25] Gemini 3:介绍来自 Google 的最新 Gemini AI 模型
https://blog.google/products/gemini/gemini-3/
https://www.vellum.ai/llm-leaderboard
[14] 介绍 GPT-5 | OpenAI
https://openai.com/index/introducing-gpt-5/
[20] 引入 Claude 4 - Anthropic
https://www.anthropic.com/news/claude-4
[22] [24] Gemini 3 登场——谷歌称它将使搜索更智能 | WIRED
https://www.wired.com/story/google-launches-gemini-3-ai-bubble-search/