
Gemini 3 正式亮相,让我们离通用人工智能(AGI)的终极愿景又更近了一步。Google 表示,新一代模型建立在业界顶尖的推理能力之上,是目前多模态理解能力最强的模型之一。它也是迄今为止最具 AI 智能体特质、最契合 Vibe Coding 工作流的产品,带来了更强的可视化能力和更深入的交互体验。
- 从即日起,Gemini 3 Pro 预览版将全面接入 Google 的产品矩阵,无论你是在学习、构建项目,还是规划日常事务,都能获得更智能、流畅的体验。
- 增强版推理模式 Gemini 3 Deep Think 也同步亮相,能够把 Gemini 3 的性能推向极限。目前,该模式已向安全测试人员开放,后续会面向 Google AI Ultra 订阅用户开放。
Gemini 3 Pro:推理能力的全新「天花板」
凭借最先进的推理能力和多模态天赋,Gemini 3 Pro 能真正助力创意落地。在主流 AI 基准测试中,它也全面超越了上一代的 2.5 Pro:
- 它以突破性的 1501 Elo 分数,强势登顶了 LMArena Leaderboard 榜首。
- 在 Humanity’s Last Exam(人类终极考试,不使用任何工具的情况下,准确率达到 37.5%)和 GPQA Diamond(准确率 91.9%)等测试中,展现出了博士级的推理水准。
- 在数学领域,它同样树立了新标杆,在 MathArena Apex 上刷出了 23.4% 的最新纪录。
不止于文本,Gemini 3 Pro 还进一步抬高了多模态推理的上限:
- 它在 MMMU-Pro 中的得分为 81%,在 Video-MMMU 上达到 87.6%;在评估事实准确性的 SimpleQA Verified 测试中,则拿下 72.1% 的行业最好成绩。
- 这意味着,在面对科学、数学等广泛主题的复杂问题时,Gemini 3 Pro 不仅能力全面,而且高度可靠。

Gemini 3 Pro 的每次交互也更有深度、更具细腻感。它的回答不再流于套话,而是以聪明、简洁、直接的方式,提供真正有价值的洞见——而不仅仅是迎合「你想听」的内容。
它更像是一位真正的思想伙伴:既能帮你更好地理解信息,也能助你找到更清晰的表达方式。无论是将晦涩的科学概念转化为高保真可视化代码,还是进行创造性的头脑风暴,它都能从从容容、游刃有余 🤭。
Gemini 3 Deep Think:思考的深度决定智能的高度
Gemini 3 Deep Think 模式则进一步拓宽了智能的边界。它在 Gemini 3 原本就极为强大的推理与多模态理解能力的基础上,再次实现了阶梯式的跃升,专为攻克最棘手的复杂难题而生。
测试结果也证明,它的表现已经超越了本就惊艳的 Gemini 3 Pro:
- 在 Humanity’s Last Exam 中取得了 41.0% 的成绩(无工具辅助),在 GPQA Diamond 中得分达到 93.8%。
- 更值得关注的是,它在 ARC-AGI-2(包含代码执行,ARC Prize Verified)测试中,拿下了破纪录的 45.1% 高分,充分展现出面对全新、未知挑战时依然强大的解题能力。

Gemini 3:你的全能学习与编程伙伴
无界学习
Gemini 从诞生之初,就能跨文本、图像、视频、音频和代码等多种模态,无缝整合任意主题的信息。
- Gemini 3 更是将多模态推理推向了新高点。依托顶尖的推理能力、视觉与空间理解力、领先的多语言表现,以及 100 万 Token 的上下文窗口,它能以最适合你的方式辅助学习。
- 为了帮你更轻松地理解网络信息,搜索中的 AI 模式(AI Mode in Search)现已全面启用 Gemini 3。它带来了全新的生成式 AI 体验,包括沉浸式视觉布局、交互式工具和实时模拟演示——所有内容都根据你的搜索即时生成。
全能编程
Gemini 3 在零样本学习(zero-shot)生成方面表现突出,能够处理复杂提示词(prompt)和多层级指令,并渲染更丰富、交互性更强的 Web UI。
它是 Google 迄今为止最全面的 Vibe Coding 与 AI 智能体编程模型,不仅能赋予产品更强的自主能力,还显著提升了开发者的生产效率:
- 它以 1487 Elo 的高分登顶 WebDev Arena 榜单;在考验模型终端指令执行能力的 Terminal-Bench 2.0 中,取得了 54.2% 的成绩。
- 在衡量编程类 AI 智能体能力的 SWE-bench Verified 测试中,更以 76.2% 的得分,全面领先 2.5 Pro。
现在,你就可以在 Google AI Studio、Vertex AI、Gemini CLI,以及全新的 AI 智能体开发平台 Google Antigravity 中使用 Gemini 3 进行构建。同时,它也将正式登陆 Cursor、GitHub、JetBrains、Manus 和 Replit 等第三方平台。














最新评论
不奇怪,设计师用 Mac 很正常,微软内部也有大把员工在用 Mac。
之前邮件里收到 Microsoft 50 周年的壁纸,下载下来里面有个 __MACOSX 文件夹我也是没绷住🤓
笑死我了
电脑设置完成,但电视端找不到服务器,怎么办?