Gemini 2.0：开启智能体时代的全新 AI 模型

Google 重磅推出了 Gemini 2.0 系列的首个成员——Gemini 2.0 Flash 实验版。该模型以低延迟和高性能为核心特点，预计将在技术前沿领域得到广泛应用。

作为 Google 迄今为止最强大的 AI 模型，Gemini 2.0 不仅具备原生的多模态能力，能够处理文本、图像、音频等多种数据类型，还新增了多模态输出、图像生成和音频输出等功能。更值得一提的是，它还可以直接调用 Google 搜索和地图等工具，大幅提升了 AI 的实用性。

Gemini 2.0 Flash：性能翻倍，功能更强

Gemini 2.0 Flash 是基于 1.5 Flash 版本的全新升级。新版本不仅延续了快速响应的特点，还在关键基准测试中展现出了比 1.5 Pro 更强的性能，运行速度更是提升了一倍。

在功能方面，2.0 Flash 也实现了重大突破：

支持文本、图像、视频和音频等多模态输入。
新增多模态输出能力，可以将文本与 AI 生成的图像结合。
提供灵活的多语言 TTS (文本转语音) 功能。
能够直接调用 Google 搜索、代码执行以及第三方自定义功能。

Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking 是一种实验性模型。经过训练后，该模型在回答问题时能够生成其完整的「思考过程」。因此，相比基础版 Gemini 2.0 Flash 模型，思考模式在问题解答时具有更强的推理能力。

限制

思考模式作为实验性模型，存在以下限制：

输入限制为 32k Tokens。
仅支持文本和图片输入。
输出限制为 8k Tokens。
输出仅限于文本格式。
不支持搜索功能或代码执行等内置工具

试用 Gemini 2.0

开发者现在可以通过以下渠道体验 Gemini 2.0 Flash 和 Gemini 2.0 Flash Thinking：

目前，所有开发者都可以使用多模态输入和文本输出功能，而文本转语音和图像生成功能则向早期合作伙伴开放。更多型号的模型预计将于 2025 年 1 月推出。

此外，Google 还推出了新的多模态实时 API，支持实时音频、视频流输入处理，并且可以灵活组合多种工具。要了解更多关于 Gemini 2.0 Flash 和多模态实时 API 的细节，请访问开发者博客。

Gemini 2.0 正式登陆 Gemini 助手应用

从现在开始，全球的 Gemini 和 Gemini Advanced 用户都可以在桌面版和网页版中，通过模型选择菜单，来体验经过聊天优化的 Gemini 2.0 Flash 实验版。这项功能很快也将登陆 Gemini 移动应用，让用户能随时随地体验更智能的 AI 助手服务。

在 Gemini 网页版中使用 Gemini 2.0 Flash Experimental

Google 还计划在 2025 年初将 Gemini 2.0 的强大功能引入到更多产品中，敬请期待。

Gemini 2.0：开启智能体时代的全新 AI 模型

Gemini 2.0 Flash：性能翻倍，功能更强

Gemini 2.0 Flash Thinking

限制

试用 Gemini 2.0

Gemini 2.0 正式登陆 Gemini 助手应用

相关推荐

评论抢沙发

快讯

WSUS 驱动程序同步将弃用

微软开始强制更新 Windows 11 24H2

Parallels 新增支持 Apple Silicon 上的 x86 模拟

微软推出 GitHub Copilot Free 计划

热门专题

最近更新

随机推荐

最新评论

Gemini 2.0 Flash：性能翻倍，功能更强

Gemini 2.0 Flash Thinking

限制

试用 Gemini 2.0

Gemini 2.0 正式登陆 Gemini 助手应用

相关推荐

评论 抢沙发

快讯

WSUS 驱动程序同步将弃用

微软开始强制更新 Windows 11 24H2

Parallels 新增支持 Apple Silicon 上的 x86 模拟

微软推出 GitHub Copilot Free 计划

热门专题

最近更新

随机推荐

最新评论

评论抢沙发