Qwen3.5-Flash：阿里千问开源 3 款中等规模模型

阿里正式开源 Qwen3.5 系列三款中等规模模型：Qwen3.5-35B-A3B、Qwen3.5-122B-A10B 和 Qwen3.5-27B。

其中，Qwen3.5-35B-A3B 的性能已经超越前代规模更大的 Qwen3-235B-A22B-2507 和 Qwen3-VL-235B-A22B。
Qwen3.5-122B-A10B 与 27B 版本，则进一步缩小了中等规模模型与前沿大模型的差距，在复杂 Agent 场景中表现尤为突出。

这标志着，模型的性能提升不再单纯依赖参数堆叠，而是更多依靠架构优化、高质量训练数据以及强化学习等技术路径。

架构进化，性能突破

Qwen3.5 采用了混合注意力机制，结合高稀疏度的 MoE 架构创新，同时基于更大规模的文本与视觉混合 Token 完成训练。

得益于此，Qwen3.5-122B-A10B 与 Qwen3.5-35B-A3B 在总参数量和激活参数量更小的前提下，实现了更强的综合性能。

在多个权威评测榜单上，新模型全面超越了规模远超自身的 Qwen3-235B-A22B、Qwen3-VL，甚至领先于 GPT-5 mini 和 gpt-oss-120b 等竞品。这些榜单包括：指令遵循（IFBench）、博士级推理（GPQA）、数学推理（HMMT 25）、多语言知识（MMMLU）、Agent 工具调用（BFCL v4）以及 Agentic 编程（SWE-bench Verified）等。

Qwen3.5-35B-A3B、Qwen3.5-122B-A10B 和 Qwen3.5-27B 基准测试

开发者友好，适合本地部署

本次发布的 Qwen3.5-27B，是该系列首款密集型（Dense）模型。它不仅具备更强的 Agent 能力，还原生支持多模态任务。

在工具调用、搜索、编程等 Agent 相关评测中，Qwen3.5-27B 的表现均要优于 GPT-5 mini。
在视觉推理、文本识别与理解、视频推理等多项视觉理解任务上，它的表现也超越了 Qwen3-VL 旗舰模型和 Claude Sonnet 4.5。

最重要的是，Qwen3.5-27B 可以在单张 GPU 上高效运行，对本地部署极为友好。

Qwen3.5-Flash API 服务

即 Qwen3.5-35B-A3B 的生产版本。

现已上线阿里云百炼平台，每百万 Token 价格 0.2 元，兼具高性能与高性价比，适合开发者和企业的规模化、生产级调用。
默认支持 1M 超长上下文长度，能轻松应对长文档处理与复杂任务。
提供官方内置工具链支持，显著降低集成成本，加速应用落地。

目前，这三款模型都已经在魔搭社区和 Hugging Face 开源上线，同时开源了 Qwen3.5-35B-A3B-Base 基座模型。现在，你就可以到 Qwen Chat 免费体验新模型，或通过阿里云百炼直接调用 Qwen3.5-Flash 的 API 服务。

Qwen3.5-Flash：阿里千问开源 3 款中等规模模型

架构进化，性能突破

开发者友好，适合本地部署

Qwen3.5-Flash API 服务

相关推荐

评论抢沙发

快讯

Qwen3-Max-Thinking 在 Qwen Chat 上线

谷歌将停用 goo.gl 短链接服务

WSUS 驱动程序同步将弃用

微软开始强制更新 Windows 11 24H2

倒数日

最近更新

随机推荐

最新评论

架构进化，性能突破

开发者友好，适合本地部署

Qwen3.5-Flash API 服务

相关推荐

评论 抢沙发

快讯

Qwen3-Max-Thinking 在 Qwen Chat 上线

谷歌将停用 goo.gl 短链接服务

WSUS 驱动程序同步将弃用

微软开始强制更新 Windows 11 24H2

倒数日

最近更新

随机推荐

最新评论

评论抢沙发