系统极客一直在努力
专注操作系统及软件使用技能

Qwen3.5-Flash:阿里千问开源 3 款中等规模模型

Qwen3.5

阿里正式开源 Qwen3.5 系列三款中等规模模型:Qwen3.5-35B-A3B、Qwen3.5-122B-A10B 和 Qwen3.5-27B。

  • 其中,Qwen3.5-35B-A3B 的性能已经超越前代规模更大的 Qwen3-235B-A22B-2507 和 Qwen3-VL-235B-A22B。
  • Qwen3.5-122B-A10B 与 27B 版本,则进一步缩小了中等规模模型与前沿大模型的差距,在复杂 Agent 场景中表现尤为突出。

这标志着,模型的性能提升不再单纯依赖参数堆叠,而是更多依靠架构优化、高质量训练数据以及强化学习等技术路径。

架构进化,性能突破

Qwen3.5 采用了混合注意力机制,结合高稀疏度的 MoE 架构创新,同时基于更大规模的文本与视觉混合 Token 完成训练。

得益于此,Qwen3.5-122B-A10B 与 Qwen3.5-35B-A3B 在总参数量和激活参数量更小的前提下,实现了更强的综合性能。

在多个权威评测榜单上,新模型全面超越了规模远超自身的 Qwen3-235B-A22B、Qwen3-VL,甚至领先于 GPT-5 mini 和 gpt-oss-120b 等竞品。这些榜单包括:指令遵循(IFBench)、博士级推理(GPQA)、数学推理(HMMT 25)、多语言知识(MMMLU)、Agent 工具调用(BFCL v4)以及 Agentic 编程(SWE-bench Verified)等。

Qwen3.5-35B-A3B、Qwen3.5-122B-A10B 和 Qwen3.5-27B 基准测试
Qwen3.5-35B-A3B、Qwen3.5-122B-A10B 和 Qwen3.5-27B 基准测试

开发者友好,适合本地部署

本次发布的 Qwen3.5-27B,是该系列首款密集型(Dense)模型。它不仅具备更强的 Agent 能力,还原生支持多模态任务。

  • 在工具调用、搜索、编程等 Agent 相关评测中,Qwen3.5-27B 的表现均要优于 GPT-5 mini。
  • 在视觉推理、文本识别与理解、视频推理等多项视觉理解任务上,它的表现也超越了 Qwen3-VL 旗舰模型和 Claude Sonnet 4.5

最重要的是,Qwen3.5-27B 可以在单张 GPU 上高效运行,对本地部署极为友好。

Qwen3.5-Flash API 服务

即 Qwen3.5-35B-A3B 的生产版本。

  • 现已上线阿里云百炼平台,每百万 Token 价格 0.2 元,兼具高性能与高性价比,适合开发者和企业的规模化、生产级调用。
  • 默认支持 1M 超长上下文长度,能轻松应对长文档处理与复杂任务。
  • 提供官方内置工具链支持,显著降低集成成本,加速应用落地。

目前,这三款模型都已经在魔搭社区Hugging Face 开源上线,同时开源了 Qwen3.5-35B-A3B-Base 基座模型。现在,你就可以到 Qwen Chat 免费体验新模型,或通过阿里云百炼直接调用 Qwen3.5-Flash 的 API 服务。

赞(0)
分享到

评论 抢沙发