
阿里正式开源 Qwen3.5 系列三款中等规模模型:Qwen3.5-35B-A3B、Qwen3.5-122B-A10B 和 Qwen3.5-27B。
- 其中,Qwen3.5-35B-A3B 的性能已经超越前代规模更大的 Qwen3-235B-A22B-2507 和 Qwen3-VL-235B-A22B。
- Qwen3.5-122B-A10B 与 27B 版本,则进一步缩小了中等规模模型与前沿大模型的差距,在复杂 Agent 场景中表现尤为突出。
这标志着,模型的性能提升不再单纯依赖参数堆叠,而是更多依靠架构优化、高质量训练数据以及强化学习等技术路径。
推荐阅读:Qwen3.5 迈向原生多模态智能体
架构进化,性能突破
Qwen3.5 采用了混合注意力机制,结合高稀疏度的 MoE 架构创新,同时基于更大规模的文本与视觉混合 Token 完成训练。
得益于此,Qwen3.5-122B-A10B 与 Qwen3.5-35B-A3B 在总参数量和激活参数量更小的前提下,实现了更强的综合性能。
在多个权威评测榜单上,新模型全面超越了规模远超自身的 Qwen3-235B-A22B、Qwen3-VL,甚至领先于 GPT-5 mini 和 gpt-oss-120b 等竞品。这些榜单包括:指令遵循(IFBench)、博士级推理(GPQA)、数学推理(HMMT 25)、多语言知识(MMMLU)、Agent 工具调用(BFCL v4)以及 Agentic 编程(SWE-bench Verified)等。

开发者友好,适合本地部署
本次发布的 Qwen3.5-27B,是该系列首款密集型(Dense)模型。它不仅具备更强的 Agent 能力,还原生支持多模态任务。
- 在工具调用、搜索、编程等 Agent 相关评测中,Qwen3.5-27B 的表现均要优于 GPT-5 mini。
- 在视觉推理、文本识别与理解、视频推理等多项视觉理解任务上,它的表现也超越了 Qwen3-VL 旗舰模型和 Claude Sonnet 4.5。
最重要的是,Qwen3.5-27B 可以在单张 GPU 上高效运行,对本地部署极为友好。
Qwen3.5-Flash API 服务
即 Qwen3.5-35B-A3B 的生产版本。
- 现已上线阿里云百炼平台,每百万 Token 价格 0.2 元,兼具高性能与高性价比,适合开发者和企业的规模化、生产级调用。
- 默认支持 1M 超长上下文长度,能轻松应对长文档处理与复杂任务。
- 提供官方内置工具链支持,显著降低集成成本,加速应用落地。
目前,这三款模型都已经在魔搭社区和 Hugging Face 开源上线,同时开源了 Qwen3.5-35B-A3B-Base 基座模型。现在,你就可以到 Qwen Chat 免费体验新模型,或通过阿里云百炼直接调用 Qwen3.5-Flash 的 API 服务。











最新评论
nb啊成功了,运行的时候会有很多错误代码,可以逐个根据提示关闭某些软件或者打开防火墙就行了。
良心
高质量答案
今日精彩瞬间等小程序添加选项为灰色,不能添加,这个是什么原因?