Qwen 模型演进笔记
Qwen 模型演进笔记
1. 先说明“最新模型”指的是谁
截至 2026-04-20,如果说“Qwen 最新模型”,其实要分两类看:
- 最新通用 API 旗舰模型:
Qwen3.6-Plus
发布时间:2026-04-02 - 最新开源主力模型:
Qwen3.6-35B-A3B
发布时间:2026-04-17
如果你更关心:
- 云端调用、Agent、编程能力:重点看
Qwen3.6-Plus - 本地部署、开源权重、性价比:重点看
Qwen3.6-35B-A3B
2. Qwen2.5 是什么
Qwen2.5 是 Qwen 在 2024-09-19 发布的一代重要开源模型系列。
这一代的定位可以理解成:
把“通用聊天模型”真正做到了更稳、更全、更适合工程落地。
Qwen2.5 这一代包含:
- 通用语言模型:
Qwen2.5 - 代码模型:
Qwen2.5-Coder - 数学模型:
Qwen2.5-Math
开源尺寸覆盖比较广:
0.5B1.5B3B7B14B32B72B
3. Qwen2.5 的主要改进点
根据官方介绍,Qwen2.5 相比 Qwen2 的核心提升主要在下面几块:
3.1 知识、代码、数学能力更强
官方提到 Qwen2.5 基于最多 18T tokens 的大规模数据训练,相比 Qwen2:
- 知识能力更强
- 代码能力提升明显
- 数学能力提升明显
这说明 Qwen2.5 不只是“能聊天”,而是开始更像一个泛用底座模型。
3.2 指令跟随更稳
Qwen2.5 一个很实用的提升是:
- 更能听懂要求
- 更能按要求输出
- 对不同 system prompt 更稳
这在工程里很重要,因为很多模型不是“不会做”,而是:
- 格式不稳
- 角色设定容易跑偏
- 提示词一换风格就漂
Qwen2.5 在这方面明显更适合做产品。
3.3 结构化输出更好
Qwen2.5 官方特别强调了这几点:
- 更理解结构化数据
- 更擅长表格理解
- 更擅长输出结构化结果
- 特别是
JSON输出更可靠
这个优点对工程很关键,因为很多业务不是只要一段自然语言,而是要:
- JSON
- 表单字段
- 工具调用参数
- SQL / API 请求体
3.4 长文本生成更实用
Qwen2.5 支持:
- 最长
128K上下文 - 最多
8K生成长度
对长文总结、长对话、多轮问答、文档问答更友好。
3.5 多语言能力更强
Qwen2.5 支持 29+ 种语言,继续保持中英双强,同时兼顾多语种能力。
3.6 专项模型更成熟
这一代不只是通用模型升级,专项模型也更成体系:
Qwen2.5-Coder:代码相关数据更多,适合编程助手Qwen2.5-Math:支持中英文数学问题,并引入CoT、PoT、TIR
这意味着:
Qwen2.5 开始不是“一个模型打天下”,而是形成了通用底座 + 专项模型的完整产品线。
4. Qwen2.5 的优点
如果从“开发者和部署者”的角度看,Qwen2.5 的优点主要有这些:
- 尺寸覆盖广,小到
0.5B,大到72B,方便按机器选型 - 作为
dense model,结构相对直观,部署门槛低 128K上下文对很多 RAG 和长文场景已经够用- 指令跟随和 JSON 输出更稳,适合业务接入
Qwen2.5-Coder、Qwen2.5-Math让专项任务更好选型- 已经很好适配
Transformers、vLLM、Ollama
一句话概括:
Qwen2.5 的强项是“稳、全、好落地”,非常适合作为通用开源基座。
5. 从 Qwen2.5 到最新模型,发生了什么变化
如果把后续几代串起来看,Qwen 的升级路线很清楚:
Qwen2.5
- 重点是把通用基础能力做强
- 强化结构化输出、长文本、代码、数学
Qwen3
- 重点是把“推理模式 + 快速模式”融合
- 开始明显强化 agent 和 reasoning 路线
Qwen3.5
- 重点转向“原生多模态 Agent”
- 不再只是文本模型,而是朝着文字、图像、音频、视频统一理解发展
Qwen3.6
- 重点是把 Agent 真正往实战推进
- 明显强化编程 Agent、工具调用、长链路任务执行、多模态推理
一句话看演进:
Qwen2.5 更像一个强通用模型,Qwen3.x 更像朝“能思考、能看、能调用工具、能完成任务”的 Agent 底座在走。
6. Qwen3:相对 Qwen2.5 的关键升级
Qwen3 发布于 2025-04-29,它是 Qwen 从“强聊天模型”走向“推理模型 + Agent 模型”的关键一代。
6.1 Hybrid Thinking Modes
Qwen3 引入了一个很重要的设计:
Thinking ModeNon-Thinking Mode
也就是:
- 复杂问题时,可以多想一会
- 简单问题时,可以直接快速回答
这个设计的意义很大,因为它开始把“推理预算”显式化。
6.2 训练数据规模显著提升
Qwen3 官方提到:
- Qwen2.5:约
18T tokens - Qwen3:约
36T tokens
也就是差不多翻倍。
6.3 多语言支持明显扩展
Qwen3 支持 119 种语言和方言,相比 Qwen2.5 的 29+ 更进一步。
6.4 Agent 和编码能力更强
官方明确提到:
- 强化了 coding 和 agentic capabilities
- 增强了对
MCP的支持
这说明 Qwen3 不只是问答模型,而是开始面向:
- 工具调用
- 环境交互
- 多步任务执行
6.5 MoE 带来更好的效率
Qwen3 这一代不仅有 dense 模型,也有 MoE 模型:
Qwen3-30B-A3BQwen3-235B-A22B
MoE 的意义是:
总参数很大,但每次推理只激活一部分参数,从而兼顾能力和成本。
官方还提到:
Qwen3-4B可以逼近Qwen2.5-72B-Instruct- Qwen3 的 MoE 模型可以用更少激活参数达到接近 Qwen2.5 dense 模型的效果
7. Qwen3.5:相对 Qwen2.5 / Qwen3 的关键升级
Qwen3.5 发布于 2026-02-17。
这一代最重要的变化不是单点指标,而是方向变了:
从文本大模型,进一步走向“原生多模态 Agent”。
7.1 原生多模态
官方将 Qwen3.5-397B-A17B 定义为:
- native vision-language model
也就是说它不是简单地“LLM 外接视觉模块”,而是更强调模型本身对多模态信息的统一处理。
7.2 架构更先进
Qwen3.5 采用:
linear attentionGated Delta Networkssparse MoE
官方给出的核心信息是:
- 总参数
397B - 每次前向仅激活
17B
这类架构的目标很明确:
- 降低推理成本
- 提高长上下文和多模态处理效率
7.3 语言覆盖更大
Qwen3.5 把语言和方言支持从 119 扩展到 201
这意味着它更适合:
- 全球化产品
- 多语检索
- 多语客服
- 多语 Agent
7.4 Hosted 版本更适合做 Agent
官方提到 Qwen3.5-Plus 具备:
- 默认
1Mcontext window - 官方内置工具
- adaptive tool use
这和 Qwen2.5 的差别已经非常明显了。
Qwen2.5 还是:
- 更偏“问答 / 聊天 / 通用推理”
而 Qwen3.5-Plus 开始变成:
- 更偏“能理解环境、能调用工具、能在长上下文里持续工作”
8. Qwen3.6-Plus:截至 2026-04-20 的最新 API 旗舰
Qwen3.6-Plus 发布于 2026-04-02。
如果你问“现在最强的 Qwen 云端 Agent 模型是谁”,答案基本就是它。
8.1 相比 Qwen3.5-Plus 的主要改进
官方给出的核心升级点非常明确:
- 编程 Agent 能力显著增强
- 多模态感知和推理更强
- 默认
1M上下文 - 更稳定、更可靠,更面向真实开发者场景
8.2 它最强的地方是什么
Qwen3.6-Plus 最大的变化不是“普通聊天更会聊”,而是:
- 更会写代码
- 更会改代码
- 更会处理仓库级任务
- 更会终端操作和工具调用
- 更适合长链路、多步骤任务
官方原话对应的方向大致可以概括为:
- reasoning
- memory
- execution
这三个能力被整合得更紧了。
8.3 它的优点
从实际使用角度看,Qwen3.6-Plus 的优点主要是:
- 更强的 Agentic Coding
- 更适合复杂仓库理解
- 更适合前端开发和自动化任务
- 更适合长任务规划
- 更适合工具调用和多轮任务执行
- 更适合多模态输入场景
如果你要做的是:
- AI 编程助手
- 自动化开发 Agent
- Repo 级代码分析
- 多步工作流 Agent
那 Qwen3.6-Plus 的定位已经明显高于 Qwen2.5。
9. Qwen3.6-35B-A3B:截至 2026-04-20 的最新开源主力
Qwen3.6-35B-A3B 发布于 2026-04-17。
这是一款很值得关注的模型,因为它很能代表现在开源模型的方向:
用更少的激活参数,做出更强的 Agent 和编码能力。
9.1 它的核心特点
35B总参数3B激活参数- MoE 架构
- 原生多模态
- 兼顾
thinking和non-thinking
9.2 相比上一代的改进
官方强调它:
- 大幅超过
Qwen3.5-35B-A3B - 在 agentic coding 上提升明显
- 能与更大的 dense 模型竞争
尤其适合:
- 本地部署
- 开源私有化
- 成本敏感场景
- 想要较强代码 Agent 能力,但又不想上超大模型
9.3 它的优点
- 开源,适合自部署
- 激活参数低,推理成本相对更友好
- 代码 Agent 能力强
- 多模态能力也不错
- 能对接
OpenClaw、Claude Code、Qwen Code - 支持
preserve_thinking,更适合连续 Agent 任务
一句话概括:
如果 Qwen3.6-Plus 是云端旗舰,那么 Qwen3.6-35B-A3B 更像是“开源部署里很有竞争力的一把刀”。
10. Qwen2.5 和最新模型怎么对比
| 维度 | Qwen2.5 | Qwen3.6-Plus / Qwen3.6-35B-A3B |
|---|---|---|
| 主要定位 | 通用基础模型 | Agent 化、编程化、多模态化 |
| 核心优势 | 稳定、通用、结构化输出好 | 会思考、会调用工具、会执行复杂任务 |
| 上下文 | 最高 128K |
Hosted 版默认可到 1M |
| 输出风格 | 更适合问答、结构化响应 | 更适合多步任务、复杂工作流 |
| 代码能力 | 强,尤其 Qwen2.5-Coder |
更强调 Agentic Coding 和仓库级任务 |
| 多模态 | 不是这一代的核心重点 | 已经是核心方向之一 |
| 部署选择 | 适合通用本地部署 | 最新开源版更适合高级 Agent 部署 |
| 成本效率 | dense 结构,直观易懂 | MoE 更强调“能力 / 成本”比 |
11. 怎么选
如果你现在要选型,可以这样理解:
选 Qwen2.5 的场景
- 想找成熟稳定的通用开源模型
- 更关注文本问答、RAG、结构化输出
- 本地部署机器一般,希望模型链路简单
- 需要一套通用模型 + coder/math 专项模型组合
选 Qwen3.6-35B-A3B 的场景
- 想自部署最新开源模型
- 重点是代码 Agent、任务执行、复杂工作流
- 希望性能强,但推理成本不要太夸张
- 希望兼顾多模态能力
选 Qwen3.6-Plus 的场景
- 不执着于开源权重
- 更看重当前最强云端能力
- 想做编程 Agent、工具调用 Agent、长链路任务规划
- 需要默认
1M上下文和更强的实际执行能力
12. 高频结论
Qwen2.5的核心价值是“稳、全、好落地”。Qwen3开始,Qwen 明显往 reasoning + agent 方向转。Qwen3.5是“原生多模态 Agent”方向的重要节点。Qwen3.6-Plus是截至2026-04-20的最新 API 旗舰,更偏真实世界 Agent。Qwen3.6-35B-A3B是截至2026-04-20的最新开源主力,更适合自部署和高性价比 Agent 场景。
13. 推荐阅读
建议按下面顺序看:
Qwen2.5:先理解它为什么是一个成熟通用底座Qwen3:看它如何把 thinking / non-thinking 合到一起Qwen3.5:看它怎么走向原生多模态 AgentQwen3.6-Plus:看最新 Agent 旗舰在“编码 + 工具 + 多模态”上怎么继续升级Qwen3.6-35B-A3B:看开源版本如何在成本和能力之间做平衡
官方文章:
- Qwen2.5: A Party of Foundation Models!
- Qwen3: Think Deeper, Act Faster
- Qwen3.5: Towards Native Multimodal Agents
- Qwen3.6-Plus: Towards Real World Agents
- Qwen3.6-35B-A3B: Agentic Coding Power, Now Open to All
14. 一句话总结
Qwen2.5 的关键词是“强通用底座”,而最新的 Qwen3.6 系列关键词已经变成了:
原生多模态、Agent、编程执行、长上下文、高效率 MoE。