Qwen 模型演进笔记

发表于 2026-04-20 分类于学习， AI模型开发，知识点学习，大模型部署阅读次数：

Qwen 模型演进笔记

1. 先说明“最新模型”指的是谁

截至 2026-04-20，如果说“Qwen 最新模型”，其实要分两类看：

最新通用 API 旗舰模型：Qwen3.6-Plus
发布时间：2026-04-02
最新开源主力模型：Qwen3.6-35B-A3B
发布时间：2026-04-17

如果你更关心：

云端调用、Agent、编程能力：重点看 Qwen3.6-Plus
本地部署、开源权重、性价比：重点看 Qwen3.6-35B-A3B

2. Qwen2.5 是什么

Qwen2.5 是 Qwen 在 2024-09-19 发布的一代重要开源模型系列。

这一代的定位可以理解成：

把“通用聊天模型”真正做到了更稳、更全、更适合工程落地。

Qwen2.5 这一代包含：

通用语言模型：Qwen2.5
代码模型：Qwen2.5-Coder
数学模型：Qwen2.5-Math

开源尺寸覆盖比较广：

0.5B
1.5B
3B
7B
14B
32B
72B

3. Qwen2.5 的主要改进点

根据官方介绍，Qwen2.5 相比 Qwen2 的核心提升主要在下面几块：

3.1 知识、代码、数学能力更强

官方提到 Qwen2.5 基于最多 18T tokens 的大规模数据训练，相比 Qwen2：

知识能力更强
代码能力提升明显
数学能力提升明显

这说明 Qwen2.5 不只是“能聊天”，而是开始更像一个泛用底座模型。

3.2 指令跟随更稳

Qwen2.5 一个很实用的提升是：

更能听懂要求
更能按要求输出
对不同 system prompt 更稳

这在工程里很重要，因为很多模型不是“不会做”，而是：

格式不稳
角色设定容易跑偏
提示词一换风格就漂

Qwen2.5 在这方面明显更适合做产品。

3.3 结构化输出更好

Qwen2.5 官方特别强调了这几点：

更理解结构化数据
更擅长表格理解
更擅长输出结构化结果
特别是 JSON 输出更可靠

这个优点对工程很关键，因为很多业务不是只要一段自然语言，而是要：

JSON
表单字段
工具调用参数
SQL / API 请求体

3.4 长文本生成更实用

Qwen2.5 支持：

最长 128K 上下文
最多 8K 生成长度

对长文总结、长对话、多轮问答、文档问答更友好。

3.5 多语言能力更强

Qwen2.5 支持 29+ 种语言，继续保持中英双强，同时兼顾多语种能力。

3.6 专项模型更成熟

这一代不只是通用模型升级，专项模型也更成体系：

Qwen2.5-Coder：代码相关数据更多，适合编程助手
Qwen2.5-Math：支持中英文数学问题，并引入 CoT、PoT、TIR

这意味着：

Qwen2.5 开始不是“一个模型打天下”，而是形成了通用底座 + 专项模型的完整产品线。

4. Qwen2.5 的优点

如果从“开发者和部署者”的角度看，Qwen2.5 的优点主要有这些：

尺寸覆盖广，小到 0.5B，大到 72B，方便按机器选型
作为 dense model，结构相对直观，部署门槛低
128K 上下文对很多 RAG 和长文场景已经够用
指令跟随和 JSON 输出更稳，适合业务接入
Qwen2.5-Coder、Qwen2.5-Math 让专项任务更好选型
已经很好适配 Transformers、vLLM、Ollama

一句话概括：

Qwen2.5 的强项是“稳、全、好落地”，非常适合作为通用开源基座。

5. 从 Qwen2.5 到最新模型，发生了什么变化

如果把后续几代串起来看，Qwen 的升级路线很清楚：

Qwen2.5

重点是把通用基础能力做强
强化结构化输出、长文本、代码、数学

Qwen3

重点是把“推理模式 + 快速模式”融合
开始明显强化 agent 和 reasoning 路线

Qwen3.5

重点转向“原生多模态 Agent”
不再只是文本模型，而是朝着文字、图像、音频、视频统一理解发展

Qwen3.6

重点是把 Agent 真正往实战推进
明显强化编程 Agent、工具调用、长链路任务执行、多模态推理

一句话看演进：

Qwen2.5 更像一个强通用模型，Qwen3.x 更像朝“能思考、能看、能调用工具、能完成任务”的 Agent 底座在走。

6. Qwen3：相对 Qwen2.5 的关键升级

Qwen3 发布于 2025-04-29，它是 Qwen 从“强聊天模型”走向“推理模型 + Agent 模型”的关键一代。

6.1 Hybrid Thinking Modes

Qwen3 引入了一个很重要的设计：

Thinking Mode
Non-Thinking Mode

也就是：

复杂问题时，可以多想一会
简单问题时，可以直接快速回答

这个设计的意义很大，因为它开始把“推理预算”显式化。

6.2 训练数据规模显著提升

Qwen3 官方提到：

Qwen2.5：约 18T tokens
Qwen3：约 36T tokens

也就是差不多翻倍。

6.3 多语言支持明显扩展

Qwen3 支持 119 种语言和方言，相比 Qwen2.5 的 29+ 更进一步。

6.4 Agent 和编码能力更强

官方明确提到：

强化了 coding 和 agentic capabilities
增强了对 MCP 的支持

这说明 Qwen3 不只是问答模型，而是开始面向：

工具调用
环境交互
多步任务执行

6.5 MoE 带来更好的效率

Qwen3 这一代不仅有 dense 模型，也有 MoE 模型：

Qwen3-30B-A3B
Qwen3-235B-A22B

MoE 的意义是：

总参数很大，但每次推理只激活一部分参数，从而兼顾能力和成本。

官方还提到：

Qwen3-4B 可以逼近 Qwen2.5-72B-Instruct
Qwen3 的 MoE 模型可以用更少激活参数达到接近 Qwen2.5 dense 模型的效果

7. Qwen3.5：相对 Qwen2.5 / Qwen3 的关键升级

Qwen3.5 发布于 2026-02-17。

这一代最重要的变化不是单点指标，而是方向变了：

从文本大模型，进一步走向“原生多模态 Agent”。

7.1 原生多模态

官方将 Qwen3.5-397B-A17B 定义为：

native vision-language model

也就是说它不是简单地“LLM 外接视觉模块”，而是更强调模型本身对多模态信息的统一处理。

7.2 架构更先进

Qwen3.5 采用：

linear attention
Gated Delta Networks
sparse MoE

官方给出的核心信息是：

总参数 397B
每次前向仅激活 17B

这类架构的目标很明确：

降低推理成本
提高长上下文和多模态处理效率

7.3 语言覆盖更大

Qwen3.5 把语言和方言支持从 119 扩展到 201

这意味着它更适合：

全球化产品
多语检索
多语客服
多语 Agent

7.4 Hosted 版本更适合做 Agent

官方提到 Qwen3.5-Plus 具备：

默认 1M context window
官方内置工具
adaptive tool use

这和 Qwen2.5 的差别已经非常明显了。

Qwen2.5 还是：

更偏“问答 / 聊天 / 通用推理”

而 Qwen3.5-Plus 开始变成：

更偏“能理解环境、能调用工具、能在长上下文里持续工作”

8. Qwen3.6-Plus：截至 2026-04-20 的最新 API 旗舰

Qwen3.6-Plus 发布于 2026-04-02。

如果你问“现在最强的 Qwen 云端 Agent 模型是谁”，答案基本就是它。

8.1 相比 Qwen3.5-Plus 的主要改进

官方给出的核心升级点非常明确：

编程 Agent 能力显著增强
多模态感知和推理更强
默认 1M 上下文
更稳定、更可靠，更面向真实开发者场景

8.2 它最强的地方是什么

Qwen3.6-Plus 最大的变化不是“普通聊天更会聊”，而是：

更会写代码
更会改代码
更会处理仓库级任务
更会终端操作和工具调用
更适合长链路、多步骤任务

官方原话对应的方向大致可以概括为：

reasoning
memory
execution

这三个能力被整合得更紧了。

8.3 它的优点

从实际使用角度看，Qwen3.6-Plus 的优点主要是：

更强的 Agentic Coding
更适合复杂仓库理解
更适合前端开发和自动化任务
更适合长任务规划
更适合工具调用和多轮任务执行
更适合多模态输入场景

如果你要做的是：

AI 编程助手
自动化开发 Agent
Repo 级代码分析
多步工作流 Agent

那 Qwen3.6-Plus 的定位已经明显高于 Qwen2.5。

9. Qwen3.6-35B-A3B：截至 2026-04-20 的最新开源主力

Qwen3.6-35B-A3B 发布于 2026-04-17。

这是一款很值得关注的模型，因为它很能代表现在开源模型的方向：

用更少的激活参数，做出更强的 Agent 和编码能力。

9.1 它的核心特点

35B 总参数
3B 激活参数
MoE 架构
原生多模态
兼顾 thinking 和 non-thinking

9.2 相比上一代的改进

官方强调它：

大幅超过 Qwen3.5-35B-A3B
在 agentic coding 上提升明显
能与更大的 dense 模型竞争

尤其适合：

本地部署
开源私有化
成本敏感场景
想要较强代码 Agent 能力，但又不想上超大模型

9.3 它的优点

开源，适合自部署
激活参数低，推理成本相对更友好
代码 Agent 能力强
多模态能力也不错
能对接 OpenClaw、Claude Code、Qwen Code
支持 preserve_thinking，更适合连续 Agent 任务

一句话概括：

如果 Qwen3.6-Plus 是云端旗舰，那么 Qwen3.6-35B-A3B 更像是“开源部署里很有竞争力的一把刀”。

10. Qwen2.5 和最新模型怎么对比

维度	Qwen2.5	Qwen3.6-Plus / Qwen3.6-35B-A3B
主要定位	通用基础模型	Agent 化、编程化、多模态化
核心优势	稳定、通用、结构化输出好	会思考、会调用工具、会执行复杂任务
上下文	最高 `128K`	Hosted 版默认可到 `1M`
输出风格	更适合问答、结构化响应	更适合多步任务、复杂工作流
代码能力	强，尤其 `Qwen2.5-Coder`	更强调 Agentic Coding 和仓库级任务
多模态	不是这一代的核心重点	已经是核心方向之一
部署选择	适合通用本地部署	最新开源版更适合高级 Agent 部署
成本效率	dense 结构，直观易懂	MoE 更强调“能力 / 成本”比

11. 怎么选

如果你现在要选型，可以这样理解：

选 Qwen2.5 的场景

想找成熟稳定的通用开源模型
更关注文本问答、RAG、结构化输出
本地部署机器一般，希望模型链路简单
需要一套通用模型 + coder/math 专项模型组合

选 Qwen3.6-35B-A3B 的场景

想自部署最新开源模型
重点是代码 Agent、任务执行、复杂工作流
希望性能强，但推理成本不要太夸张
希望兼顾多模态能力

选 Qwen3.6-Plus 的场景

不执着于开源权重
更看重当前最强云端能力
想做编程 Agent、工具调用 Agent、长链路任务规划
需要默认 1M 上下文和更强的实际执行能力

12. 高频结论

Qwen2.5 的核心价值是“稳、全、好落地”。
Qwen3 开始，Qwen 明显往 reasoning + agent 方向转。
Qwen3.5 是“原生多模态 Agent”方向的重要节点。
Qwen3.6-Plus 是截至 2026-04-20 的最新 API 旗舰，更偏真实世界 Agent。
Qwen3.6-35B-A3B 是截至 2026-04-20 的最新开源主力，更适合自部署和高性价比 Agent 场景。

13. 推荐阅读

建议按下面顺序看：

Qwen2.5：先理解它为什么是一个成熟通用底座
Qwen3：看它如何把 thinking / non-thinking 合到一起
Qwen3.5：看它怎么走向原生多模态 Agent
Qwen3.6-Plus：看最新 Agent 旗舰在“编码 + 工具 + 多模态”上怎么继续升级
Qwen3.6-35B-A3B：看开源版本如何在成本和能力之间做平衡

官方文章：

14. 一句话总结

Qwen2.5 的关键词是“强通用底座”，而最新的 Qwen3.6 系列关键词已经变成了：

原生多模态、Agent、编程执行、长上下文、高效率 MoE。