Qwen 模型演进笔记

Qwen 模型演进笔记

1. 先说明“最新模型”指的是谁

截至 2026-04-20,如果说“Qwen 最新模型”,其实要分两类看:

  • 最新通用 API 旗舰模型:Qwen3.6-Plus
    发布时间:2026-04-02
  • 最新开源主力模型:Qwen3.6-35B-A3B
    发布时间:2026-04-17

如果你更关心:

  • 云端调用、Agent、编程能力:重点看 Qwen3.6-Plus
  • 本地部署、开源权重、性价比:重点看 Qwen3.6-35B-A3B

2. Qwen2.5 是什么

Qwen2.5 是 Qwen 在 2024-09-19 发布的一代重要开源模型系列。

这一代的定位可以理解成:

把“通用聊天模型”真正做到了更稳、更全、更适合工程落地。

Qwen2.5 这一代包含:

  • 通用语言模型:Qwen2.5
  • 代码模型:Qwen2.5-Coder
  • 数学模型:Qwen2.5-Math

开源尺寸覆盖比较广:

  • 0.5B
  • 1.5B
  • 3B
  • 7B
  • 14B
  • 32B
  • 72B

3. Qwen2.5 的主要改进点

根据官方介绍,Qwen2.5 相比 Qwen2 的核心提升主要在下面几块:

3.1 知识、代码、数学能力更强

官方提到 Qwen2.5 基于最多 18T tokens 的大规模数据训练,相比 Qwen2:

  • 知识能力更强
  • 代码能力提升明显
  • 数学能力提升明显

这说明 Qwen2.5 不只是“能聊天”,而是开始更像一个泛用底座模型。

3.2 指令跟随更稳

Qwen2.5 一个很实用的提升是:

  • 更能听懂要求
  • 更能按要求输出
  • 对不同 system prompt 更稳

这在工程里很重要,因为很多模型不是“不会做”,而是:

  • 格式不稳
  • 角色设定容易跑偏
  • 提示词一换风格就漂

Qwen2.5 在这方面明显更适合做产品。

3.3 结构化输出更好

Qwen2.5 官方特别强调了这几点:

  • 更理解结构化数据
  • 更擅长表格理解
  • 更擅长输出结构化结果
  • 特别是 JSON 输出更可靠

这个优点对工程很关键,因为很多业务不是只要一段自然语言,而是要:

  • JSON
  • 表单字段
  • 工具调用参数
  • SQL / API 请求体

3.4 长文本生成更实用

Qwen2.5 支持:

  • 最长 128K 上下文
  • 最多 8K 生成长度

对长文总结、长对话、多轮问答、文档问答更友好。

3.5 多语言能力更强

Qwen2.5 支持 29+ 种语言,继续保持中英双强,同时兼顾多语种能力。

3.6 专项模型更成熟

这一代不只是通用模型升级,专项模型也更成体系:

  • Qwen2.5-Coder:代码相关数据更多,适合编程助手
  • Qwen2.5-Math:支持中英文数学问题,并引入 CoTPoTTIR

这意味着:

Qwen2.5 开始不是“一个模型打天下”,而是形成了通用底座 + 专项模型的完整产品线。


4. Qwen2.5 的优点

如果从“开发者和部署者”的角度看,Qwen2.5 的优点主要有这些:

  • 尺寸覆盖广,小到 0.5B,大到 72B,方便按机器选型
  • 作为 dense model,结构相对直观,部署门槛低
  • 128K 上下文对很多 RAG 和长文场景已经够用
  • 指令跟随和 JSON 输出更稳,适合业务接入
  • Qwen2.5-CoderQwen2.5-Math 让专项任务更好选型
  • 已经很好适配 TransformersvLLMOllama

一句话概括:

Qwen2.5 的强项是“稳、全、好落地”,非常适合作为通用开源基座。


5. 从 Qwen2.5 到最新模型,发生了什么变化

如果把后续几代串起来看,Qwen 的升级路线很清楚:

Qwen2.5

  • 重点是把通用基础能力做强
  • 强化结构化输出、长文本、代码、数学

Qwen3

  • 重点是把“推理模式 + 快速模式”融合
  • 开始明显强化 agent 和 reasoning 路线

Qwen3.5

  • 重点转向“原生多模态 Agent”
  • 不再只是文本模型,而是朝着文字、图像、音频、视频统一理解发展

Qwen3.6

  • 重点是把 Agent 真正往实战推进
  • 明显强化编程 Agent、工具调用、长链路任务执行、多模态推理

一句话看演进:

Qwen2.5 更像一个强通用模型,Qwen3.x 更像朝“能思考、能看、能调用工具、能完成任务”的 Agent 底座在走。


6. Qwen3:相对 Qwen2.5 的关键升级

Qwen3 发布于 2025-04-29,它是 Qwen 从“强聊天模型”走向“推理模型 + Agent 模型”的关键一代。

6.1 Hybrid Thinking Modes

Qwen3 引入了一个很重要的设计:

  • Thinking Mode
  • Non-Thinking Mode

也就是:

  • 复杂问题时,可以多想一会
  • 简单问题时,可以直接快速回答

这个设计的意义很大,因为它开始把“推理预算”显式化。

6.2 训练数据规模显著提升

Qwen3 官方提到:

  • Qwen2.5:约 18T tokens
  • Qwen3:约 36T tokens

也就是差不多翻倍。

6.3 多语言支持明显扩展

Qwen3 支持 119 种语言和方言,相比 Qwen2.5 的 29+ 更进一步。

6.4 Agent 和编码能力更强

官方明确提到:

  • 强化了 coding 和 agentic capabilities
  • 增强了对 MCP 的支持

这说明 Qwen3 不只是问答模型,而是开始面向:

  • 工具调用
  • 环境交互
  • 多步任务执行

6.5 MoE 带来更好的效率

Qwen3 这一代不仅有 dense 模型,也有 MoE 模型:

  • Qwen3-30B-A3B
  • Qwen3-235B-A22B

MoE 的意义是:

总参数很大,但每次推理只激活一部分参数,从而兼顾能力和成本。

官方还提到:

  • Qwen3-4B 可以逼近 Qwen2.5-72B-Instruct
  • Qwen3 的 MoE 模型可以用更少激活参数达到接近 Qwen2.5 dense 模型的效果

7. Qwen3.5:相对 Qwen2.5 / Qwen3 的关键升级

Qwen3.5 发布于 2026-02-17

这一代最重要的变化不是单点指标,而是方向变了:

从文本大模型,进一步走向“原生多模态 Agent”。

7.1 原生多模态

官方将 Qwen3.5-397B-A17B 定义为:

  • native vision-language model

也就是说它不是简单地“LLM 外接视觉模块”,而是更强调模型本身对多模态信息的统一处理。

7.2 架构更先进

Qwen3.5 采用:

  • linear attention
  • Gated Delta Networks
  • sparse MoE

官方给出的核心信息是:

  • 总参数 397B
  • 每次前向仅激活 17B

这类架构的目标很明确:

  • 降低推理成本
  • 提高长上下文和多模态处理效率

7.3 语言覆盖更大

Qwen3.5 把语言和方言支持从 119 扩展到 201

这意味着它更适合:

  • 全球化产品
  • 多语检索
  • 多语客服
  • 多语 Agent

7.4 Hosted 版本更适合做 Agent

官方提到 Qwen3.5-Plus 具备:

  • 默认 1M context window
  • 官方内置工具
  • adaptive tool use

这和 Qwen2.5 的差别已经非常明显了。

Qwen2.5 还是:

  • 更偏“问答 / 聊天 / 通用推理”

而 Qwen3.5-Plus 开始变成:

  • 更偏“能理解环境、能调用工具、能在长上下文里持续工作”

8. Qwen3.6-Plus:截至 2026-04-20 的最新 API 旗舰

Qwen3.6-Plus 发布于 2026-04-02

如果你问“现在最强的 Qwen 云端 Agent 模型是谁”,答案基本就是它。

8.1 相比 Qwen3.5-Plus 的主要改进

官方给出的核心升级点非常明确:

  • 编程 Agent 能力显著增强
  • 多模态感知和推理更强
  • 默认 1M 上下文
  • 更稳定、更可靠,更面向真实开发者场景

8.2 它最强的地方是什么

Qwen3.6-Plus 最大的变化不是“普通聊天更会聊”,而是:

  • 更会写代码
  • 更会改代码
  • 更会处理仓库级任务
  • 更会终端操作和工具调用
  • 更适合长链路、多步骤任务

官方原话对应的方向大致可以概括为:

  • reasoning
  • memory
  • execution

这三个能力被整合得更紧了。

8.3 它的优点

从实际使用角度看,Qwen3.6-Plus 的优点主要是:

  • 更强的 Agentic Coding
  • 更适合复杂仓库理解
  • 更适合前端开发和自动化任务
  • 更适合长任务规划
  • 更适合工具调用和多轮任务执行
  • 更适合多模态输入场景

如果你要做的是:

  • AI 编程助手
  • 自动化开发 Agent
  • Repo 级代码分析
  • 多步工作流 Agent

那 Qwen3.6-Plus 的定位已经明显高于 Qwen2.5。


9. Qwen3.6-35B-A3B:截至 2026-04-20 的最新开源主力

Qwen3.6-35B-A3B 发布于 2026-04-17

这是一款很值得关注的模型,因为它很能代表现在开源模型的方向:

用更少的激活参数,做出更强的 Agent 和编码能力。

9.1 它的核心特点

  • 35B 总参数
  • 3B 激活参数
  • MoE 架构
  • 原生多模态
  • 兼顾 thinkingnon-thinking

9.2 相比上一代的改进

官方强调它:

  • 大幅超过 Qwen3.5-35B-A3B
  • 在 agentic coding 上提升明显
  • 能与更大的 dense 模型竞争

尤其适合:

  • 本地部署
  • 开源私有化
  • 成本敏感场景
  • 想要较强代码 Agent 能力,但又不想上超大模型

9.3 它的优点

  • 开源,适合自部署
  • 激活参数低,推理成本相对更友好
  • 代码 Agent 能力强
  • 多模态能力也不错
  • 能对接 OpenClawClaude CodeQwen Code
  • 支持 preserve_thinking,更适合连续 Agent 任务

一句话概括:

如果 Qwen3.6-Plus 是云端旗舰,那么 Qwen3.6-35B-A3B 更像是“开源部署里很有竞争力的一把刀”。


10. Qwen2.5 和最新模型怎么对比

维度 Qwen2.5 Qwen3.6-Plus / Qwen3.6-35B-A3B
主要定位 通用基础模型 Agent 化、编程化、多模态化
核心优势 稳定、通用、结构化输出好 会思考、会调用工具、会执行复杂任务
上下文 最高 128K Hosted 版默认可到 1M
输出风格 更适合问答、结构化响应 更适合多步任务、复杂工作流
代码能力 强,尤其 Qwen2.5-Coder 更强调 Agentic Coding 和仓库级任务
多模态 不是这一代的核心重点 已经是核心方向之一
部署选择 适合通用本地部署 最新开源版更适合高级 Agent 部署
成本效率 dense 结构,直观易懂 MoE 更强调“能力 / 成本”比

11. 怎么选

如果你现在要选型,可以这样理解:

选 Qwen2.5 的场景

  • 想找成熟稳定的通用开源模型
  • 更关注文本问答、RAG、结构化输出
  • 本地部署机器一般,希望模型链路简单
  • 需要一套通用模型 + coder/math 专项模型组合

选 Qwen3.6-35B-A3B 的场景

  • 想自部署最新开源模型
  • 重点是代码 Agent、任务执行、复杂工作流
  • 希望性能强,但推理成本不要太夸张
  • 希望兼顾多模态能力

选 Qwen3.6-Plus 的场景

  • 不执着于开源权重
  • 更看重当前最强云端能力
  • 想做编程 Agent、工具调用 Agent、长链路任务规划
  • 需要默认 1M 上下文和更强的实际执行能力

12. 高频结论

  • Qwen2.5 的核心价值是“稳、全、好落地”。
  • Qwen3 开始,Qwen 明显往 reasoning + agent 方向转。
  • Qwen3.5 是“原生多模态 Agent”方向的重要节点。
  • Qwen3.6-Plus 是截至 2026-04-20 的最新 API 旗舰,更偏真实世界 Agent。
  • Qwen3.6-35B-A3B 是截至 2026-04-20 的最新开源主力,更适合自部署和高性价比 Agent 场景。

13. 推荐阅读

建议按下面顺序看:

  1. Qwen2.5:先理解它为什么是一个成熟通用底座
  2. Qwen3:看它如何把 thinking / non-thinking 合到一起
  3. Qwen3.5:看它怎么走向原生多模态 Agent
  4. Qwen3.6-Plus:看最新 Agent 旗舰在“编码 + 工具 + 多模态”上怎么继续升级
  5. Qwen3.6-35B-A3B:看开源版本如何在成本和能力之间做平衡

官方文章:


14. 一句话总结

Qwen2.5 的关键词是“强通用底座”,而最新的 Qwen3.6 系列关键词已经变成了:

原生多模态、Agent、编程执行、长上下文、高效率 MoE。