阿里千问发布 Qwen3-Coder-Next:低推理成本编程智能体模型
2026-02-05 02:01:38
  • 0
  • 0
  • 0

2 月 4 日消息,阿里巴巴千问宣布推出 Qwen3-Coder-Next,一款专为编码代理与本地开发打造的开放权重的语言模型。

该模型基于 Qwen3-Next-80B-A3B-Base 构建,采用混合注意力与 MoE 的新架构;通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,在显著降低推理成本的同时,获得了强大的编程与智能体能力。

Qwen3-Coder-Next 不依赖单纯的参数扩展,而是聚焦于扩展智能体训练信号。我们使用大规模的可验证编程任务与可执行环境进行训练,使模型能够直接从环境反馈中学习。训练过程包括:

在以代码与智能体为中心的数据上进行持续预训练

在包含高质量智能体轨迹的数据上进行监督微调

领域专精的专家训练(如软件工程、QA、Web / UX 等)

将专家能力蒸馏到单一、可部署的模型中

该配方强调长程推理、工具使用以及从执行失败中恢复,这些对现实世界中的编程智能体至关重要。

在编程智能体基准上的表现

面向智能体的基准结果

下图汇总了在多个广泛使用的编程智能体基准上的表现,包括 SWE-Bench(Verified、Multilingual、Pro)、TerminalBench 2.0 和 Aider。(来源:阿里)

 
最新文章
相关阅读