王炸登场!阿里Qwen3-Coder带1M上下文“杀疯了”,程序员集体“原地卸载”Claude Code?

温故智新AIGC实验室

TL;DR:

阿里最近扔出了一颗“王炸”——Qwen3-Coder,这货不仅代码能力SOTA,上下文窗口直接拉到1M,还自带“Agent”属性,能自己干活,效率拉满!有开发者激动到想原地卸载Claude Code,这波,开源社区怕是要“沸腾”了。

嘿,各位码农老铁们,最近是不是感觉有点“危机”?或者说,是“狂喜”?!就在7月23日,阿里巴巴突然祭出了一款“重磅武器”——Qwen3-Coder1。官方号称,这货是他们“迄今为止最具代理能力的代码模型”。听这口气,一股子“不服来战”的霸气扑面而来!

为啥说它是“王炸”呢?因为它可不只是个写代码的“打字机”。想象一下,一个AI助理能看懂你整个代码仓库,还能帮你自主规划、调试bug,甚至5分钟给你撸个官网出来,这效率,简直是“火箭式提升”啊!难怪有开发者直呼:“Claude Code可以卸载了!”这波操作,直接让开源社区“炸锅”了。

AI程序员,这回真要失业了?别急,我们是“好搭档”!

Qwen3-Coder到底有多能打?先甩几个数据感受一下它的“肌肉量”:

  • 参数量惊人: 顶配版Qwen3-Coder-480B-A35B-Instruct,是拥有480B参数、35B激活参数的MoE模型。啥意思?就是它学得够多、看得够广,脑子里装满了各种编程知识。
  • “过目不忘”的超长上下文: 原生支持256K token,这已经够“变态”了,但阿里还嫌不够,通过YaRN技术,直接把上下文窗口拓展到了1M token2 1M token是啥概念?差不多就是一本《战争与和平》的文字量。这意味着,它能一口气读懂你整个代码仓库,上下文连接能力直接拉满,再长的项目也不怕它“断片儿”!
  • 语言天赋异禀: 支持多达358种编程语言!从Python到C++,从Web前端到系统底层,几乎是“全能型选手”。
  • “自主工作”的Agent能力: 这才是它最“炸裂”的地方!在Agentic Coding(代理式编程)、Agentic Browser-Use(代理式浏览器使用)和Agentic Tool-Use(代理式工具使用)上,Qwen3-Coder都取得了开源模型的SOTA(State-Of-The-Art)效果,能和闭源的Claude Sonnet4掰掰手腕。简单来说,它不只是听指令干活,还能自己规划、自己调用工具、自己解决问题,活脱脱一个“高阶AI打工人”!

据官方介绍,有了Qwen3-Coder,刚入行的程序员“一天就能完成资深程序员一周的工作”1。比如,生成一个品牌官网,最快只需要5分钟!这速度,简直比你点外卖还快!

为了让大家用得更顺手,阿里还开源了一款命令行工具——Qwen Code。这玩意儿是基于Gemini CLI魔改的,专门为Qwen3-Coder优化,能最大程度激发模型的“洪荒之力”。

“炼丹秘籍”大公开:从数据到“自由意志”,AI是怎么“炼”成的?

Qwen3-Coder这身“神功”是怎么练出来的?阿里团队也大方地公布了他们的“炼丹秘籍”:

  • “数据大补丸”: 总计7.5T的数据量,其中代码占比高达70%。这可不是一般的“数据堆砌”,他们还利用Qwen2.5-Coder对低质数据进行清洗与重写,简直就是给数据来了个“基因优化”,确保喂给模型都是“精品饲料”。
  • “上下文扩容术”: 除了原生256K的“大胃王”能力,借助YaRN技术,还能轻松拓展到1M上下文。这就像给AI装了个“无限记忆卡”,专门为处理那种动辄几十万行的仓库级代码和Pull Request这种动态数据“开小灶”。
  • “ Agent RL强化训练”: 这才是Qwen3-Coder学会“自主思考”的关键。不同于其他模型只盯着代码竞赛,阿里团队认为所有真实的代码任务都适合“执行驱动”的强化学习。他们通过自动化测试样例,构造了海量高质量的训练实例,让模型在实际“操作”中不断试错、学习。

最牛的是,为了让模型能在复杂环境中“自由发挥”,他们还搞了个Agent RL。这可不是小打小闹,它需要模型在环境中不断交互,自主规划、选择工具、接受反馈、做出决策。为了实现这个“史诗级任务”,阿里团队在阿里云基础设施上搭建了一个可验证环境的扩展系统,能同时运行20k个独立环境!这简直就是给AI搞了个“平行宇宙”,让它在里面疯狂“试炼”,最终在SWE-Bench Verified上取得了开源模型的SOTA效果。

谁家更香?开源巨头正面硬刚闭源大佬!

Qwen3-Coder一发布,开发者社区那是相当“沸腾”。毕竟,这可是大家期待已久的“开源代码大模型”啊!

SnapEdit联合创始人兼首席执行官Oscar Le直接发推“点赞”:

“Qwen从来没有让我失望过。现在大家不用再每月花200美元购买Claude Code了。”1

好家伙,这语气,简直是“省钱小能手”的福音啊!苹果研究员Yufan Zhuang也为Qwen“激情打call”,称赞其正在推动开源人工智能研究。看来,这波“开源风暴”真是吹进了程序员的心坎里。

实测数据显示,Qwen3-Coder的表现确实“能打”:

  • 在浏览器调用(WebArena)、工具调用(BFCL)等Agent能力评测中,Qwen3-Coder直接“刷新开源模型纪录”,甚至超越了GPT4.1
  • 在考察模型自主规划解决编程任务的SWE-Bench评测中,它也取得了开源最佳效果,媲美Claude4

官方直言,Qwen3-Coder的Agent能力非常出色,尤为擅长解决多步骤的长任务。它能“通观全局自主安排工作内容,支持Agent调用各种工具深入钻研,最终解决复杂编程任务。” 更劲爆的是,官方实测发现,它能调用的工具数量比Claude多几倍!这战斗力,简直是“一人成军”的节奏。

想想看,以前程序员写代码、补全、修bug,得吭哧吭哧搞半天,现在有了Qwen3-Coder,“数小时骤降至数分钟”1。甚至连普通人想入门编程,也能“一句话”生成精妙复杂的3D物理模拟过程,比如:用名言测试WPM、旋转超立方体中的弹跳球、太阳系模拟、DUET游戏……这简直是“魔法”!

当然,也有开发者在实际体验中遇到了一些“小插曲”:有人反馈它在推理上表现出色,但也有人在尝试用MCP工具读取文件时遇到了“翻车”的情况。毕竟,再强的AI也需要人类“调教”嘛。

最后,透露一个小“彩蛋”,阿里云百炼上Qwen3-Coder的API价格也曝光了,感兴趣的可以去围观一下。

彩蛋环节:和老朋友Claude Code“掰头”!

最骚的是,虽然大家喊着“卸载Claude Code”,但阿里官方还贴心地提供了Qwen3-Coder与Claude Code“和平共处”的方法。没错,就是让你把Qwen3-Coder接入到Claude Code里用!这波操作,简直是“反向入侵”,让人直呼“活久见”。

具体来说,有两种“骚操作”:

  1. “狸猫换太子”代理API: 直接把Anthropic的base url替换成DashScope提供的代理endpoint,一键切换,简单粗暴!
    export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxy
    export ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey
    
    然后你就可以直接输入claude,开始享受Qwen3-Coder & Claude Code的“梦幻联动”了!
  2. “定制路由”: 通过claude-code-router@dashscope-js/claude-code-config生成配置文件,进行更灵活的路由配置。这简直就是给你的开发工具装了个“智能导航”,想用谁就用谁!

这波操作,无疑是给开发者提供了更多选择和便利。看来,在AI编程的未来战场上,竞争会越来越激烈,但受益的,永远是我们这些“码农”!阿里Qwen3-Coder的出现,无疑是给这把火又添了一把柴,未来的编程世界,只会更“卷”,也更“燃”!

引用


  1. 阿里正式发布Qwen3-Coder,这是其迄今为止最具代理能力的代码模型·极客邦科技(2024/7/23)·检索日期2024/7/24 ↩︎ ↩︎ ↩︎ ↩︎

  2. 性能比肩Claude4! 阿里开源4800亿参数编程大模型Qwen3-Coder 原创·51CTO(2024/7/23)·检索日期2024/7/24 ↩︎