阿里發布代碼模型Qwen3-Coder并開源,性能媲美Claude Sonnet 4快訊
Qwen3-Coder 的 API 也可以和 Claude Code、Cline 等工具協同使用,阿里通義千問發布迄今為止最具代理能力的代碼模型Qwen3-Coder,最終 Qwen3-Coder 在 SWE-bench Verified 上實現了開源模型 SOTA 的效果。
【TechWeb】7月23日消息,阿里通義千問發布迄今為止最具代理能力的代碼模型Qwen3-Coder,并正式開源。
據介紹,Qwen3-Coder 擁有多個尺寸,當前最強大的版本Qwen3-Coder-480B-A35B-Instruct是一個 480B 參數激活 35B 參數的 MoE 模型,原生支持 256K token 的上下文并可通過 YaRN 擴展到 1M token,擁有卓越的代碼和 Agent 能力。

Qwen3-Coder-480B-A35B-Instruct 在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了開源模型的 SOTA 效果,可以與 Claude Sonnet4 媲美。
為方便開發者更好地使用 Qwen3-Coder,通義團隊還開源了一款命令行工具 Qwen Code。Qwen Code 基于 Gemini Code 進行二次開發,進行了 prompt 和工具調用協議適配,使得 Qwen Code 可以最大程度激發 Qwen3-Coder 在 Agentic Coding 任務上的表現。
此外, Qwen3-Coder 的 API 也可以和 Claude Code、Cline 等工具協同使用。
目前,Qwen3-Coder 已在魔搭社區、HuggingFace 等平臺開源,全球開發者都可以免費下載使用。Qwen3-Coder 很快將接入阿里的AI編程產品通義靈碼,API也已上線阿里云百煉。
就在今年5月23日,Anthropic的Claude 4雙模型Claude Opus 4和Claude Sonnet 4攜“不間斷編碼7小時”關鍵詞強勢發布,號稱提供了卓越的編碼和推理能力,Anthropic AI編程助手Claude Code也迎來全面開放。

在當時的權威編程基準測試SWE-bench Verified上,開啟擴展思考的Claude Opus 4與Claude Sonnet 4的得分分別為79.4%和80.2%,大幅度超越了OpenAI Codex-1、OpenAI o3、OpenAI GPT-4.1、Gemini 2.5 Pro等模型,一舉奪魁。
通義團隊介紹,此次Qwen3-Coder升級從不同角度進行 Scaling,以提升模型的代碼能力。包括數據擴展:總計 7.5T(代碼占比 70%),在保持通用與數學能力的同時,具備卓越的編程能力;上下文擴展:原生支持 256K 上下文,借助 YaRN 可拓展至 1M,專為倉庫級和動態數據(如 Pull Request)優化,助力 Agentic Coding;合成數據擴展:利用 Qwen2.5-Coder 對低質數據進行清洗與重寫,顯著提升整體數據質量。

另外,在真實世界的 Software Engneering Task,比如 SWE-Bench,通義團隊在 Qwen3-Coder 的后訓練階段執行了 Agent RL,鼓勵模型通過多輪交互的方式利用工具解決問題,借助阿里云的基礎設施,實現同時運行 20k 獨立環境。這一套基礎設施可以提供大規模的強化學習反饋和評測,最終 Qwen3-Coder 在 SWE-bench Verified 上實現了開源模型 SOTA 的效果。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。