总参数量30.5B,激活参数仅3.3B,48层网络搭配128个专家。接近claude4/GPT-4.1级别的能力,笔记本就能部署。
阿里通义千问团队于2025年8月1日正式发布Qwen3-Coder-Flash,它是Qwen3-Coder的精简版,都是非推理模型。

智能体能力突出
在代理式编程、浏览器自动化及工具调用等任务中,性能超越主流开源模型(如CodeLlama),接近Claude Sonnet-4、GPT-4.1等闭源模型。

原生支持256K tokens上下文窗口,通过YaRN技术可扩展至1M tokens。
可一次性解析包含20万行代码的中型项目,解决传统模型上下文截断问题。

标签: none

添加新评论