Qwen3-VL

时间: 2025-10-16

分类: AI

阅读量:6

1) Qwen3-VL
Qwen3-VL-8B 在 STEM、VQA、OCR、视频理解和 Agent 任务等公开评测上表现优异，不仅超越 Gemini 2.5 Flash Lite 和 GPT-5 Nano，甚至可以媲美上一代超大尺寸模型 Qwen2.5-VL-72B

OCR功能支持32种语言识别。实现设计图转代码、视频帧级分析等应用。

2) Qwen3-VL-30B-A3B-Thinking

Qwen3-VL系列第二大MoE模型的Thinking版本，响应速度快，具备更强多模态理解与推理、视觉智能体、长视频长文档等超长上下文支持能力；全面升级图像/视频理解、空间感知与万物识别能力，胜任复杂现实任务。

标签: none