1) Qwen3-VL
Qwen3-VL-8B 在 STEM、VQA、OCR、视频理解和 Agent 任务等公开评测上表现优异,不仅超越 Gemini 2.5 Flash Lite 和 GPT-5 Nano,甚至可以媲美上一代超大尺寸模型 Qwen2.5-VL-72B

OCR功能支持32种语言识别。实现设计图转代码、视频帧级分析等应用。

2) Qwen3-VL-30B-A3B-Thinking

Qwen3-VL系列第二大MoE模型的Thinking版本,响应速度快,具备更强多模态理解与推理、视觉智能体、长视频长文档等超长上下文支持能力;全面升级图像/视频理解、空间感知与万物识别能力,胜任复杂现实任务。

标签: none

添加新评论

  • 上一篇: 123
  • 下一篇: 没有了