
6月2日,阿里巴巴旗下通义千问团队通过官方渠道正式发布全新多模态智能体模型——Qwen3.7-Plus。作为Qwen3.7系列的重要升级版本,该模型在原有强大文本处理能力基础上,全面强化了视觉与语言的深度融合能力,标志着阿里在构建统一智能体基座方面迈出关键一步。
Qwen3.7-Plus不仅延续了前代模型在编码开发、工具调用及复杂任务规划等方面的成熟表现,更在多模态交互上实现显著突破。据官方介绍,新模型能够高效理解图像、视频等视觉内容,并将其与自然语言无缝结合,从而支持更贴近人类认知方式的智能交互体验。
此次升级的核心亮点在于“视觉-语言一体化智能体架构”。通过将视觉理解能力嵌入智能体的动作规划与决策流程中,Qwen3.7-Plus可实现对复杂场景的深度感知与响应。例如,在办公自动化、智能客服或工业巡检等场景中,模型不仅能“看懂”图像信息,还能据此执行后续操作或生成结构化输出。
阿里云方面强调,Qwen3.7-Plus并非简单叠加视觉模块,而是从底层架构出发,重构了多模态信息的融合机制。这种设计使其在保持高推理效率的同时,显著提升了跨模态任务的准确率与泛化能力,为开发者和企业用户提供了更强大的生产力工具。
市场对此次发布反应积极。消息公布当日,阿里巴巴-W(09988.HK)股价一度上涨超6%,显示出资本市场对其AI战略布局的高度认可。分析人士指出,Qwen3.7-Plus的推出进一步巩固了阿里在开源大模型领域的领先地位,并有望加速多模态AI技术在实际业务中的落地应用。
值得注意的是,Qwen3.7-Plus仍延续阿里一贯的开放策略,预计将通过魔搭(ModelScope)平台向开发者社区开放部分能力。此举不仅有助于推动行业技术进步,也将吸引更多生态伙伴基于该模型开发垂直领域应用,形成良性创新循环。
随着人工智能从单模态向多模态演进,具备综合感知与行动能力的智能体正成为下一阶段竞争焦点。Qwen3.7-Plus的发布,正是阿里对此趋势的战略回应。通过打通视觉、语言与工具使用之间的壁垒,该模型为构建真正具备“理解-决策-执行”闭环的通用智能体奠定了坚实基础。
业内专家认为,未来AI的竞争将不再局限于参数规模或单一任务性能,而在于能否构建高效、可靠且可扩展的智能体系统。在此背景下,Qwen3.7-Plus所代表的技术路径,或将引领新一轮多模态AI创新浪潮。
目前,Qwen3.7-Plus已开始面向企业客户和开发者提供测试接入。阿里表示,将持续优化模型性能,并计划在未来数月内推出更多配套工具与应用场景解决方案,加速其在电商、金融、制造等行业的深度集成。