新芒xAI 6月16日消息 6月16日,阿里巴巴正式发布千问具身智能大模型Qwen-Robot系列,这是千问家族首个完整具身智能模型矩阵,包含三大核心模型:
Qwen-RobotManip:视觉-语言-动作(VLA)操作模型,为机器人提供灵巧双手;
Qwen-RobotNav:视觉-语言导航(VLN)移动模型,赋予机器人智能双脚;
Qwen-RobotWorld:世界模型,为机器人装上会思考的大脑,实现对物理世界的理解、预测与长期规划。
三大模型既可独立部署,也能协同运行,形成“手-脚-脑”完整闭环,显著提升机器人在复杂真实环境中的感知、决策和执行能力。阿里表示,该系列已在部分生态伙伴的机器人平台上开展测试验证。
【新芒xAI评论】
Qwen-Robot系列的推出是阿里从通用大模型向具身智能领域纵深布局的重要里程碑。通过VLA操作、VLN导航与World Model的协同架构,构建了完整的具身智能技术栈,有望有效解决当前机器人“会动但不聪明”“会走但不灵活”的核心痛点。
该系列依托千问强大基础能力,在多模态理解和世界建模上具备先天优势,未来结合阿里云算力和生态资源,有望加速在物流仓储、制造产线、家庭服务等场景的落地。
但具身智能模型仍面临真实世界数据稀缺、Sim2Real迁移难度大以及长时序规划稳定性等挑战。
整体而言,此发布进一步巩固阿里在中国AI全栈竞争中的领先地位,也为2026-2027年人形机器人与具身智能商业化浪潮提供了重要模型底座,标志着中国具身智能进入“模型驱动”新阶段。