北京大学与智元机器人联合实验室发布OmniManip架构

发布日期：2025-01-24

223 次

1 月 23 日消息，如何将视觉语⾔基础模型（Vision Language Models, VLMs）应⽤于机器⼈以实现通⽤操作是具身智能领域的⼀个核⼼问题，这⼀⽬标的实现受两⼤关键挑战制约：

VLM 缺少精确的 3D 理解能⼒：通过对⽐学习范式训练、仅以 2D 图像 / ⽂本作为输⼊的 VLM 的天然局限；

⽆法输出低层次动作：将 VLM 在机器⼈数据上进⾏微调以得到视觉 - 语⾔ - 动作（VLA）模型是⼀种有前景的解决⽅案，但⽬前仍受到数据收集成本和泛化能⼒的限制。

上海智元新创技术有限公司官方今日发文称，北⼤携⼿智元机器⼈团队提出 OmniManip 架构，基于以对象为中⼼的 3D 交互基元，将 VLM 的高层次推理能力转化为机器⼈的低层次高精度动作。

针对⼤模型幻觉问题和真实环境操作的不确定性，OmniManip 引⼊了 VLM 规划和机器⼈执⾏的双闭环系统设计，实现了操作性能突破。目前项⽬主⻚与论⽂已上线，代码与测试平台即将开源。

从智元机器人官方获悉，OmniManip 的关键设计包括：

基于 VLM 的任务解析：利⽤ VLM 强⼤的常识推理能⼒，将任务分解为多个结构化阶段（Stages），每个阶段明确指定了主动物体（Active）、被动物体（Passive）和动作类型（Action）。

以物体为中⼼的交互基元作为空间约束：通过 3D 基座模型⽣成任务相关物体的 3D 模型和规范化空间（canonical space），使 VLM 能够直接在该空间中采样 3D 交互基元，作为 Action 的空间约束，从⽽优化求解出 Active 物体在 Passive 物体规范坐标系下的⽬标交互姿态。

闭环 VLM 规划：将⽬标交互姿态下的 Active / Passive 物体渲染成图像，由 VLM 评估与重采样，实现 VLM 对⾃身规划结果的闭环调整。

闭环机器⼈执⾏：通过物体 6D 姿态跟踪器实时更新 Active / Passive 物体的位姿，转换为机械臂末端执⾏器的操作轨迹，实现闭环执⾏。

此外，OmniManip 具备通⽤泛化能⼒，不受特定场景和物体限制。团队已将其应⽤于数字资产⾃动标注 / 合成管道，实现⼤规模的机器⼈轨迹⾃动采集。该研究团队将开源泛化操作⼤规模数据集和对应的仿真评测基准。

据IT之家此前报道，以“天才少年”身份加入华为的稚晖君于 2022 年底宣布离职，创业智元机器人。2024 年 9 月 3 日，智元机器人完成 A++++++ 轮融资，估值已超过 70 亿元，得到了包括北汽、上汽、比亚迪在内的国内汽车巨头支持。

目前，智元机器人量产的第 1000 台通用具身机器人已于本月（1 月 6 日）正式下线，其中包括 731 台双足人形机器人（远征 A2 / 灵犀 X1）和 269 台轮式通用机器人（远征 A2-D / A2-W）。

版权声明：本站内容除特别声明的原创文章之外，转载内容只为传递更多信息，并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题，请及时通过电子邮件或电话通知我们，以便迅速采取适当措施，避免给双方造成不必要的经济损失。联系电话：020-2204 2442,邮箱：Sales@greentest.com.cn。

上一篇: OpenAI推出首个智能体Operator
下一篇: DeepSeek V3和R1模型完成海光DCU适配并正式上线

为您精选

超精密机器人动态性能跃升的核心密码：先进电流电压检测赋能纳米级运动控···

机器人离不开精度。电流和电压检测技术的进步可显著提高机器人处理复杂任务的能力，同时加快转矩响应速度，从而实现更平滑的···

更新日期：2025-04-09 138 次
现代汽车将购买数万台波士顿动力机器人

4 月 7 日消息，波士顿动力4 月 3 日公告，该公司与现代汽车集团携手进入新的篇章，以提升制造能力，扩大合作以生产更多机器···

更新日期：2025-04-09 138 次
激光雷达厂商纷纷竞逐机器人赛道

1月10日讯（记者余佳欣邱思雨）随着科技浪潮席卷，全球瞩目的消费电子盛会CES 2025如火如荼地进行。在这场汇聚前沿创新的舞···

更新日期：2025-01-13 371 次
全国首批人形机器人具身智能标准发布,按下肢运动、上肢作业等分4个等级

10 月 29 日消息，据浦东发布消息，人形机器人及具身智能创新论坛昨日在上海召开，国家地方共建人形机器人创新中心联合行业内···

更新日期：2024-10-31 428 次
我国首台超轻量级人形机器人贡嘎一号发布,仅25公斤

10月28日消息，据报道，在成都科创生态岛，成都人形机器人创新中心全国首发了其最新研发成果——“贡嘎一号”（Konka-1）人形···

更新日期：2024-10-29 400 次