World Agents

World Agents(世界智能体)是一个具身智能研发组织,旨在打造具备在物理世界具备类人能力的智能体,实现空间智能的“GPT时刻”。

image

我们在做什么?

皆在打造具备在物理世界具备类人能力的智能体,
实现空间智能的“GPT时刻”。

     World VLA 是一个基于 Transformer 架构的通用具身智能大模型,通过简单调参就能够搭载在任何端侧具身设备上,通过极小的样本示例(few shots)就能执行垂直场景任务。我们工程师团队来自于北京大学软微学院,哈尔滨工业大学,香港中文大学,南洋理工大学等多所国内外知名院校,70% 为硕博以上学历。

image

它是怎么工作的呢?

World VLA具备
智能大模型

1

分层异步 MoE 端到端架构

该模型使用了分层异步 MoE 端到端架构,在时间上解耦,能够实现快慢思考相结合。快思考的推理速率为100HZ ,慢思考的推理速率为 1HZ。

2

3D 物理世界中的感知+推理能力

该模型能够感知到视野中出现目标物体在三维空间中的形状,位置,速度,距离等空间信息。并且能够在三维空间中根据任务进行空间推理。

3

动作执行能力

该模型能够输出电机控制信号,控制具身设备本体进行行动。如机械臂,螺旋桨,轮子等。

4

端侧运行

模型参数为7B 能够部署在端侧设备,部署在 Nvidia Jetson AGX Orin 的推理效率能超过 100Token/s。

     WorldVLA通过简单调参就能够搭载在任何端侧具身设备上,few shots就能执行垂直场景任务(无需进行大规模预训练),让具身设备具备在物理世界中的感知+规划+行动能力。通过共享思维链, Agents间协作能够高效的执行各项任务。

技术细节

World Agents(世界智能体)的环境反馈闭环

     搭载了 World VLA 的具身智能体将成为 World Agents(世界智能体)具备在环境反馈中学习的能力,能够“认识世界,改变世界”。智能体能够通过输入物理世界中的 3D信息进行空间推理并做出动作反馈,并在该互动闭环中持续性学习,让自身适应环境以执行各项任务。

image
image

共享思维链多智能体协作

     基于思维链共享的多智能体协作通过隐空间中的并行交流,显著提升了机器人协作的效率与能力。

1

高效性

隐空间交流减少了通信延迟,智能体通过共享思维链快速理解彼此意图,优化任务分工与协调。

2

鲁棒性

系统具备容错能力,即使个别智能体失效,其他智能体仍能通过共享思维链推断缺失信息,维持稳定运行。

3

灵活可扩展

隐空间机制不依赖特定协议,可动态适应不同规模和任务需求,适用于工业机器人、无人驾驶等多种场景。这一框架为多智能体协作提供了高效、安全且可扩展的解决方案。

4

安全性

隐空间传递高维抽象表示,避免了敏感信息泄露,结合加密技术进一步保障数据安全。

image

研发团队

我们工程师团队来自于北京大学(软微学院),香港中文大学(深圳研究院),中科院(计算所)等多所国内外知名院校,70% 为硕博以上学历。
在ICRA,IROS,CVPR 等顶会期刊发表过数篇论文。

吴国宁

郑勇彬

易振宇

李柏辉

黎日鹏

李富春

杨皓田

马鹏辉

image

战略&生态合作

战略&生态合作

image

加入我们

我们持续性的招聘对具身智能感兴趣的小伙伴加入我们

加入我们