World Agents(世界智能体)是一个具身智能研发组织,旨在打造具备在物理世界具备类人能力的智能体,实现空间智能的“GPT时刻”。
World VLA 是一个基于 Transformer 架构的通用具身智能大模型,通过简单调参就能够搭载在任何端侧具身设备上,通过极小的样本示例(few shots)就能执行垂直场景任务。我们工程师团队来自于北京大学软微学院,哈尔滨工业大学,香港中文大学,南洋理工大学等多所国内外知名院校,70% 为硕博以上学历。
该模型使用了分层异步 MoE 端到端架构,在时间上解耦,能够实现快慢思考相结合。快思考的推理速率为100HZ ,慢思考的推理速率为 1HZ。
该模型能够感知到视野中出现目标物体在三维空间中的形状,位置,速度,距离等空间信息。并且能够在三维空间中根据任务进行空间推理。
该模型能够输出电机控制信号,控制具身设备本体进行行动。如机械臂,螺旋桨,轮子等。
模型参数为7B 能够部署在端侧设备,部署在 Nvidia Jetson AGX Orin 的推理效率能超过 100Token/s。
WorldVLA通过简单调参就能够搭载在任何端侧具身设备上,few shots就能执行垂直场景任务(无需进行大规模预训练),让具身设备具备在物理世界中的感知+规划+行动能力。通过共享思维链, Agents间协作能够高效的执行各项任务。
搭载了 World VLA 的具身智能体将成为 World Agents(世界智能体)具备在环境反馈中学习的能力,能够“认识世界,改变世界”。智能体能够通过输入物理世界中的 3D信息进行空间推理并做出动作反馈,并在该互动闭环中持续性学习,让自身适应环境以执行各项任务。
基于思维链共享的多智能体协作通过隐空间中的并行交流,显著提升了机器人协作的效率与能力。
隐空间交流减少了通信延迟,智能体通过共享思维链快速理解彼此意图,优化任务分工与协调。
系统具备容错能力,即使个别智能体失效,其他智能体仍能通过共享思维链推断缺失信息,维持稳定运行。
隐空间机制不依赖特定协议,可动态适应不同规模和任务需求,适用于工业机器人、无人驾驶等多种场景。这一框架为多智能体协作提供了高效、安全且可扩展的解决方案。
隐空间传递高维抽象表示,避免了敏感信息泄露,结合加密技术进一步保障数据安全。
吴国宁
郑勇彬
易振宇
李柏辉
黎日鹏
李富春
杨皓田
马鹏辉