近日,在2025中关村论坛"人工智能前沿峰会"上,智源研究院推出两项突破性成果——跨平台智能协作系统RoboOS及开源认知中枢RoboBrain。
据现场技术白皮书显示,RoboBrain已集成超百亿参数的多模态大模型,支持对自然语言指令的语义解构与三维空间映射,在工业分拣、家庭服务等场景中实现意图理解准确率达92.7%。
该技术体系通过模块化架构实现多场景任务快速迁移部署与异构设备协同,标志着单体智能向群体智能的范式转变,为构建标准化智能体生态系统奠定技术基础。
实际上,在实体化智能领域,长周期复杂作业能力是机器人执行任务的关键瓶颈。
RoboBrain创新性地整合了任务解析、空间感知与运动规划三维度能力,将抽象语义指令转化为精确动作序列,显著提升远程操控效能。目前该系统已实现人类自然语言指令与多视角视觉数据的联合理解,可动态生成带实时反馈的行动方案,同步评估执行状态并预测运动轨迹。
技术层面,RoboBrain通过融合环境三维信息与目标对象状态,支持第一/第三人称视角的跨模态数据处理,可针对机械臂控制、移动导航等差异化任务生成最优路径规划,并在多场景迁移中保持稳定的泛化性能。
RoboOS系统采用"中枢-边缘"分层架构,通过智能资源调度与跨设备协同机制,为机器人提供可扩展的底层支撑平台。其创新之处在于实现认知模型(如多模态大模型)与执行模块(抓取、避障等)的即插即用,目前已适配松灵双机械臂、智元人形机器人等十余种智能终端。
依托多模态大模型技术积累,智源研究院正联合北京大学、中科院自动化所等学术机构,携手银河通用、宇树科技等产业伙伴,共建智能体创新联合实验室,重点突破数据闭环、模型训练及场景验证等关键技术,加速智能体技术的产业化落地进程。
从长远来看,人形机器人具有独特优势,其与人的构型相似,能更好适应社会基础设施,从海量互联网数据中学习人类技能,有利于具身智能和具身大脑模型的迭代。
不过,短期内,人形机器人在产业落地方面仍面临诸多挑战,很多机器人尚处于“能走”阶段,正向“走得快、走得稳”的目标努力。