本报记者 施 芳
她能够自主学习,还能做到“眼里有活”……走进北京通用人工智能研究院,记者看到展示屏上有一个名为“通通”的小女孩正在虚拟空间探索。
“作为首个由价值与因果驱动的通用智能体,‘通通’的诞生标志着在通用人工智能研究方面迈出了关键一步。”北京大学人工智能研究院院长朱松纯介绍。什么是通用智能体?在专家看来,通用智能体指的是具备自主的感知、认知、决策、执行、学习和社会协作能力,由价值驱动,能自主生成任务,解决各种非限定任务的智能体。
“与专注于某个领域的垂域智能体相比,通用智能体不只是某个领域的专家,而是一个多面手,能够展现出在多种任务和场景下的全面能力。”北京中关村学院院长刘铁岩说,它能独立完成复杂且有实际价值的任务,比如开发程序、撰写咨询报告、进行视觉设计等。
从专家“转身”成为多面手,重点在让智能体拥有更加聪明的“大脑”。
“现阶段,通用智能体研究形成了两条主要的技术路径。第一条是‘拼装’路线,将多个已训练好的模型和工具进行集成以解决复杂任务,这一过程就像是搭积木,将智能分布到整个框架之中。”刘铁岩介绍,第二条则是将推理、规划、工具调用等能力内化到基座模型中,从头训练模型进行整体优化,使模型可以自主地理解任务、规划方案、执行操作。
为了让“通通”真实地感知世界、实时地与人互动,研究人员还通过虚拟现实设备进入“通通”的世界,扮演她的家人或朋友。“通通”拥有较高的自由度,经常主动要求和研究人员一起搭积木、玩气球,甚至帮忙整理房间,在互动中学习人类的价值观和情感。这种高自由度和实时交互的要求,为团队带来了巨大的技术挑战,平台必须同时满足“物理准确”和“实时运行”的要求。
随着平台物理交互能力逐渐完善,研究人员随即开始更高阶的探索——培养“通通”的心智能力,让她主动理解并参与家务活动。一天深夜,实验室灯火通明,团队成员观察“通通”与“妈妈”的互动。当“妈妈”打开水龙头,水溅到台面上,“通通”主动拿起柔软的抹布认真擦拭……这不仅体现了物理仿真的准确性,更是通用智能体迈向具备常识和社会交互能力的重要一步。
除了聪明的“大脑”,通用智能体在不久的未来还将生长出灵活的“四肢”。“随着具身智能机器人产业逐渐成熟,未来的通用智能体还将拥有‘物理身体’并成为人们的助手,进入生活的方方面面。”朱松纯表示,这项技术有望应用于智能制造、康复疗养、特种任务等多种场景。
提升自主学习能力、加强多任务协同效率、设计强化学习中的奖励函数……刘铁岩认为,随着关键研发方向不断取得新突破,通用智能体在多任务处理方面,成本将进一步降低,完成度也会更高。
《 人民日报 》( 2025日 06 版)