政府工作报告首提的“具身智能”,中国正走在世界前列

“具身智能”和“智能机器人”首次出现在了今年的政府工作报告中。

近年来,人工智能的迅猛发展推动了大模型与机器人技术的深度融合,显著提升了机器人的自主决策能力和环境交互水平。从能够负重登山、执行垃圾清运任务的“机器狗”,到进入汽车制造企业完成零部件安装和高精度操作的人形机器人,具身智能机器人已然进入大众视野。

平稳行走、连续奔跑、抓取物品……国家地方共建具身智能机器人创新中心(以下简称“国创中心”)展示大厅内,全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”正自主完成一系列动作。

“人轻而易举完成的动作,对于机器人来说并不容易,这通常涉及精确的环境感知、决策制定以及运动控制等多项技术。”国创中心品牌公关负责人魏嘉星对《中国报道》记者表示。

行业关键共性技术取得显著进展

回顾机器人的发展历程,机器人经历了从“机械自动化”到“环境感知”再到“认知决策”的智能化演进。

早在20世纪50年代,第一代工业机器人已经实现了依靠预编程就能完成任务指令。20世纪90年代,麻省理工学院(MIT)的Genghis六足仿生机器人可以依靠传感器反馈实现自适应行走。进入21世纪后,强化学习正式用于机器人控制。深度学习、大语言模型与多模态融合,机器人具备了“理解指令—规划任务—执行动作”的能力,并进一步向通用场景迈进。

“能够像人类一样与物理世界产生交互的智能体”是受访专家们对于具身智能机器人达成的普遍共识,其中人形机器人被认为是具身智能的最佳载体。

传统工业机器人作为智能化水平较低的机器人早已在制造业领域广泛应用,其本质是“固定程序”与“机械臂本体”的组合,而具身智能机器人则在于其“多模态感知”与“大脑决策”的进一步迭代。

形象来说,假设需要机器人将两种水果放入对应颜色的盘子中,传统机器人会严格按照预设路径执行任务,一旦水果位置被移动,它就无法感知变化,仍按照预设指令完成任务,最终导致任务失败。而具身智能机器人则能够实时观察周围的环境,随即调整自己的行为,重新规划路径并完成任务。

2024年世界机器人大会上发布的《具身智能产业发展报告(2024年)》中提到,具身智能的技术体系可分为“感知—决策—行动—反馈”4个模块,而其核心三要素包括本体、环境和智能。

魏嘉星指出,具身智能机器人由“大脑”(智能)、“小脑”(具身操作+具身运控)和“硬件身体”三部分构成,围绕这三部分展开的技术攻关被认为是当前行业的关键共性技术,这些技术的突破是推动具身智能产业发展的关键动力。

“从当前‘大脑’‘小脑’和‘身体’三大技术的发展水平来看,‘大脑’的进展是显著的。”巨深智能科技董事长、科大讯飞前高级副总裁杜兰向《中国报道》记者分析道,从2022年ChatGPT的横空出世到如今的DeepSeek,大语言模型的飞速发展为具身智能注入了全新动力,推动着机器人从传统的规则控制模式向自主学习模式转变。

杜兰进一步指出,大模型对世界理解不断加深的同时,也间接推动了“小脑”技术的进化,也就是机器人运动控制系统的进步。当前,通过引入机器学习技术后,运动控制系统能实时分析环境并自动调整参数。现在的机器人已经能够更加精准地感知、采集和理解周围的环境信息,实时构建更高精度的空间模型。

聪明的大脑还要搭配发达的四肢。基于中国工业制造和产业链优势,在核心零部件以及材料方面的本体技术更是发展迅速。北京工业大学教授、北京智同精密传动科技有限责任公司首席科学家张跃明告诉《中国报道》记者:“减速机是连接机器人动力源和执行机构的中间装置,相当于人体的‘关节’,主要用于帮助机器人完成高精度的控制动作。以RV减速机为例,原先这部分基本被日本垄断,但如今我们已经能够基本实现国产化。不管是内部齿轮的精度和组合的创新设计,还是耐用性上都有了提升。”

受访专家们纷纷表示,整体来看,中国的具身智能机器人无论是在技术还是产业方面都正走在世界前列。

“大小脑”智能化水平不足是主要瓶颈

仅仅3年时间,ChatGPT已迭代至4.0版本;而DeepSeek上线一个月便成为全球用户增速最快的AI应用。尽管AI技术突飞猛进,但具身智能机器人并未迎来属于它的“iPhone”时刻。

“即便现在将最聪明的大模型装入机器人的大脑,它仍难以适应复杂多变的环境,无法立即解决现实中的实际问题。”杜兰说,具身智能机器人“大小脑”智能化水平不足是当前技术发展进程中面临的主要瓶颈。

“近年来,大模型虽进展迅速,但其本质仍是‘语言’层面的智能,与‘世界的语言’有本质区别。具身智能机器人需要的是世界模型,其不仅包含语言知识,还须具备空间感知能力、交互能力以及在复杂环境中的推理能力。”快思慢想研究院院长、原商汤智能产业研究院创始院长田丰告诉《中国报道》记者,任何一方面能力出现短板都会限制具身智能机器人的发展。

人类对于机器人的期待从不止于能跑、能跳、炒菜做饭等,问题并非出在能不能上,而在好不好上。干活不够迅速、不够敏捷、不够灵活才是普遍问题。

“人能够自如控制身体,得益于四肢和躯干的标准化结构。然而,具身智能机器人形态多样,包括两足人形、四足、六足以及轮式机器人,本质上它们属于非标准化结构,这就对机器人的运动控制系统提出了更高要求。”田丰指出,这需要机器人在物理世界中进行大量测试,尤其是在工业、农业、服务业等实际场景中的不断验证。高质量数据与专业场景的匮乏是具身智能机器人不够聪明的核心痛点。

未形成标准化模块则是具身智能机器人在硬件层面的一大技术难题。田丰告诉记者,具身智能机器人领域还未实现硬件的标准化和通用化。就硬件设计来看,仍缺乏统一的模块体系,不同厂家的产品之间未能形成类似手机或PC的标准化生态,尽管已有部分模块化尝试,但这些模块多为非标准化设计。

如今,中央厨房机器人、工业重型机器人和家庭机器人等不同类型的机器人,其硬件模块之间仍无法通用。此外,行业内也尚未找到最优的硬件架构标准。

张跃明认为,以人形机器人为代表的具身智能机器人本体制造上也存在刚性过大、能量利用率低等问题,与人类运动相比有较大差距。此外,由于应用场景有限、需求不明确,人形机器人模型数量少,结构创新也明显不足。

“实际上,具身智能还没有迈过通用智能的门槛,具身智能机器人也面临同样的问题。未来,在标准化基础上允许微创新,同时确保整体设计的通用性和泛化性,将是机器人硬件发展的重要方向。”田丰补充道。

机器人“修炼秘籍”:高质量数据集

位于国创中心三层和四层的采集场内,一位工程师正通过操作机械臂在虚拟环境中模拟机器人抓取物品的动作,以此来捕捉机器人每个关节用力时传感器的角度、速度、角速度等动作数据。另一位工程师则正通过远程遥控设备指导机器人进行真机训练,完成相应动作的学习和数据抓取。

国创中心三层和四层的采集场内,一位工程师正通过操作机械臂在虚拟环境中模拟机器人抓取物品的动作。(图/受访者供图)

“这里就像一个‘学校’,具身智能机器人在不同场景中‘上课’,通过学习告诉机器人怎样做是对的,怎么做会更好,在实践中锻炼机器人的各项技能。”魏嘉星说。

魏嘉星认为,机器人想要变得智能,离不开持续学习与训练。在人类为主体的结构性社会中,存在众多场景和角色,要求机器人至少掌握一定比例的特定技能,并具备一定的泛化能力才能全面胜任各种任务。

自动驾驶技术的快速发展,也正是得益于车厂、自动驾驶公司以及实际道路上海量的测试数据积累。工业机器人也已广泛应用于工厂,如机械臂、四足机器人等,它们在专业场景中积累了丰富的数据,为智能化奠定了基础。

获取高质量和多样化的智能体与复杂物理空间进行交互的数据集,尤其是真实物理世界数据,对提升具身智能机器人的泛化能力和通用性,实现机器人在全场景下的灵活应对至关重要。

据介绍,国创中心数据采集场为机器人搭建了工业、家庭、高危巡检、办公及零售等多种应用场景。这些场景伴随着多样化的任务需求,例如打扫卫生(如扫地、洗碗、倒茶)和物料分拣等。此外,采集场内还采用了包括单臂机器人、双臂机器人、人形机器人等多种形态的机器人本体进行数据采集,以满足不同机器人在不同场景下的特定任务要求。

当前,国创中心数据采集涵盖6类本体七大典型场景,日产数据已达10TB。“国创中心不仅自主进行数据采集,还引领整个行业制定相关标准,明确哪些数据是高质量、可用且适合行业发展的。搭建起生态,让大家真正把数据用起来。此外,我们在不断攻克关键共性技术问题的同时,也在不断深入研究各个细分领域进行场景落地的探索示范。”魏嘉星说。

国创中心数据采集场为机器人搭建了工业、家庭、高危巡检、办公及零售等多种应用场景。(图/受访者供图)

据了解,去年年底,全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目AgiBot World 发布。参与这一数据集项目的香港大学助理教授李弘扬在接受媒体采访时提到,“我们还希望通过数据集推动硬件形态逐步收敛,并将其应用于灵巧手、视触觉系统以及轮式机器人上”。

李弘扬认为,具身智能的终极发展方向在材料科学。这不仅关乎视触觉等传感器在稳定性和可靠性的提升,还涉及下一代硬件的研发与设计阶段,要求对各类传感器形态进行前瞻性的考量与规划。硬件的创新将带来全新的应用场景,这些场景能够进一步赋能机器人技术发展。

近期,中国科学技术大学研发了一款类似章鱼触手的新型螺旋软体机器人,该机器人依据多种生物柔性肢体(如章鱼触手)的原理设计而成,具备小到足以抓取蚂蚁、大到提起水桶的多功能性。在多尺度、多材质、多维度和协作交互等拓展应用场景中,这些创新的柔性机械构造以及先进的驱动技术,极大地增强了机器人在应对复杂作业场景时的灵活表现与安全性能。

“只有软硬件协同进化,具身智能行业才能真正取得突破性进展。”李弘扬说。

THE END
0.“大小脑”协同解锁具身智能机器人的多元本领具身智能机器人的泛化能力,主要来自它的“大脑”和“小脑”,也就是具身大模型,需要听懂指令,并带动本体具体实施行动和行为。同时,机器人会根据动态变化的环境自动调整工作方式,这是检验机器人实用性的重要标准。 目前,适用于各行业的泛化机器人正从实验室走到生活中,相关部门和企业正在推动它们逐步出现在工厂、jvzquC41eqtugwy/uvgukl3eev|og€x0eezw0lto1utpy6gqqm5jpmjz0jznnHnvgoejfF<266:7:=8:879799675(zsclpakfCf;9j7dej.fB56/6>c86=62936c@6e8d>46m7
1.何为“具身智能”理论1986年,机器人学家罗德尼 布鲁克斯提出“包容式架构”,摒弃传统人工智能对符号推理的依赖,主张智能应由身体与环境的实时交互自然涌现,确立了“感知—行动”闭环系统的可行性,成为具身智能的奠基性理念,并认为“真正的智能无法脱离身体存在,具身化是人工智能走向通用化的必经之路”。进入21世纪,人形机器人的突破进一步推动jvzq<84vjgus{7ugqrrf0lto0et0p:4424;02<6;1e:17<6/62:53B7;0jznn
2.“具身智能”到底是啥?(新媒视点)从物理形态角度看,具身智能可以“七十二变”,与不同的硬件本体结合。这个硬件可以是一个机器手臂、数控机床、四足机器狗、六翼无人机、轮式机器人,当然也可以是人形机器人。所以,智能机器人、人形机器人都可以看做是具身智能的分支。当前,业界普遍认为,人形机器人是智能机器人的最高形态。据此我们可以梳理出一条jvzq<84ue0vfqyqg0eun0ls1p4532;:1277:1l8673<8/=6453>897mvon
3.具身智能机器人产业从硬科技突破与场景化落地双向发力数据常被说成是具身智能发展的“燃料”。现在,一台机器人要想在真实场景里灵活完成任务,背后还是得靠大量高质量的数据来支撑。怎么才能又快又好地把这些数据积累起来?在天津,就有一座专门面向具身智能机器人的“数据工厂”,正在尝试给出答案。 这里是一个全国最大的拥有触觉数据的机器人数据采集工厂。在这些小格子jvzquC41ejooc7lqn4dqv3ep1ik1;5472?0v;5472?29h8345:2:B3ujvsm
4.走进更多生活场景“具身智能”机器人如何越来越聪慧多地政策资源加码 具身智能产业发展加速 目前,我国具身智能机器人产业正在从硬科技突破和场景化落地双向发力,不少地方都在政策和资源方面,积极布局推动。 在北京亦庄,以“国家地方共建具身智能机器人创新中心”为代表的创新平台,已集聚机器人生态企业300余家,产业链规模超百亿。 jvzquC41o0pw}m0ep5ry}}1zzr049772;5u49772;79a:;465?297mvo
5.“具身智能”到底是啥?从物理形态角度看,具身智能可以“七十二变”,与不同的硬件本体结合。这个硬件可以是一个机器手臂、数控机床、四足机器狗、六翼无人机、轮式机器人,当然也可以是人形机器人。所以,智能机器人、人形机器人都可以看做是具身智能的分支。当前,业界普遍认为,人形机器人是智能机器人的最高形态。据此我们可以梳理出一条关系链条:在概念范畴 jvzquC41o0xnn}3eqo4dp8ftvkimg89437?1
6.什么是具身智能具身智能(Embodied Intelligence)是人工智能与机器人学交叉的前沿领域,强调智能体通过身体与环境的动态交互实现自主学习和进化,其核心在于将感知、行动与认知深度融合‌。通俗地讲,就是机器人或者智能系统在物理环境中通过感知、行动和交互实现的智能能力。 jvzquC41dnuh0lxfp0tfv8|gkzooa=92;5>798ftvkimg8igvcomu86688717<;
7.具身智能:从理论到产业的“四重跃迁”如果说多模态感知为智能体打开了通往物理世界的大门,那么以大语言模型和基础模型为核心的决策系统,则为其装上了能够“自主思考”的智慧大脑,标志着机器人控制从遵循预设程序的自动化,走向理解复杂意图、进行自主规划的智能化。 大模型为具身智能提供了前所未有的认知架构,使其能够理解模糊的自然语言指令,并将其分解为jvzquC41yy}/loickn/exr1uvguklxi1tkt1qyon1}fd8sgyuJfvjnn0jznnHnf?;;6:B>(ukj>3:
8.走进更多生活场景“具身智能”机器人如何越来越聪慧多地政策资源加码 具身智能产业发展加速 目前,我国具身智能机器人产业正在从硬科技突破和场景化落地双向发力,不少地方都在政策和资源方面,积极布局推动。 在北京亦庄,以“国家地方共建具身智能机器人创新中心”为代表的创新平台,已集聚机器人生态企业300余家,产业链规模超百亿。 jvzquC41pg}t0mfjg0io1;54716:/:=13;?63>50jvsm
9.财说明白首次进入政府工作报告的“具身智能”是什么?“人形机器人虽然不会是具身智能最完美的载体和呈现方式,但如果说只能设计一款机器人的话,人形机器人应该就是最大公约数。”姚卯青说。 产业链不断延伸 资料图:上海某公司人形机器人产品上的灵巧手。中新经纬 薛宇飞 摄 既要有脑力,又要有身体的具身智能,所包含的产业十分丰富。 jvzquC41yy}/l€{kgy4dqv4lkpmxgr4jvor02<2281<2:::50unuou
10.一天吃透一条产业链:具身智能(AI+机器人)01产业链全景图02具身智01 产业链全景图02 具身智能简介具身智能,作为人工智能领域的前沿突破,旨在赋予智能系统物理实体,使其摆脱虚拟局限,像人类一样在现实世界行动、感知与学习。形象而言,它仿若拥有自主意识的机器人伙伴,与仅存于屏幕背后的智能助手截然不同。这类实体机器人装备多元“感jvzquC41zwkrk~3eqo5:8::;2:?9588529>4:A6