产业深度期:机器人产业深度七

2024年人形机器人最具突破性的进展主要体现在具身智能领域:3月,Covariant发布端到端具身大模型 RFM-1,具身智能创业团队Sergey Levine 和 Chelsea Finn 创立Pi(Physical Intelligence),Figure Al发布接入0penAI GPT-4V的 Figure 01demo。4月,李飞飞创立 World Labs,致力于解决 AI 在三维空间感知和理解方面的难题。5月,特斯拉发布视频,展示 0ptimus 精准分拣特斯拉电动车 4680 电池的场景,使用完全端到端神经网络,只利用 2D摄像头视频和机载自传感器,直接生成关节控制序列,完全靠视觉辅助和人类示范进行训练。国内人形机器人产业硬件供应链优势明显,在具身智能、数据采集、人才领域的短板需要补齐。分层端到端是目前具身智能的主要路径。大模型分为非具身大模型(基础大模型)具身智能大模型(机器人大模型),区别是能否生成运动姿态。非具身大模型如 GPTSora 等,输入和输出的模态都是语言、图片和视频。具身智能大模型输入视觉、语言信号,输出三维物理世界的操作,其中,端到端的具身大模型对数据和算力要求高如 Tesla FSD、谷歌RT 模型;Figure AI等大多数公司都采取了分层端到端的具身大模型,一般分为三层:基础大模型(LLM或 VLM)、决策大模型、操作大模型,其中决策大模型以 ChatGPT for Robotics、谷歌 PaLM-E为代表,技术方向从 LLM 向强化学习(RL)演进,基于,的范式可以使模型能够在不同环境和任务中学习和适应实现更高级的决策能力。操作大模型根据决策大模型的输出执行具体动作,需要与机器人硬件深度集成,且必须通过数据采集来实现,技术方向从“MPC+WBC”向“RL+仿真”演进,MPC 更适合具有精确模型和短期优化目标的场景,RL更适用于不确定性高、需要长期学习和自适应的环境。在操作大模型领域,大多数厂商都刚起步。数据采集的主要方式:远程操作、仿真合成数据。互联网上各类文本、图像和视频数据集庞大,机器人的场景和交互有价值的数据量小,限制了AI模型在人形机器人上的泛化能力。特斯拉 Tesla Bot 开发团队使用人类的真实运动方式来训练机器人,英伟达推出 MimicGen 和 Robocasa 模型,通过真人的遥操作数据捕获,再通过生成合成运动数据和模拟环境,加速机器人技术的研发和应用。国内人形机器人创新中心加速建设人形机器人训练场。

具身智能估值逻辑:硬件、数据、模型、人才。硬件是一切的基础,如果没有自己的硬件,就无法根据算法和数据进行硬件的快速优化和修改。涉及数据的采集、组织管理以及与模型的闭环开发,需要有强大组织能力的团队,核心团队需要具备组织大规模工程师的经验;越来越多的算法陆续开源,开源算法可以提供基础的功能和技术但要实现高质量、高性能的人形机器人,需要专业的算法团队进行深入研究和开发

THE END
0.“大小脑”协同解锁具身智能机器人的多元本领具身智能机器人的泛化能力,主要来自它的“大脑”和“小脑”,也就是具身大模型,需要听懂指令,并带动本体具体实施行动和行为。同时,机器人会根据动态变化的环境自动调整工作方式,这是检验机器人实用性的重要标准。 目前,适用于各行业的泛化机器人正从实验室走到生活中,相关部门和企业正在推动它们逐步出现在工厂、jvzquC41eqtugwy/uvgukl3eev|og€x0eezw0lto1utpy6gqqm5jpmjz0jznnHnvgoejfF<266:7:=8:879799675(zsclpakfCf;9j7dej.fB56/6>c86=62936c@6e8d>46m7
1.何为“具身智能”理论1986年,机器人学家罗德尼 布鲁克斯提出“包容式架构”,摒弃传统人工智能对符号推理的依赖,主张智能应由身体与环境的实时交互自然涌现,确立了“感知—行动”闭环系统的可行性,成为具身智能的奠基性理念,并认为“真正的智能无法脱离身体存在,具身化是人工智能走向通用化的必经之路”。进入21世纪,人形机器人的突破进一步推动jvzq<84vjgus{7ugqrrf0lto0et0p:4424;02<6;1e:17<6/62:53B7;0jznn
2.“具身智能”到底是啥?(新媒视点)从物理形态角度看,具身智能可以“七十二变”,与不同的硬件本体结合。这个硬件可以是一个机器手臂、数控机床、四足机器狗、六翼无人机、轮式机器人,当然也可以是人形机器人。所以,智能机器人、人形机器人都可以看做是具身智能的分支。当前,业界普遍认为,人形机器人是智能机器人的最高形态。据此我们可以梳理出一条jvzq<84ue0vfqyqg0eun0ls1p4532;:1277:1l8673<8/=6453>897mvon
3.具身智能机器人产业从硬科技突破与场景化落地双向发力数据常被说成是具身智能发展的“燃料”。现在,一台机器人要想在真实场景里灵活完成任务,背后还是得靠大量高质量的数据来支撑。怎么才能又快又好地把这些数据积累起来?在天津,就有一座专门面向具身智能机器人的“数据工厂”,正在尝试给出答案。 这里是一个全国最大的拥有触觉数据的机器人数据采集工厂。在这些小格子jvzquC41ejooc7lqn4dqv3ep1ik1;5472?0v;5472?29h8345:2:B3ujvsm
4.走进更多生活场景“具身智能”机器人如何越来越聪慧多地政策资源加码 具身智能产业发展加速 目前,我国具身智能机器人产业正在从硬科技突破和场景化落地双向发力,不少地方都在政策和资源方面,积极布局推动。 在北京亦庄,以“国家地方共建具身智能机器人创新中心”为代表的创新平台,已集聚机器人生态企业300余家,产业链规模超百亿。 jvzquC41o0pw}m0ep5ry}}1zzr049772;5u49772;79a:;465?297mvo
5.“具身智能”到底是啥?从物理形态角度看,具身智能可以“七十二变”,与不同的硬件本体结合。这个硬件可以是一个机器手臂、数控机床、四足机器狗、六翼无人机、轮式机器人,当然也可以是人形机器人。所以,智能机器人、人形机器人都可以看做是具身智能的分支。当前,业界普遍认为,人形机器人是智能机器人的最高形态。据此我们可以梳理出一条关系链条:在概念范畴 jvzquC41o0xnn}3eqo4dp8ftvkimg89437?1
6.什么是具身智能具身智能(Embodied Intelligence)是人工智能与机器人学交叉的前沿领域,强调智能体通过身体与环境的动态交互实现自主学习和进化,其核心在于将感知、行动与认知深度融合‌。通俗地讲,就是机器人或者智能系统在物理环境中通过感知、行动和交互实现的智能能力。 jvzquC41dnuh0lxfp0tfv8|gkzooa=92;5>798ftvkimg8igvcomu86688717<;
7.具身智能:从理论到产业的“四重跃迁”如果说多模态感知为智能体打开了通往物理世界的大门,那么以大语言模型和基础模型为核心的决策系统,则为其装上了能够“自主思考”的智慧大脑,标志着机器人控制从遵循预设程序的自动化,走向理解复杂意图、进行自主规划的智能化。 大模型为具身智能提供了前所未有的认知架构,使其能够理解模糊的自然语言指令,并将其分解为jvzquC41yy}/loickn/exr1uvguklxi1tkt1qyon1}fd8sgyuJfvjnn0jznnHnf?;;6:B>(ukj>3:
8.走进更多生活场景“具身智能”机器人如何越来越聪慧多地政策资源加码 具身智能产业发展加速 目前,我国具身智能机器人产业正在从硬科技突破和场景化落地双向发力,不少地方都在政策和资源方面,积极布局推动。 在北京亦庄,以“国家地方共建具身智能机器人创新中心”为代表的创新平台,已集聚机器人生态企业300余家,产业链规模超百亿。 jvzquC41pg}t0mfjg0io1;54716:/:=13;?63>50jvsm
9.财说明白首次进入政府工作报告的“具身智能”是什么?“人形机器人虽然不会是具身智能最完美的载体和呈现方式,但如果说只能设计一款机器人的话,人形机器人应该就是最大公约数。”姚卯青说。 产业链不断延伸 资料图:上海某公司人形机器人产品上的灵巧手。中新经纬 薛宇飞 摄 既要有脑力,又要有身体的具身智能,所包含的产业十分丰富。 jvzquC41yy}/l€{kgy4dqv4lkpmxgr4jvor02<2281<2:::50unuou
10.一天吃透一条产业链:具身智能(AI+机器人)01产业链全景图02具身智01 产业链全景图02 具身智能简介具身智能,作为人工智能领域的前沿突破,旨在赋予智能系统物理实体,使其摆脱虚拟局限,像人类一样在现实世界行动、感知与学习。形象而言,它仿若拥有自主意识的机器人伙伴,与仅存于屏幕背后的智能助手截然不同。这类实体机器人装备多元“感jvzquC41zwkrk~3eqo5:8::;2:?9588529>4:A6