2025 年 2 月 26 日,初心资本在北京罗兰湖湖边茶空间举办了主题为「Beyond Imagination: 从心出发,让创新发生」的 CEO 分享活动。本次活动邀请多位初心被投企业的 CEO 莅临现场,分享他们的创业历程与行业洞察。
初心资本合伙人许旸洋分享了关于具身智能领域的最新观察与思考。作为宇树科技早期投资人,许旸洋从产业发展阶段、技术突破点、投资逻辑到未来畅想,为我们展示了一幅具身智能发展的清晰图景。
以下由演讲内容整理而成:
引言:机器人的能与不能
当我们看到宇树科技的机器人能够打功夫、跳起来飞腿、做出各种惟妙惟肖的功夫动作时,这个东西到底能干什么?是每个关注具身智能行业的人每天都在思考的问题,包括我自己。每当看到宇树发布的新内容,我都会去查看网友评论,看看大家有什么新的想法,也能看到很多人在争论这些技术的实际意义,给自己更多的启发。作为宇树科技的早期投资人,今天我想从投资视角,分享对这个领域的观察和 思考,以及具身智能行业的发展现状。
从春晚舞台看宇树科技的成长
回顾去年,初心 CEO 峰会邀请了宇树科技创始人王兴兴参加了“科技树下的对谈”。
而今年春晚上,宇树科技的 H1 人形机器人完成了一段高难度的表演——当红色手帕在空中飞起时,16 台机器人以毫米级的精度完成了三分钟的舞蹈。这背后是宇树 H1 机器人19个自由度的精密协作,以及强化学习算法在三个月训练周期内带来的突破。通过强化学习生成的动作舞蹈能够实时感知音乐节奏并调整韵律,这表明在运动能力方面,宇树已经走到了商业化前列。
作为宇树的早期投资人,我们见证了这家公司在王兴兴带领下,从一个偏科少年成长为全球四足机器人领域出货第一的标杆企业。回顾当初的投资决策,这其实是一个反共识的选择。虽然当时宇树在大学实验室领域已经出现了 PMF 信号,但整体商业化场景仍然非常模糊。我们看中的是宇树在硬件上的代差优势,以及它在科研场景实现了冷启动和初步 PMF。
2022 年开始的大模型浪潮,意外地成为了这个行业的催化剂。整个运动控制算法在基础运动方面的进化速度至少提升了十倍。这个案例对我们来说既有偶然性也有必然性——我们看到了宇树在硬件方面的代差和能力,但没有预料到AI 大模型意外成为催化剂,运动控制算法迭代速度提升 10 倍,AI 浪潮能将这家公司推到如此前沿的位置。今天,我们将发挥极致的想象力,共同探索具身智能领域的下一波浪潮。
具身智能的发展阶段
要理解具身智能行业所处的阶段,我们可以类比自动驾驶从 L1 到 L5 的发展过程。具身智能的进化核心在于物理硬件成本的降低、传感器精度的提升,以及在大数据积累和算力提升背景下实现的智能化突破。
从本质上看,具身智能需要四个核心要素才能完整发展:具有深度的感知能力(依靠传感器突破)、智能的决策系统(大脑操作系统)、泛化的交互能力(适应不同场景)以及灵巧的执行能力(小脑精确控制)。这些要素缺一不可,共同构成了具身智能的完整体系。 目前,具身智能的发展阶段可以清晰划分:
-
L1阶段:完全由人类操控:虽然宇树已经将机器人价格降至 9.99 万元以内,但这个价位的版本仍然只能通过遥控器操作,就像我们小时候玩的遥控赛车一样。机器人本身没有自主决策能力,完全依赖人类操控。
-
L2阶段:基础辅助智能+监督:这一阶段的代表是春晚表演的机器人或最近宇树展示的功夫机器人。它们能够实现预编程并独立运行设定好的操作,但仍需大量人类监督。当前具身智能整体正处于这一阶段,已经能展现出一定的自动化能力,但远未达到真正的智能水平。
-
L3阶段:具身智能加训练监督的能力的有限自主:这一阶段智能已初步出现雏形,机器人在绝大部分情况下可自动运行,如果类比到自动驾驶,如果有一辆华为 ADS3.0 以上的试驾系统的车,或者是理想的端到端的自动驾驶技术,就已经无限接近 L3
上个月,国外领先的 Figure AI 推出了一个令人震撼的演示:两个机器人实现协作,能够整理从超市带回的各种物品。其中一个场景特别引人注目——A 机器人从 B 机器人手中接过一件物品并放入冰箱,期间两个机器人甚至"对视"了一眼,仿佛拥有了意识。 虽然这可能是经过精心设计的展示,但机器人间的物品传递本身就是一个极其复杂的操作,这标志着具身智能正在从 L2 向 L3 阶段迈进。
具身智能的核心突破点
通过密切观察行业发展,我们发现具身智能正在经历四个关键的突破点,这些突破正协同推动整个行业向前发展:
- 技术复用红利
特斯拉的擎天柱机器人是技术复用的典型案例。它巧妙地使用了 FSD 算法,将端到端能力从自动驾驶领域无缝迁移到机器人领域。这种跨领域的技术复用为整个行业提供了宝贵的借鉴思路,证明了成熟领域的算法可以加速新兴领域的发展。对于众多具身智能公司而言,这种技术迁移路径具有极强的指导意义。
- 身体的觉醒
宇树科技在身体控制方面带来了革命性突破,特别是 AI 驱动的全身协调控制和 360 度全景感知能力。这不仅是技术上的进步,更代表了机器人"身体意识"的觉醒。通过精确控制多个自由度协同运动,机器人的动作不再机械僵硬,而是展现出流畅自然的特性,这是机器人迈向真正智能体的重要里程碑。
- 大脑的觉醒
Figure 等公司在机器人"大脑"领域取得了令人瞩目的进展,其思考方式与大语言模型越来越相似。就像《思考快与慢》一书所描述的人类双系统思考模式,机器人也开始发展系统一(负责高频率动作调整,需要毫秒级响应)和系统二(负责视觉识别和高级决策,相对较慢但更深入)的双系统思考架构。这套被称为 VLA 的技术很可能成为具身智能领域的下一个 LLM 级别的突破机会,它将彻底改变机器人的认知和决策能力。
- 数据的觉醒
尽管具身智能的数据采集仍然昂贵且不便,但行业已经开始重视数据积累的重要性。智元机器人建立了大规模数据训练场,通过手把手教导机器人完成任务来积累宝贵数据。宇树科技也开放分享了十万小时的运动数据集,研究人员甚至穿着两公斤重的 VR 设备进行数据收集。虽然整个领域的数据建设仍处于早期阶段,但 “具身智能版 ImageNet” 的出现可能只是时间问题,这将极大推动整个行业的发展速度。
具身智能投资逻辑与布局
比起那些从第一天就宣称要开发 L4 级别全自主机器人的团队,我们的投资逻辑更为务实:寻找具身智能领域的 L2 级别应用,在特定场景解决具体需求,构建数据飞轮,然后逐步扩展。这类似于自动驾驶领域中先从自动泊车等小场景切入的策略,更符合当前技术发展阶段,也更容易实现商业化突破。 我们预见的具身智能发展路径呈现明显的阶段性特征:
-
在早期阶段,机器人将专注于简单任务的执行,如工业生产线上的零散工序或简单服务场景。这些应用虽然看似基础,但能够帮助企业积累宝贵的实战数据和经验。
-
随着技术成熟,中期阶段将看到机器人渗透到整个流水线的智能化改造、更复杂的商业服务环境,甚至是危险的特种作业场景。这一阶段的机器人将展现出更强的环境适应能力和任务完成能力。
-
长期来看,随着机器人泛化能力的全面成熟,它们将最终进入最复杂也最具挑战性的家庭应用环境。这一阶段的机器人将能够理解复杂指令,适应多变环境,完成各种日常家务任务。
基于这一发展路径,我们的投资布局覆盖了多个关键层面:
-
硬件层:我们关注仿生执行器的创新,研究能否突破现有扭矩限制的人工肌肉材料,以及提升感知精度的 触觉传感器和电子皮肤技术。这些硬件突破将直接提升机器人的物理能力边界。
-
软件层:具身操作系统、具身大脑、仿真训练平台是我们重点关注的方向。特别是英伟达等公司开发的仿真训练系统,大幅提升了强化学习的训练效率,为机器人提供了虚拟的"成长环境"。
-
数据层:我们积极寻找建立具身智能领域大数据集的开拓者,以及专注于数据标注与收集的平台。这些项目可能成为行业的"具身版 Scale AI",为整个生态提供基础设施。
-
交互层:具身外壳、人机交互协作升级、变形可拆装机器人等创新形态同样值得关注。例如,一种机器人跟随人类行动,当人疲惫时转变为外骨骼辅助行走的设计,将带来全新的使用体验。
在团队选择方面,我们采取双轨策略:一方面重点追踪 MIT、Stanford 等顶级机器人实验室的前沿项目,掌握技术发展脉搏;另一方面寻找 AI+ 制造领域的跨界创新团队,这些团队往往能将理论突破转化为实际产品。未来两年,我们计划布局 3-5 个团队,构建自己在具身智能领域的完整生态。这一投资逻辑已经指导我们做出了实际决策。在 2024 年底,我们投资了以地平线为核心团队的维他动力。我们判断这支团队在自动驾驶领域积累的 AI 技术落地和规模化量产经验,能与机器人产品开发形成强有力的技术协同,将成为具身智能领域的重要玩家。
未来思考与畅想
回到"从四肢发达到头脑清醒"这一主题核心,我的判断是:当前机器人的运动能力已经达到了相当不错的水平,但"头脑"仍处于非常早期的阶段。将这两个问题拆开思考,前者本质上是硬件领域的挑战,后者则是软件领域亟待突破的方向。既然后者的路还很长,不妨先深入思考前者的可能性。
关于机器人物理能力的进化速度,我们可以借鉴其他技术领域的发展路径进行思考:半导体刚刚出现时,人们是如何预计制程进步速度及其加速度的?机器人的迭代到底是线性加速还是指数级爆发?从历史经验看:GPU 计算能力在 25 年间提升了惊人的 100 万倍,摩尔定律引领算力持续倍增;光刻机在约 20 年的周期内吞吐量提升了 20 倍,展现出稳定的技术进步曲线;而如果看科学突破,核武器技术在短短 7 年内实现了铀浓缩从 0.7% 到 90% 的飞跃…具身智能的发展轨迹将更接近哪一种模式?这是一个开放但极具战略意义的问题。
目前,机器人面临两个关键的物理限制,这些限制如同天花板一般制约着机器人能力的进一步提升:
-
执行器扭矩密度瓶颈:当前机器人执行器的扭矩密度仅为 3 牛米/千克,只有生物肌肉的 7.5%。这一数据意味着机器人的力量与灵活性受到严重制约。
-
能耗比困境:普通机器人行走的能耗高达 3000-4000 瓦,而人类走路只需 100-200 瓦,重体力活动也不过 500 瓦。这一差距使得机器人难以长时间独立工作,电池续航成为严重瓶颈。
如果这两个核心限制能够突破,机器人的物理能力将获得质的飞跃,为无数新应用场景打开大门。
结语
正如宇树科技创始人王兴兴所说:“每天保持学习的速度决定了你能走多远。” 对于具身智能领域,我们保持开放的思考和持续的学习,期待与更多创业者一起探索这个充满可能性的未来。