人形机器人,自动驾驶“老炮”创业第二站
2025-01-23 23:27:28
  • 0
  • 0
  • 0

来源:洞见新研社


老炮不死,创业不止。

造一台人形机器人,或许正在成为2025年最炙手可热的事情。

从去年第四季度开始,伴随着大模型应用的深入,具身智能概念被点燃,其中最鲜明的一个特点是,大量自动驾驶大佬的转行加入。

随便说几个比较有分量的,智驾芯片上市公司地平线创始成员、副总裁、前软件平台产品线总裁余轶南(博士)联手理想汽车前智能驾驶产品总监赵哲伦成立具身智能领域初创公司维他动力;

百度集团资深副总裁、CEO助理、原百度智能驾驶事业群组(IDG)负责人李震宇加盟具身智能赛道初创公司它石智航;

前小米其次自动驾驶产品技术负责人和量产负责人刘方成立具身智能概念公司阿米奥机器人……

左手造车,右手造人,自动驾驶“老炮”们的创业没有止境。

01车企也来分羹

事实上,除了上文提到了几位近期涉足具身智能行业的前自动驾驶从业者之外,还有不少自动驾驶行业重量级大佬在很早之前就已经入局。

原文远知行COO张力2023年6月离职后不到半年即加入人形机器人公司逐际动力,担任联合创始人兼COO,全面负责公司在全球范围内的战略规划、渠道拓展、项目实施、市场营销以及政府关系事务。

曾在Waymo和Momenta担任重要技术职位的高继扬2023年5月创立了具身智能公司星海图(StarSeer AI),并担任CEO。公司成立后不就即获得了由IDG资本、BV百度风投等在内的顶级投资机构千万级美元的投资。

2023年4月,曾在小鹏汽车和OPPO担任首席科学家的郭彦东创立智平方(Shenzhen AI Square)科技有限公司,担任创始人兼首席执行官,如今公司自研的多模态大模型——AI2R Brain,能够驱动Alpha Bot机器人在多样化的场景中实现高精度感知与自然交互。

此外,还有其他一些转行到具身智能赛道的自动驾驶精英。

孙兆治:珞博智能高管,曾任小鹏机器人产品设计负责人,滴滴出行的造车项目中担任产品负责人。

王凡:原纵目科技CTO,后加入北斗智联科技有限公司,出任CTO。

王荣兴:Momenta负责产品工程研发的副总裁,离职后进行大模型创业,2023年6月创立万仞AI。

陈俊波:菜鸟网络“E.T.物流实验室”无人车算法负责人,离开阿里之后,与前阿里机器人CEO谷祖林等人共同创办了“有鹿机器人”,进军户外清洁机器人领域。

肖军:前京东集团副总裁、京东物流X事业部总裁,选择了仓储机器人领域进行创业,创办天下先智创机器人,并获得了来自零一创投、经纬创投、红点中国的2亿元投资。‍

一个有意思的现象,自动驾驶“老炮”们转入具身智能赛道扎堆创业,车企们也不甘落后,也集体布局具身智能。

去年12月26日,广汽集团发布自主研发的第三代具身智能人形机器人——GoMate是车企布局具身智能赛道的最新动态。

GoMate是一款全尺寸的轮足人形机器人,全身拥有38个自由度。广汽集团机器人研发团队负责人张爱民博士表示,广汽集团计划2025年实现自研零部件批量生产,并率先在广汽传祺、埃安等主机厂车间生产线和产业园区开展整机示范应用;2026年实现整机小批量生产,并逐步扩展至大规模量产。

稍早前的2024理想AI Talk中,理想汽车CEO李想回应是否会做人形机器人时表示,概率上肯定是100%,李想还强调,理想是一家人工智能企业,要做的不是汽车的智能化,而是人工智能的汽车化,并将推动人工智能普惠到每一个家庭。

11月6日的小鹏汽车“AI科技日”上,小鹏汽车也亮相了全新一代人形机器人“Iron艾伦”,该款人形机器人已经进入小鹏汽车广州工厂进行了小鹏P7+车型的生产实训,未来将会聚焦在工厂和线下门店等场景。

除了亲自下场之外,还有车企通过联合合作伙伴或者投资的形式来布局具身智能。

奇瑞汽车就联手AI公司Aimoga共同研发了人形机器人Mornine,进军人形机器人赛道;上汽创投则参与了人形机器人本体企业智元机器人的A3轮战略融资,上汽集团以投资机器人企业的形式切入人形机器人领域。

02相同的技术内核

造车和造人两条赛道之所以能够随意融合,很大程度还是源于技术的同源,即都是基于对环境的感知和交互,对外界信息进行计算后,指导机器进行运动的过程,从本质来看,两者都需要具有智慧的大脑,只是外在表现的物理形体的不同。

原特斯拉自动驾驶部门的负责人Andrej Karpathy近期接受访谈时也表示:汽车也是机器人,在从汽车到人形机器人Optimus的技术转移中,工作量其实不大,而且工具都是现成的,只是从汽车转移到机器人上,系统被重新配置,但本质上还是相同的。

虽然技术同源,然而在实际应用层面,自动驾驶和具身智能还是要面对不同类型、不同等级的数据处理需求和计算能力。

从计算规模来看,自动驾驶的高速场景较多,并且和安全关系紧密,所以需要较高算力的芯片支持实时计算;而智能机器人,在现阶段通常在相对低速环境中工作,相应的计算需求会降低。

地平线联合创始人&CTO黄畅曾对自动驾驶领域行业的基础算力进行过说明,L2级需10 TOPS左右;L2+则需要几十TOPS;L3需要100 TOPS以上;L4需要1000 TOPS,要充分满足L4级要求,甚至需要几千个TOPS。

然而对机器人大模型来说,以能够推理7B大模型的单张NVIDIA A100举例,其TOPS峰值达1248,因而,建立云边端协同的数字算力环境,对保障各类机器人的感知、计算和处理能力至关重要。

在运动控制的维度上,自动驾驶只需要控制2D维度的运动,而人形机器人仅手部的抓取这一项,就需要模仿生物体多达20个以上的关节运动,这对计算和控制提出了更高的挑战。

此外,自动驾驶面对的数据相对“标准化“,大多是车道线、信号灯等在一定规则内运行的内容,机器人不同,它们工作的场景复杂多变,这就导致数据种类也会相应变多且发散,这同样对计算能力提出了一定的要求。

以当前已经有规模应用的酒店服务机器人为例,虽然工程师们通过强化机器人的地图构建能力,应用VSLAM技术进行机器识别并标定禁行线,强化避障算法和传感等方式,已经能够让机器人极可能的避免与行人发生冲突,并能更好、更灵敏地识别地面上障碍物。

现在,酒店场景下至少有三种环境的变化会对机器人的运行产生影响。

物理环境方面,因清洗地毯、会议设备设施、装饰品摆放等地面环境的改变,或造成机器人识别故障,使得机器人路径识别错误;

社会环境方面,在电梯中与人或其他发生优先乘坐电梯的纠纷;

数字环境方面,酒店组网方式让机器人在电梯或角落位置出现的通信失败等等。

马斯克曾表示,特斯拉现有的 FSD 技术,可以在未来和机器人模块进行一定程度的算法复用,但仍然只是在“底层模块”中进行,“更高阶的计算和场景还是需要针对机器人平台进行专项开发。”

李想也说,如果我们连L4级跟自动驾驶的汽车都解决不了,怎么去解决更复杂的?因为车是个无接触机器人,而且道路是标准化的,包括道路上的提示和参与者都是标准化的,而且每个人都受交通规则的 训练,我觉得这已经是最简单的机器人了,如果车没法实现,其实其他人工智能机器人,还是非常有限的。 

03把价格打下来

在具身智能的竞争中,商业化是创业者们面对的共同难题,特斯拉去年的股东大会上,马斯克首次谈到人形机器人初创公司,“原型很容易,批量生产很难,甚至不可能”,其中的原因不光在于软件算法和硬件传感器等,更在于生产和工程能力,说的直白一些,就是生产出来的产品有合适的价格,能够被用户所接受。

我们先来看软件算法。

从底层算法模型来看,具身智能的软件可以分为大脑和小脑。

大脑负责感知并模拟人类的思维决策过程,小脑则是模仿生物进行复杂的运动控制。

大脑算法中的环境感知和理解和自动驾驶一样,都主要基于机器视觉,发展已经比较成熟了,目前很多具身智能创业公司多依托科技大厂的多模态大模型赋能。

比如,Figure AI旗下Figure 02和1X Technologies旗下EVE、NEO均接入OpenAl端到端的大语言-视觉(VLM)模型;

乐聚机器人旗下“夸父”接入华为盘古具身智能大模型;

优必选旗下walker S接入百度文心一言大模型;

星动纪元旗下“小星”系列接入阿里通义千问和智谱清言两家大模型;

智元机器人多模态通用大模型用的是讯飞星火大模型(操作大模型自研)等。

这些大厂的大模型在基础能力上都有不错的表现,也各有自己擅长的长板,在这方面,创业公司们的起点大致相同,差异不大。

可是在运动控制的小脑算法方面,各家就显示出不同的技术路径。

最典型的案例,人形机器人的控制算法发展,已经经历了基于模型的控制算法(LIPM+ZMP)、动态模型控制和最优控制算法(MPC+WBC)、模拟学习+强化学习(IL+RL)等几个阶段。

目前的主流是MPC+WBC方案,但IL+RL路线被行业普遍认为是未来主流的控制方式,但由于该方案经过创业公司们的无数次尝试后,进入到技术瓶颈期,且在短期内难以突破,这也是诸多人形机器人本体公司推出轮式仿生机器人而不是双足人形机器人的主要原因。

硬件方面则主要包括芯片、传感器、执行运动控制操作的“手”“脚”等。

目前算力芯片在人形机器人身上的成本占比大概是几十分之一,地平线分拆出来的芯片及解决方案厂商地瓜机器人开发者生态负责人胡春旭在接受媒体采访时表示,在不同类型的机器人中,芯片成本占比差别不大,大约在7%~10%之间,一台人形机器人均价50万的情况下,芯片这一层的成本不超过1万元。不过,未来在人形机器人电机等部件成本下行的情况下,芯片部分成本占比预计有所增加。

相比之下,运动控制与执行部分的“手”就要贵很多。

由于手需要执行抓取、放置、推拉等动作,对操作精度的要求也很高,上肢操作的自由度自然就相应增加了。

有专业人士表示,人形机器人不算上“手”,全身自由度可能在27个左右,然而去年11月底,特斯拉展示的Optimus人形机器人能用手接住网球并放下,动作灵活,其采用的灵巧手自由度比前一代增加了11个,达到22个。

在行业对高自由度形成共识的大背景下,做灵巧的手相当于再造一个机器人,这也是“手”的价格居高不下的原因之一。

星动纪元联合创始人席悦曾介绍过自家产品,“手占人形机器人全身成本大概1/5到1/4”,其中的主要原因在于现在的触觉传感器还很贵,甚至比整只不带触觉传感器的“手”更贵,“一只手用到的触觉传感器可能要大几千元,一只手上的触觉传感器只有在占手的成本10%左右的时候才可能大规模应用”,有专业人士如是表示。

从上文的分析中不难看出,就像无人车一样,从最开始的几十、上百万一辆,到逐渐下降到20万左右的Robotaxi,甚至10万以下的无人配送车,自动驾驶的普及与渗透这才加快了速度。

对于具身智能创业企业们来说,如何将机器人的价格打下来,将是他们在未来竞争中能够占据主动的关键。


 
最新文章
相关阅读