2024年,虽然大模型掀起的“具身智能”创业潮还没多久,但在「智能涌现」访谈过数十家机器人公司后,我们发现一条圈子里的“鄙视链”。
“搞软件的,鄙视搞硬件的,搞大模型的,看不起强化学习的”,多位行业人士给出了类似的观察。
认知的不同,决定了机器人创业者的入局姿势。
英诺天使基金合伙人王晟向智能涌现表示,国内涌现出的几百家机器人创业公司中,大概有三类基因:
一是原来机器人出身的创始团队,更关注机器人硬件能力,主要围绕控制和电机。本体派的核心是机器人本体(人形/四足狗),其次是机器人的臂或关节。
二是软件背景的团队,更关注机器人的智能化和泛化能力,但“软”还可以进一步细分:
一批是上一波AI热潮中的创业者,转型至机器人领域,比如CV、强化学习;另一批则是真正大模型背景的玩家,这波人更少,处于鄙视链顶端。
“看不上国内那些搞硬件的公司。”一家具身智能大脑公司创始人对智能涌现直言。在他看来,软件才是机器人发展的卡点,但目前硬件公司在AI软件上的预算太低,“只是简单接接国外开源的大模型”。
宇树科技是典型的“硬件派”,其创始人王兴兴曾在一次公开采访中回应过这一点——他们对于AI的投入很克制,因为太烧钱了,“机器人才是我们的立身之本”,他甚至直言,“欢迎客户用我们的硬件,哪怕把我们的软件全删了”。
一位机器人硬件公司人士无奈表示,目前机器人在“软”的方面还没收拢共识——行业存在太多的技术范式和路线,大脑和小脑的边界是什么?具身智能到底怎么做?目前行业还很混乱,留有很多问号。
而“软硬之争”的结果是,国内大部分硬件公司,还在用传统的硬件思维来做机器人,对于“脑”的运用只是蜻蜓点水;而大部分做“脑”的公司,则选择自己从头开始做一个硬件。
各自为政,行业呈现出一种隐约的割裂状态。
大模型,还没办法“赋能”机器人
“现在搞硬件的公司,就是视频拍摄公司!”多位投资人、行业人士向智能涌现表示。
今年以来,许多机器人厂商在demo里展示的场景足够酷炫:比如机器人可以在汽车工厂搬东西,帮忙分拣货架商品,给人一种AGI时代机器人照进现实的感觉。
但实际情况却并非如此。
一个完美demo的幕后往往是:若拍摄一个机器人从抽屉里抓水杯的场景,比如训练的时候是早晨,到拍摄的时候天黑了;或者训练时抽屉里多摆了两个杯子、抽屉位置挪动了——这些细枝末节一改变,都可能导致机器人任务失败。
“有的demo,甚至一万次才成功一次,(视频里)不诚实的情况非常严重。”一位行业人士表示。
但你可能会疑惑,大模型在手机、电脑各类终端上已经足够智能,为何无法让机器人大脑变得更聪明?以至于让硬件公司们需要在“完美”demo上如此努力。
据智能涌现了解,目前大部分硬件公司对大模型的理解和应用并不深入——基本只是简单接入国内外通用语言大模型。但实际上,大模型与机器人真正需要的”空间智能“,还有很远的距离。
多位行业人士向智能涌现表示,语言大模型的数据量越大,反而更容易产生“幻觉”,干扰任务执行。“语言大模型和机器人落地一点关系都没有,区域任务上的成功率,惨不忍睹!”
而前述具身智能大脑公司创始人表示,目前国内没有一个团队真正从机器人出发,去做适配具身智能的大模型。
此前,机器人行业的一项解决方法是,在多模态大模型和机器人身体之间,引入一个中间层“小脑”——它的作用是承上启下,存放多项“子任务”(比如把“让机器人冲咖啡”任务拆成“拿杯子-磨豆子-冲水”等多项子任务),供大脑调配,也让机器人身体能读懂并且动起来。
但新的难点又出现了。一方面,小脑的引入,意味着机器人厂商们需要在其中预设无穷无尽的子任务,若遇上复杂的任务,各个子任务还需要再进一步拆分。
另一方面,数据匮乏则是更艰巨的难题。目前,政府和一些公司已经投入大量资源进行集中训练,但多位行业人士表示,效果并不理想,因为大家既不清楚应该收集何种数据,也不知如何界定优质数据的标准。
以抓杯子的场景为例,理想状态下的高质量数据应该是,拿一个机械臂控制它从头到尾做一遍,告诉他——抓杯子要怎么抓,当任一场景变化了,又要怎么抓。但这也意味着,一个简单抓取的动作,就需要几千万条、甚至几亿的数据。
当大家怀揣着“大模型改变一切”的心态闯进机器人领域,才发现中间的gap远比想象的更大。
一场集体纠偏
从行业的角度来看,割裂的状态并不健康,而如今的投资人、产业玩家们,正在出现一场关于“纠偏”。
2024年下半年,机器人行业的投资风向隐秘出现变化。王晟告诉智能涌现,在2024年前,很多投资人粗浅认为,投机器人=投资人形机器人硬件。
在过去的一年半,人形机器人公司烈火烹油,估值飙升。据智能涌现了解,以宇树科技、智元机器人为例,两家炙手可热的机器人硬件厂商,近两年连续完成数轮融资后,估值双双迈过10亿美金大关,“贵到大家投不起”。
而彼时,国内众多专攻机器人小脑/大脑的公司,则面临融资困境,有一些甚至需要重新思考如何向市场讲故事。
“今年下半年以前,我们和投资人讲,做机器人统一大模型、讲端到端,谁信呢?”前述机器人大脑公司创始人告诉智能涌现——“但是今天你不讲端到端,都不好意思出门了”。
投资风向直至今年下半年,出现逆转。
一家做人形机器人关节的公司创始人向智能涌现直言,今年以来,明显感觉纯做硬件的初创公司很难拿到大笔融资了,“市场有点冷”。
而从近期消息面上看——在海外,Skild AI、Physical Intelligence成立短短时间内,估值飙升至百亿;在国内,不久前机器人小脑公司「星海图」拿到蚂蚁投资,大脑公司「自变量」、「千诀科技」也先后拿到融资。
“现在投资人从投人形,改投具身智能了”,王晟向智能涌现表示,因为大家现在意识到,具身智能才是更好机器人驱动完成泛化任务的关键。
反思不止是在投资层面,一波硬件厂商也开始集体复盘过去的模式——在以前,机器人厂商更多是在专用领域里收集数据,再去做专用的场景,大家信奉 “通用,就是没用”。
如今,虽然大模型还没办法真正用起来,但它给这一派创业者的启示是,或许要先学会忘记专项场景,先构建通用的基础模型能力,再在上面长出专用的能力——这或许才是系统解决通用性的关键。
机器人领域的软硬之争,暴露的是,在AI的冲击下,机器人行业目前还处于一种共识尚未弥合的混沌状态。但不确定性中的确定是,机器人的终局是硬件与具身智能的结合,软硬件缺一不可。
“无论是从软件出发还是从硬件出发,大家的终局是接近的,就看谁的商业效率更高”,一位行业人士表示,“而AGI时代的机器人公司,本质上需要够既懂AI、又懂硬件的团队。但更关键的是,大家还要相互认同”。
(本文图片都来自官方渠道)
头图|Unsplash
本文来自智能涌现,作者 邱晓芬,编辑 苏建勋 36氪出海经授权转载。
近期活动
36氪出海将于12月5日在北京举办主题交流活动,共同探讨企业在海外获客与留存的可持续增长策略。此次活动特邀嘉宾包括飞书深诺集团 APP 行业总监兼 CSM 负责人赵其蕙以及 《客户成功》作者、SaaS 行业资深专家刘徽,他们将分别以 ToC 和 ToB 的视角,基于丰富的海外增长获客与企业服务经验,分享对出海企业极具借鉴价值的可持续增长策略与实践经验。如果您关注出海企业的可持续增长,希望深入探讨如何在海外有效进行获客与留存,欢迎您扫描下方二维码填写表单,报名参加本次活动。活动报名将于12月4日中午12:00截止。
加入36氪出海学习交流群
目前,36氪出海学习交流群已经吸引超过15000位来自国内外初创企业、行业巨头、投资机构等出海人加入。在出海社群里,我们面向群成员挑选整理每日全球跨境资讯,帮助出海人把握最新动态;定期组织出海交流活动,链接出海生态圈,寻找潜在合作伙伴!欢迎添加36氪出海小助手微信(ID:wow36krchuhai-xzs2)申请入群,一同出海!