36氪出海 - 助力中国公司全球化

  • 英文站 KrASIA
  • 日文站 KrJAPAN
36氪出海
36氪出海
人工智能

从 DeepMind 到具身智能:她为何笃定只需3-5 年机器人一定会走进千家万户|AI Women on Point

组织与人 

一个在具身智能一线女性的思考,决策和价值取舍。
分享:

Intro

2026年第一篇更新,我们开启了一个全新的栏目「AI Women on Point」。

「On Point」源自军事用语,指在一支队伍里,走在最前面的人,「AI Women on Point」顾名思义在 AI 最前线、拥有决策权的女性们。

在这个栏目里,我们不会提问:作为女性你有什么困难?如何平衡工作和生活?作为行业里的少数性别如何和男性相处?

我们会更关注在快速变化的行业里,她们如何做决策?做取舍?有什么独特思考?提倡什么领导风格?如何理解自己的优势和擅长?

其实「AI Women on Point」——理想状态下「AI on Point」 已足够——但在当下,强调「 Women」 不是立场选择,而是一种方法选择。

长期以来,社会默认的「决策者」往往被想象为男性,换句话说,我们此刻强调 Women 并不是为了突出「女性」,而是为了强调一个长期被忽略的「事实」。

可以肯定的是,虽然 AI 行业仍是一个男性占多数的行业,但已经绝非是一个由男性主导的行业,女性在关键岗位的比例远高于大众认知,她们正在真实地塑造前沿技术进入世界的方式。

某一天栏目会回到原本的名字,而不必强调「women」。

首期我们的主人公王佳楠,一个天才少女,星尘智能副总裁(全球第一个实现绳驱 AI 机器人量产的公司),是具身智能领域一线的推动者。

她本科毕业于香港中文大学信息工程系,从牛津大学获得计算机系理学硕士学位后加入 DeepMind,从事基础理论研究,在这个「极硬核」的部门里,她主导开展了面向不断变化的真实场景的在线学习与组合式知识迁移方法研究,并构建了大规模 AI 训练框架工具。

但在 DeepMind 工作到三年,王佳楠逐渐意识到自己更感兴趣具体的问题而非抽象理论,于是选择在2021年底回国加入 IDEA 研究院,在持续从事 AI 前沿研究的同时,关注技术拐点与产业落地,最终选择投身具身智能的浪潮。

2024年初,她加入星尘智能担任副总裁,与团队一起构建了「顶尖本体×高质数采×智能模型学习」的全栈技术体系。

与一部分对具身智能落地持有悲观态度的人不同,王佳楠的态度非常激进,她认为只需要3-5年的时间,具身智能就可以走入真实的家庭场景。「对具体落地问题,我们比较自信,我们完全可以解决。」

她正以此为目标推进:首先以通用为目标。第一步是先让具身机器人安全、长期地进入真实的环境,然后从中不断失败、再学习,把一次次交互转化为可回流的数据资产,最后再变成可泛化的通用能力。

「它必须真的像人一样,有能力通过学习掌握更多技能。」这条技术路线下,机器人的本体不再是硬件,而是决定数据质量、学习速度和动手操作的开关。

王佳楠的性格乐观开朗,说话时带着笑意,语速很快,但始终清晰简洁;外表上,她看起来比实际年龄要小得多:梳着高马尾,穿着宽大的毛衣,胸前别着一枚设计克制的胸针。与 AI 闹见面那天,她分秒不差地出现在会议室门口,神情松弛而专注,像是从宿舍起床、直接走进课堂的女大学生。

她的日常爱好是看动漫,微信头像是动漫人物:葬送的芙莉莲,这是她近期最喜欢的动漫人物。

芙莉莲是一位超过千岁的精灵,拥有极强大的魔法力量。她的大部分时间并不执着于力量本身,而是热衷于收集魔法书,会把最强的魔法用在一些看似简单琐碎的事情上。即便是在与勇者一行踏上讨伐千年魔王的旅途中,她也依然沉浸于许多「无聊」的小事—比如让草地绽放成一片美丽的花田,或是为伙伴们制作刨冰。「但是,这些小事却总能让身边的人感到快乐啊。」王佳楠笑着说。

这很符合王佳楠的人设。

一个同事形容她:很强,很有主见,但并不刻意制造存在感,也不热衷宏大的叙事。相反,更愿意把精力投向那些长期却真实影响世界的事情——并在其中保持一种罕见的从容和耐心。「她活得极其简单、平静。」

王佳楠在 DeepMind 期间的工作和办公室的随手涂鸦

王佳楠(前排红色毛线帽)在 DeepMind 期间和同事的合影

对话王佳楠

01 AGI 必来,具身也必须做「通用」

AI 闹:佳楠很高兴和你聊天,你至今为止最重要职业的决策是离开 DeepMind 选择回国加入具识智能的浪潮,这个决定背后可否说说你的判断依据?

王佳楠:总结下来,我的职业决策一直沿着如何让 AI 更接近真实的世界,解决真实问题的方向。

记得在牛津读完研究生,导师让我继续读博士,当时之所以没有继续读下去的主要原因是我没有一个坚信的方向,只是觉得 AI 挺酷的,但要我做一辈子?是个大大的问号。

然后毕业后加入 DeepMind 接触到 AGI,相比其他的 AI 公司,DeepMind 的关注点非常纯粹,如何实现 AGI ——即便当时 AGI 还是一个非常抽象的概念,但基于这个信念,公司鼓励大家挑战最底层的问题,不设任何考核和 KPI,我记得当时公司在不同的方向上有序发散去探索验证,我主要从事理论研究,自己是处于一个比较 open 状态,只是隐约觉得可能对接近真实的应用场景以及问题更感兴趣。

之后回国,短暂做过一阵 AI 生成内容(图片、视频、3D 生成等),然后大概2024年第一次看到星尘智能的绳驱本体。那时他们还在一个很小的办公室,就是那一瞬间,我觉得太酷了,我终于有机会在一个成熟的本体上探索 AI 了。没什么纠结的过程,就加入了。

我做决策一向很快,偏直觉型。

AI 闹:决策的背后总有一些实现具身智能的思考和判断吧? 

王佳楠:星尘智能的理念是模型+本体的通用解决方案,这就符合我对 AGI 的一种判断。

首先通用很重要,这是在 DeepMind 习得的认知,或者叫问题的品味。品味并不是指选哪一条技术路线或不选,而是强调一个人要对什么问题值得长期投入有明确的判断。

记得在 Deepmind,我常常听到 Demis Hassabis(DeepMind 创始人)与 AlphaFold 团队沟通分享,让我受益匪浅,他思考问题永远是长期视角,从不回避问题的本质或者说底层的困境,也不预设任何一方必然拥有更正确的答案。

我坚信 AGI 必然来临。那么在具身智能的领域,就要明确通用的目标。

另外相较于一些只做模型的具身公司,星尘有成熟和高性能的本体,可以让 AI 真的在一个机器人上跑起来,这点很重要。

我近期看到 Physical Intelligence (总部在美国、专注把通用 AI 带进真实物理世界的初创公司)发表过一个技术报告,他们的模型做金牌难度任务时,未能解决的唯二案例就是受到了「本体」的限制,本体不行,因此干不了很多事儿。

所以星尘坚持的具身方案可以给我提供很好的土壤,让我去挑战一些更难的问题。

AI 闹:具体到「通用」,业内也有分歧,比如一部分人认为可以先做专?

王佳楠:机器人是非常古老的学科,很多专业场景已经有自动化的解决方案了。那我们这一代为什么要投身具身?其目标就是为解决通用,这是我思考问题的大前提,也确实受到 DeepMind 的影响,要解决就解决大问题。

另外,随着 ChatGPT 等大模型的出现带来的全新范式,如果机器人还做专,就无法涌现新能力,解决新问题。

从产品侧来看,很多已经做过多年机器自动化的工厂也期待通用方案,因为环境在变化,产线也在变化,今天卖这个,明天可能卖别的了,客户期待通用的方案,否则成本太高了。

最重要的是,通用模型有一个明显优势:它可以用同一种训练范式持续扩展能力,本身是可规模化的,因此潜力很大。

比如一个售货员机器人,它每天要面对顾客、递东西、扫码、上货、下货,这些都是完全不同的任务,如果每一件事都依赖一个单独小模型,整个系统几乎不可能无缝运转,且做到顺滑自然。

我们要知道一些对人来讲很容易的动作,比如开门,卖货,拿杯子,对机器人来说,是很复杂的。

AI 闹:你是从理论研究走出来的科学家,能不能举一个在实操中解决的问题远比做理论兴奋?

王佳楠:我有一个小伙伴做无人叉车,应用感知算法。他们积累了非常多的数据,准确率也非常高,持续几个月没有出现任何问题,但有一天突然之间所有的车都识别不到了。

后来分析得出结论,因为换季后,太阳的高度不同,导致工厂有两根铁柱被照射后,很像叉车前的两个杆。收集数据在春天,出现问题在冬天,这不是算法不奏效,而是落到实际场景才会发现的问题。

在机器学习里,这又被称为数据分布不一致,训练时看到的世界和真实运行时遇到的世界并不一样。解决这类问题绝不能继续在实验室补数据,如果只在理想环境中训练,机器人学到的能力很容易在真实世界「失效」。

很多关键洞察并不是来自算法本身,而是来自机器人真正进入场景的那一刻,这是让我非常兴奋。

02 行业热潮,被高估的和被低估的

AI 闹:你定义的的具身智能的真实场景是能做到帮你妈妈做饭洗碗,离实现这个大概需要多久?

王佳楠:我很激进,3-5年就可以。

的确会有新模块或架构再出现,但我觉得这些都不是大的问题,最大的问题是如何迭代数据用以更好的学习,对这个问题,团队也比较自信,我们完全可以解决。

AI 闹:为什么如此乐观?因为想得足够清楚吗?

王佳楠:对。但我认为在此前,还需要一个过渡阶段,让一些前沿的用户愿意和机器共存,教它做事。

比如我们现在做一个模型,它的成功率可能是85%。那剩下的15%怎么办?这时候就需要人来接管。你可以在它失败的时候出手,教它该怎么把事情完成。这个过程本身就会变成新的数据,回流到系统里,再用来训练模型。下一次,它可能就从85%提升到了90%。

这是一个过程的前提:先让用户愿意和它互动,愿意教它。比如你一开始买机器人是为了做家务,后来发现它还能帮你喂鱼、干点别的事,这些新需求,其实都是一步步教给它的。

我们之前发布的 Astribot Suite 平台,本质上就是为这个过程准备的一整套系统:怎么采集数据、机器人怎么使用,都被做得非常直观、非常简单,我们希望它简单到我妈妈也能用它来采一些新的数据,训练的事情可以交给云端和我们的系统来完成,训练好之后,再把新的能力部署回机器人上。

慢慢地,人能习惯机器人在身边,接受它有时候会失败,关键的是,当它任务失败时是否依然安全?当它只有90%成功率,能不能教它变得更好?其实有点像在教一个孩子。如果这个过程足够自然、足够顺畅,那机器人真正走进家庭并不是一件很遥远的事情。

AI 闹:具体到2025年,你做过什么关键取舍?尤其是舍?

王佳楠:在通用模型的训练上,放弃了一些不通用的 trick 和不好 scale 的数据模态。

AI 闹:这两年在具身领域被高估的能力?

王佳楠:不算高估,但有个现象。在机器人展会中各大公司经常只会展示单一任务,比如说让机器人叠衣服。

老实讲,对我们做算法的人来说,过度追求在单一任务上的成功,甚至做到100%的成功率,是不难的,通过强化学习完全可以迭代上去。

我认为这并不是行业的核心问题,行业的核心问题还是机器人的通用能力。

AI 闹:哪些被低估或忽视的?

王佳楠:一家公司的理念,或者说是我刚才提到的定义问题的品味,是否有野心打造出一个真正的产品级机器人。

其实我对产品是非常非常在意的,我希望自己做出的具身机器人不是一个静态的摆设,而是一个能和用户持续产生交互,从而产生价值的产品。

那么要让机器人进入生活做事情,我们就要考虑得非常多且要顾及安全性。另外,对于这样的产品,模型如何介入?介入程度?数据怎样回流?都要思考。

以上这些一整套的产品思考,在现在的行业叙事里,其实被低估了。

AI 闹:2025年你的 Aha Moment?

王佳楠:我们正式推出了的 Lumo-1 模型,一个强推理的模型,它让机器人不但能记住要做什么,而且知道为什么要这么做。

为了这个模型,我们做了非常细致的实验。比如在训练机器人时,我们没有一开始就使用机器人的真实数据,而是先用互联网上类似的场景和经验,先去拆解一件事:在这种情况下,应该怎么判断?关键一步在哪里?接下来需要关注什么?

然后把这套思考过程整理出来再放进模型,让模型学会怎么想。也就是说,哪怕没有大量机器人的操作数据,我们也可以先教它思考的方式。

这样一来,后面只需要很少的数据——可能10条,最多100条,它就能把这件事做起来了。

这是一个无比开心的时刻,因为我第一次看到:知识可以直接转化成机器人真实操作能力的力量。

03 我从不怀疑自己的判断

AI 闹:领导团队时,如何思考领导力的? 

王佳楠:我们科研领域的特点是慕强心态,只要你强,你说得对,大家自然会 follow 你。

AI 闹:前沿领域面对很多不确定,如何做决策?

王佳楠:确实很多事情,我也不确定给出的方向就一定对。如果有60%的希望,大家都愿意试,那就快速迭代验证,我也会和大家一起投入进去,别纠结。

AI 闹:错了呢?

王佳楠:赶紧掉头,因为不做决策是最差的事情。

AI 闹:会在意外界的评价吗?

王佳楠:不太 care,我非常相信自己的判断和决策。

AI 闹:有过自我怀疑的时刻吗?

王佳楠:有,加入 DeepMind 的第一年。

之前我一路求学都非常顺利,很骄傲,也年轻气盛。加入 DeepMind 后做基础理论研究,感觉掉进了一个天才窝,身边的人都太厉害了。我当时意识到,无论多么努力,我也不过是知道他们早就知道的事情。

这对我的心理是一个非常大的打击,一度非常非常沮丧。

后来我开始学会对自己和解,我开始意识到很多事情不能急功近利的,包括现在做具身,我绝对不可能今年就把所有问题都解决,只能一点点努力。

但坚定好信念,一路积累好的同伴,就是一个好的旅途。

人生呢,也不过就是一场旅途。

AI 闹:这场旅途,具身机器人是你的终点吗?

王佳楠:是的,它是我终其一生的目标。我完全可以想象到在未来,人跟机器人共存的生活场景。

这绝不算妄念,是经过我务实的思考。当然也可能这一波具身智能,我们做不成,那我也要做把这件事推到最前面的那批人,往前多探索一步,为下一代人铺路。

图:受访人供图、Unsplash

本文来自微信公众号“AI闹(ID:ainowainow)”,文:张卓,36氪出海经授权转载,如需转载请联系原作者。

欢迎填写表单,获取 AI NOW! 专访机会

AI 技术正在加速全球化进程,全球化带来的市场需求与数据流动反哺着 AI 创新。36氪出海·AI 栏目携手 AI NOW!(AI 闹),聚焦 AI 从业者的多元化视野,挖掘从技术研发到市场落地的实践,探索如何融合 AI 与各行业知识,把握未来 AI 应用场景趋势。如果您是 AI 创业者,或大企业 AI 业务负责人,欢迎扫描下方二维码,填写表单,获得 AI NOW! 专访机会。由于沟通专访的企业较多,AI NOW! 团队希望首先了解您的基本情况,并在筛选后与您联系,请您尽量留下具体、准确的信息。期待共同打造 AI 时代最好的人物访谈。

36氪出海·活动

“迪拜商业论坛·中国”5月亮相深圳,已开启报名

迪拜商业论坛·中国将于2026年5月14日在深圳举行。论坛以“合力致远,共筑经济新增长”为主题,将向中国商界介绍迪拜经济议程(D33)所带来的多元化发展机遇,开拓双方合作与战略投资的新路径。作为推动中国与迪拜商界领袖战略经济协作的高端平台,迪拜商业论坛·中国汇聚中国顶尖的跨国企业、独角兽公司、高成长科技企业、风险投资机构及家族企业的核心代表;来自迪拜的高级别代表团亦将参会。如果您对本届迪拜商业论坛·中国感兴趣,欢迎点击“此处”或扫描下方二维码填写注册表单申请参会席位。

英文服务

服务KrASIA 英文媒体服务助力中国公司提升全球品牌

在全球经济复杂格局的当下,英文报道不仅是向海外客户和消费者传递价值主张的重要手段,也是企业在世界范围内的认知沉淀。英文媒体 KrASIA(kr-asia.com)致力于向世界介绍中国商业和文化。英文网站约60%的读者为东南亚核心国家的商业人群。KrASIA 通过优秀的搜索引擎优化,专业的英文内容和可靠的社交媒体矩阵,以及全球顶级信息数据平台彭博终端和道琼斯 Factiva 等外部收录平台,帮助中国公司提升全球品牌。如果您的公司对英文传播有相关需求,或者希望与 KrASIA 合作提供出海服务,欢迎点击“此处”或扫描下方二维码,获取 KrASIA 媒体服务刊例和工作人员的联系方式。

加入36氪出海学习交流群

目前,36氪出海学习交流群已经吸引超过15,000位出海人加入,他们来自国内外初创企业、行业巨头、投资机构等。在出海社群里,我们为成员挑选整理每日全球跨境资讯,帮助出海人把握最新动态;定期组织出海交流活动,链接出海生态圈,寻找潜在合作伙伴。欢迎添加36氪出海小助手微信(ID:wow36krchuhai-xzs2)申请入群,一同出海!

分享
//
热门行业
|
市场
|
公司
汽车出海
广告图片
关注公众号
扫一扫即刻关注
36氪出海微信公众号

推荐阅读


深度解析

  • TikTok 败诉,全球化的艰难一章才刚刚翻开

    TikTok 案背后, 是更多在美国开展业务的中国企业们,将集体迎来一个并不乐观的信号。

    社交文娱

    TikTok 败诉,全球化的艰难一章才刚刚翻开

    刚刚