36氪出海 - 助力中国公司全球化

  • 英文站 KrASIA
  • 日文站 KrJAPAN
36氪出海
36氪出海
人工智能

36氪出海·AI|对话Sheet0.com创始人王文锋:Agent下一阶段的关键要素:可解释、造工具和100%确认美学

行业大小事 

为什么让 Agent「动」起来是下一步的关键因素?
分享:

01

行业如今的关键是「谁能造出一个真正有用的 Agent?」

讨论的焦点问题变成「Agent 的认知边界」:有多大的自主性?需要多强的上下文理解?又如何在现实任务中保持稳定?

这背后需要实践者具备四种超强的能力:即对模型的边界预估,对复杂系统的理解力、对产品工程的实践力,以及对商业场景的洞察力。

在 Sheet0.com 的创始人王文锋看来:Agent 本质上是一种「利用模型知识,结合实时信息,使用工具解决问题」的产品形态。

他提出的关键问题是:为什么模型本身已经达到博士水平,但很多Agent 的表现仍停留在实习生阶段?

这中间的 GAP 关键在于在「实时信息」和「工具设计」层并没有很好的适配模型能力。

Sheet0.com 就是他对 Agent 的认知落地:一款在 AI 时代为模型提供可扩展的实时数据获取能力的产品。今年8月中旬,产品上线, 主要面向数据分析师、产品经理、工程师、市场营销人员等在数据收集处理上花超过5个小时的用户。

一个典型的用户场景:一位销售在寻找潜在 AI 行业客户,过去,他要先通过 LinkedIn、X 等社媒,收集公司信息,再分析该公司是否为 AI 行业公司,还需要寻找目标联系人联系方式等等。而搭建这样一个程序,需要一个工程师4-8周的时间。而 Sheet0 只需要30分钟内就可以给用户交付完整的数据表格。

王文锋认为,产品核心解决的问题是让无论是个人、企业还是 Agent 这个新个体,都可以随心所欲的获取数据,解决问题。

「在经济学里面有个概念叫价格弹性,是一个衡量价格/成本发生变化时,需求会如何变化的指标。数据领域往往价格弹性远大于1,这意味着10倍的成本下降,带来的不是需求的10倍增加,而是几十倍甚至上百倍」

王文锋在 SpaceX 的星舰基地
sheet0 日常团建,举着 sheet0 的是王文锋

02

尽管 Sheet0 在数据获取环节已经帮用户做到10倍提效,但王文锋并没有将「省时间」作为产品的核心价值,他认为「准+快」才是 Sheet0 的长期核心价值。即:

1、 必须保证给用户交付的数据100%准确。

2、在单位时间内,尽可能提高数据的交付量。

构建人与 Agent 之间的信任,是一个长期的命题。「这背后是作为工程师也要信任模型。」

Sheet0 所有的系统行为都被分解成可以追踪、可复用的「语义步骤」,Agent 必须理解自己在做什么,并在出错时可以进行自我修复。这是王文锋的设计哲学,「在 Agent 干活之前,先让他变聪明。」

而让 Agent 变得可解释,是 Agent 下一步发展的关键环节。

作为连续创业者,王文锋自2017年毕业后,先是写了四年代码,期间曾负责地平线 AI 数据平台。 2021年和朋友合伙创业,作为 CTO 研发了新一代的 Serverles 消息队列,在 Data Infra、AI 领域积累了近十年的开发经验。2023年加入 AI 浪潮,开始了自己的第二次创业和 CEO 之旅。

AI 闹见到王文锋时,他刚从美国回来,时差还没有完全倒明白,sheet0 现在主攻美国市场,一半的团队在美国,10月将全量上线。

我们的话题围绕在 sheet0 上线两个月后,他对 Agent 的最新思考。实时数据的获取只是第一步,他接下来计划为大模型造更多的工具,他认为让模型自主学会使用工具,是 Agent 未来的竞争关键:「每造出一个新工具,相当于为模型解锁了一个新技能。」

Sheet0 的用户界面
Sheet0 的产品展示

对话王文锋

 

可解释,先变聪明再变强

AI 闹:beta 版本8月上线后,用户是否接受这款产品?反馈如何?

王文锋:从注册用户、付费数据,比我预期要好不少。

现在80%的用户来自于发达国家,第一是美国,第二是日本,其中60%的用户每周在数据工作方面消耗时长超过5个小时。

日本是超出我预期的一个市场,好像是有一个日本博主把我们在美国做推广的帖子搬运后,来了很多日本流量。后来我调研发现日本用户的付费意愿更强,是因为他们的数字化基础比美国落后不少,使用 Excel 等传统数据工具的用户更多。

不过现在的主要目标是先把美国市场做好,美国市场起来后打其他市场可以事半功倍。

AI 闹:中国市场呢?

王文锋:我第一次创业也是做软件,我的经验是,美国竞争很激烈,但都有钱赚。因为能赚到钱,所以大家对做事情更有信心一些。国内软件的商业化土壤一言难尽。

AI 闹:进入真实的用户场景后,现阶段 Agent 需优化的最棘手的问题?

王文锋:如何构建一个合理的反馈闭环,这是非常细致的一个工程,比我想象的难度要大。

解决这个问题给我启发最大的是 Claude Code ,它让我意识到——Agent 要真正聪明,关键不在于「能做多少事」,而在于它能不能「知道自己在干什么」。

Claude Code 系统完全是事件驱动的,每一个动作、每一次变化,它都会自动记录成一条带语义的信息。

比如说,它会在工作过程中发出一种叫 reminder 的内部消息,用来提醒自己注意某个细节,但这条消息用户是看不到的。换句话说,它不仅知道「怎么做」,还知道「为什么要这么做」。

AI 闹:「带语义的信息」具体指什么?

王文锋:举个例子,你让 Agent 去整理一张网页上的表格。它可能要花四五步才能完成:打开网页、识别内容、发现错误、修改数据。但对模型来说,四五步太冗余了。

能不能把这些过程压缩成一句有意义的总结,比如「因为发现数值错误,系统自动调整了这一列」。这样一来,Agent 就不再是机械执行,而是能带着理解去行动。

它的每一步都有清晰的定义,可以被记录、被复用、被优化。

现在,我们架构上基本已经调整成类 Claude Code 的形式。希望 Agent 不只是执行指令,而是能像一个真正的「人」,理解自己为什么要这么做。只有这样,它才能不断进化。

AI 闹:Sheet0 没上线之前,你在一次行业分享中曾说过 Context engineering 是 Agent 成败的关键,这个思考现在有变化吗?

王文锋:没有,反而会觉得更重要了。Agent 想变得更聪明,关键是 Context 要够多、够细。包括用户的使用记录、任务执行过程中的反馈、失败案例等等。

只有积累到一定程度,Agent 才能真正学会在不同场景下该怎么做。

AI 闹:你认为具体需要多少才算积累到位?

王文锋:没有标准答案。因为 context 的类型太多样了。

我们现在有一个做法:当用户任务执行失败,比如某个网页数据没采集下来,我们会记录下失败案例,然后再去找类似任务里那些成功的案例,对比两者的差异。成功的路径,我们提炼出来、结构化保存,放进内部知识库。下次再有类似任务,系统就能直接调用这些经验,成功率会更高。

你可以把它理解成,我们在给 Agent 建记忆——每一次出错、修复、成功,都会变成它下次做得更好的基础。

AI 闹:听起来有点像是给模型建立 bad case 库?

王文锋:可以这么理解。当积累到足够多的经验后,这些数据就能直接拿去微调模型。原来它靠外部经验,慢慢就会变成模型自己的知识。也就是说,Agent 在一次次失败和修复的过程中,逐渐学会了避免犯同样的错误。

AI 闹:这个过程现在能自动化吗?行业有些做法会训练一个小模型去 check?

王文锋:目前还没办法完全自动化,我们是半自动的流程。人还是要参与做一些轻量级的标注或分类。

大家都在讲「端到端」,希望模型从头到尾自己搞定一切,但现实情况是没到那一步。

我觉得我们并没有脱离有多少人工,就有多少智能的阶段,LLM 只是放大了人类工作到 Agent 智能之间的杠杆;另外还有个关键是我们需要知道什么时候可以离开人工。

实时数据,从使用工具到创造工具

AI 闹:很多人质疑 sheet0 更像是一个传统的表格工具或者爬虫工具?

王文锋:我知道外界会有这样的印象。原因也挺简单的——因为 Sheet0 现在从能力上来说确实只有一个基础能力:从网页收集数据。

Sheet0 的目标是「在 AI 时代提供可扩展的实时数据获取能力」。

因为 Agent 的目标是 take actions,所以需要做决策,而做决策一方面需要依赖模型知识,另一方面还要依赖实时数据。比如「明天穿什么衣服」这个问题,模型就至少需要知道明天天气、去哪里找实时数据才能作出决策,光有知识还不行。

为了实现目标,Sheet0 采取的方案是 bottom-up 重新为模型构建出一整套的「数据工作环境」,构建这个环境的第一步,是可以将「任意的数据源变为动态的结构化表格」,而我们最先选择的数据源就是网页,因为它受众广,商业化价值也够高,让我们可以在 day 1 就开始赚钱。

所以现在大家说我们像「表格」或「爬虫」工具,有点像我们养狗,在狗子成年前都会有一段尴尬期。而 Sheet0 就在这样的尴尬期。我相信6个月以后大家再来看 Sheet0,就不会这样说了。我们会有更创新的产品形态交付给大家。

AI 闹:现在,你怎么看模型的能力边界和 Sheet0 的分工?

王文锋:其实我更想说模型和 Agent 的区别。

Agent 本质上利用模型知识,结合实时信息,使用工具解决问题的程序。今天我们看到基座模型在多个领域已经达到或接近博士水平;但是在实际的产品表现上面,还停留在实习生。

这里面的核心是实时信息和恰当工具的缺失。

我们讲「工欲善其事必先利」,所以 Sheet0 核心是在围绕数据场景设计一系列的「趁手工具」,并不会过多的去考虑模型的边界,因为我们相信在长期来看,模型是没有能力边界的。

对于模型厂商而言,如果一个工具的复杂性过高,就意味着它们一定不会去做,因为复杂的工具意味着需要 own 一个复杂的 infra。

AI 闹:基于上面的认知,你认为有哪些有巨大商业潜力的方向等待开发?

王文锋:比如最近我们的用户想做一件事情,需要找1000个英国 K12 的家长。传统办法是找当地的社区网站、或脸书的一些用户群组。

但换个角度想,什么样的人完成这个任务最简单,肯定是本身就在英国读书的孩子,假如他们有自己的 Agent,跟他的 Agent 联系一下,让他们收集20个家长联系方式,酬劳100块钱,肯定有人愿意(假设不考虑合规问题)。

现阶段这些数据是离线的,但却是最有价值的,如何更方便的获取这些数据也是我们的主线目标之一。这是让我最兴奋的部分,肯定会想出办法解决。

未来,我希望 sheet0 可以为用户收集整理所有数据,私有的,公开的和个性化的,并以结构化的方式交付。之所以强调结构化,是因为结构化数据天然是带有语义的,而且可以进一步通过类似 SQL 的工具让模型实时创造工具。

AI 闹:你觉得2025下半年到2026年,Agent 行业还有什么新机会?

王文锋:具体我说不上,但是我可以分享一个概念:价格弹性。

这是一个经济学上的概念,用于衡量当解决的问题的成本下降的时候,需求增加或减少的程度。当价格弹性为1的时候,意味着成本下降10倍,需求也会增长10倍。我的建议是可以思考哪些领域的问题是价格弹性大于1的,这些问题都非常值得用 Agent 的方式去解决。

100%确认美学,信任是第一要素

AI 闹:现在模型不可避免存在幻觉,以及 Agent 还严重缺乏 Context 的情况下,你为什么格外强调自己100%的准确率?

王文锋:我的理念是做 Agent 首先要让用户信任,信任很重要,背后也是工程师要信任大模型。

模型的「幻觉」由它的底层原理决定的,它的本质上是在「总结信息」——比如说我给它两百个网页,它会自己判断筛选出其中的一百个,然后再去总结内容。但压缩总结这件事是有风险的,它可能会理解错、归纳错,「幻觉」就是这么来的。

但是我们抓数据的逻辑更接近「复制粘贴」,你可以理解成,sheet0 就像一个认真抄笔记的人——网页上是什么,它就一模一样抓下来放进表格,比如说网页上是一张公司信息表,我们抓下来的数据在表格里也是一模一样。

在技术上,我们底层全是动态生成的代码,所以才敢说给用户交付的数据是100%准确的。

AI 闹:初期阶段就追求100%准确会不会导致进度慢?

王文锋:短期内确实会慢,因为我们做了很多 Infar 层面的努力,但我觉得长期来看,这是「慢就是快」。我们尽量避免做消耗动能的事情,而是长期积累势能。

就像我前面提到了,我认为构建 Trust 是人和 AI 之间的终极命题,我们需要在 Day 1 就坚持去做这件事情。

很多人不看好我们,我非常理解,因为相信,所以看见,我不能这么去要求别人。我过去的失败经验告诉我,选择坚持什么非常重要,这个是创始人的品味。

AI 闹:现在你中美两地跑,这一年美国的 AI 创业环境给你什么启发?

王文锋:我和很多美国的创始人交流,发现他们和中国创业者最大的区别是,他们敢于勇敢创新,敢于 bet(下注)。而中国的创业者,今天一上来就会被问「你的用户是谁、他们为什么用你、怎么保持用户粘性、竞品是什么、大厂干了后怎么办」,这其实是很让人难过的事情,因为过早的关注这些问题会扼杀真正的创新。

Lovable 火了以后,人们才发现用的最多是产品经理和销售,而不是程序员;同样在 Manus 诞生之后,人们才发现原来一个人真的可以一周看100个研报。

AI 产品应该从人性角度出发,在恰当的节点「打造出符合大家对未来想象的产品」。I know it when I see it。

前景背包是王文锋,他日常热爱徒步,图在美国某国家公园

AI 闹:创业2年,前两个都没推进下去,有没有心理上的至暗时刻?

王文锋:有的。2024年10月份—12月底接近3个月的时间,真的是一片灰暗。那时第一个项目黄了,第二个项目决定不做了,新方向还没定,完全丧失了信心。加上我妈妈那会身体非常不好,应该是有点抑郁。

当时有非常想躺平的感觉,创什么业,为什么这么辛苦这么累;在3月份处理完我妈妈的后事之后,我又回到了北京,开始触底反弹。Sheet0 就是在这种状态下一点一点探索出来的。

加上回过头去看,当时做的第1个产品和第2个产品其实方向都很正确,但是就是因为太在意短期目标,中间没能推进下来。

之前有朋友问我,觉得做 CEO 最关键的能力是什么?我的回答是对痛苦的长期耐受力。而之所以能够忍受痛苦,一定是有一个更强的信念在支撑。所以我想告诉很多创业者,一定要相信自己!

图:Unsplash、受访人供图

本文来自微信公众号“AI闹(ID:ainowainow)”,作者:Pippobei,36氪出海经授权转载,如需转载请联系原作者。

欢迎填写表单,获取 AI NOW! 专访机会

AI 技术正在加速全球化进程,全球化带来的市场需求与数据流动反哺着 AI 创新。36氪出海·AI 栏目携手 AI NOW!(AI 闹),聚焦 AI 从业者的多元化视野,挖掘从技术研发到市场落地的实践,探索如何融合 AI 与各行业知识,把握未来 AI 应用场景趋势。如果您是 AI 创业者,或大企业 AI 业务负责人,欢迎扫描下方二维码,填写表单,获得 AI NOW! 专访机会。由于沟通专访的企业较多,AI NOW! 团队希望首先了解您的基本情况,并在筛选后与您联系,请您尽量留下具体、准确的信息。期待共同打造 AI 时代最好的人物访谈。

近期活动

活动|迪拜热门行业指南:如何把握机会,实现长期运营?

投资、贸易、科技是目前中国企业出海迪拜最热门的方向。对这些行业来说,如何进入中东市场并顺利落地,如何保证合规并长期运营,是真正影响出海成败的关键。36氪出海将联合迪拜 IFZA 自贸区,于11月13日举办线上活动,深入讲解迪拜的热门行业,分享业务落地与推进的实操路径和案例。欢迎您扫描下方二维码或点击“此处”,填写表单,报名参加本次活动。活动报名将于2025年11月12日23:59截止。

英文服务

服务KrASIA 英文媒体服务助力中国公司提升全球品牌

在全球经济复杂格局的当下,英文报道不仅是向海外客户和消费者传递价值主张的重要手段,也是企业在世界范围内的认知沉淀。英文媒体 KrASIA(kr-asia.com)致力于向世界介绍中国商业和文化。英文网站约60%的读者为东南亚核心国家的商业人群。KrASIA 通过优秀的搜索引擎优化,专业的英文内容和可靠的社交媒体矩阵,以及全球顶级信息数据平台彭博终端和道琼斯 Factiva 等外部收录平台,帮助中国公司提升全球品牌。如果您的公司对英文传播有相关需求,或者希望与 KrASIA 合作提供出海服务,欢迎点击“此处”或扫描下方二维码,获取 KrASIA 媒体服务刊例和工作人员的联系方式。

加入36氪出海学习交流群

目前,36氪出海学习交流群已经吸引超过15,000位出海人加入,他们来自国内外初创企业、行业巨头、投资机构等。在出海社群里,我们为成员挑选整理每日全球跨境资讯,帮助出海人把握最新动态;定期组织出海交流活动,链接出海生态圈,寻找潜在合作伙伴。欢迎添加36氪出海小助手微信(ID:wow36krchuhai-xzs2)申请入群,一同出海!

分享
//
热门行业
|
市场
|
公司
汽车出海
广告图片
关注公众号
扫一扫即刻关注
36氪出海微信公众号

推荐阅读


深度解析

  • TikTok 败诉,全球化的艰难一章才刚刚翻开

    TikTok 案背后, 是更多在美国开展业务的中国企业们,将集体迎来一个并不乐观的信号。

    社交文娱

    TikTok 败诉,全球化的艰难一章才刚刚翻开

    刚刚