36氪出海 - 助力中国公司全球化

  • 英文站 KrASIA
  • 日文站 KrJAPAN
36氪出海
36氪出海
人工智能

36氪出海·AI|为什么AI的创造力被困在文字?

行业大小事 

AI 的未来不在聊天框里,而在界面生成器里
分享:

文字不是唯一

ChatGPT 自诞生以来已成为史上最快速度突破1亿用户的产品,更重要的是,它为世界带来了一个深刻的影响:AI 终于以一种人人都能理解的方式来到大众生活。

然而,这款现象级产品同时也带来了一个叙事陷阱。让很多人误以为,AI 最好的输出形态是文字。

输入一段文字,得到一段文字结果。这样的交互看似简单、自然,却把丰富的背景信息全部压缩成线性结构:无法展示结构、状态、也无法多步骤协作。

比如一个观鸟爱好者,想了解全年的鸟类迁徙图,但得到的结果是一段文字摘要,一以用户想自驾云南,只得到文字版的推荐清单,但最好的呈现应该是图文并茂的路线规划、地图展示和天气叠加,

不是 ChatBot 这种交互模式有错。而是聊天框本身只能输出文字是有问题的。

人的大脑天生是多模态的,可以接收视觉、语音、手势、眼动、触觉、感知空间,但强如 AI,现在也只能给我们一段文字结果?

AI 输出的结果还有更多的可能性吗?

Anthropic 的 CEO Dario Amodei 两个月前在一次公开对谈中说:AI 这么先进的技术,现在的交互模态有像1970年代一样。他毫不留情地指出,以文本为中心的交互范式,本质上是一种「工业时代的媒介惯性」。

李开复在一次访谈时也表达过类似担忧。他说,人类现在误以为 AI 的能力只有「解释世界」。新一代 AI 产品的突破点不会再出现在模型层,而多会出现在「能让模型行动起来」的界面层。

简而言之,做到输出即交付结果,而不是输出只呈现文字解释。

那什么是用户能接受到的更自然、更高效、更沉浸的交付方式?

业内有三个重要的趋势判断:

1、AI 入口从「文字」走向「多模态」

今年的 CHI、NeurIPS、CVPR 上,多模态论文数量首次超过单模态模型。硅谷各大公司也在探索如何让视觉、语音、环境理解成为 AI 的主交互方式,而不是补充。如输出的结果可以是视频、音频、更结构化的图片。

2、从「被动问答」转向「意图驱动」

意图驱动是今年下半年在业内被讨论最多的话题。什么叫意图驱动?简单说,用户只要说想干嘛,AI 帮你实现。在整个过程中,用户也不需要思考用什么软件,调用什么工具,如何完成,只需要说出意图。

也就是说,把 AI 当成一个真正帮你办事的助手。

3、「交互」必须具备可操作性

AI 闹今年采访过的许多工程师都曾提出一个观点:随着 Vibe Coding 成本下降,为什么 AI 只能给用户生成文字答案,而不能生成一个可以用的工具?

今年10 月我们采访的前亚马逊科学家Raphael Shu 也说过,文本是最低效的表达方式,「你不会让一个懂编程的员工用写长段文字解释他的工作,而是让他直接去写程序、构建模块、运行任务。」前AWS科学家让 Agent 学会彼此合作、竞争甚至争吵|和OpenAgents创始人 Raphael Shu 聊群体智能

AI 也理应直接帮我们生成一个小应用。

从文字到多模态

这三条趋势放在一起会发现行业正靠近同一个方向:AI 的交互形态正从「文本问答系统」走向「可操作」的界面生成器。

蚂蚁集团最近推出的灵光 App 就是在交互模式上作出了一些创新。

表面看这款产品还是 ChatBot 形态——大众最容易理解——但输出的结果不再是单一文字。

第一种是交付「结构化内容」,不仅是图文,还有卡片面板、3D 模型、多步骤流程图、动态信息结构、可视化分析。

第二种是交付可互动、修改、分享的应用小工具。具体功能点是一句话手搓小程序的闪应用,以及内置 AGI 相机,能看图说话的开眼功能。

换句话说:ChatBot 的本质不变,但「交付方式」正在被重新定义:过去只能提供文字信息,现在提供的是一个「可执行的界面」与「可复用的工具」。

我们认为,这代表了业内最新的工程思考:有别于把产品界面当静态容器,灵光开始意识到界面是模型的「可生成空间」。

这样的交互也直接扩张了 ChatBot 的能力边界:从语言模型变成了结果模型,又进化成了工具生成器。

更通俗点一点解释,灵光打破 ChatBot 给用户强烈的「聊天感」,在交互上的小小创新让用户意识到,AI 产品可以是自己的工作台。

个体的创造力一下溢出了技术的边界。

根据灵光统计,上线以来,用户已经创建出330万个「闪应用」,大多是生活工具,为孩子搓的英语背单词工具,浇花定时提醒器;摸鱼减压小游戏、赛博朋克风小提琴节拍器,小吃盲盒点菜器……甚至有灵光用户脑洞大开,创建属于自己的支付宝、微信、滴滴打车。

那些长尾的、细碎的、高度个性化需求,第一次被用户创造出来,这在移动互联网时代是完全不可能的。

当然,新产品灵光仍是还在进化的阶段性样本,但它已完成了更关键的一步:通过交互创新,让大众意识到,文字不是 AI 的全部,AI 还有更多丰富的玩法、有更优美的信息质感以及更多可能性。

「人」是自我的创造者

技术发展有一个很有趣的现象:如何落地从来不是由发明者决定的,而是由用户和它如何交互决定。

150年前,爱迪生发明留声机时,把它设想成「办公录音工具」和「学术记录工具」—有点像今天的 DIngtalk。直到六十岁时他才肯承认——流行音乐才是留声机的真正用途。大部分年轻人买留声机是为了听音乐,留声机同时推动了唱片行业的繁荣。

手机亦然,它原本是通信工具,但乔布斯把相机、电视机、音乐播放器「偏执」地装到一个终端,用了触摸屏这种交互模式,手机才成为我们思考、决策、接受信息的界面。

如今在行业最新的讨论是,无论是爱迪生的留声机还是乔布斯的手机,都已经不适合承载 AI 了,当 AI 的能力已远超过去,就不该继续沿用工业时代遗留下来的交互范式:屏幕、键盘、通知栏、输入框。

更极端点说,现在我们习惯的所有交互都不是为AI 而生的,而是互联网而生的。

不要把 AI 禁锢在笼子里。

一个创业者曾和我们聊到,他认为未来 AI 的交互应该是无处不在的:「在今天注意力就是一切的时代,用户根本不需要关心后面的工具调用是怎么做的。就应该直接表达意图,然后产品组成一个完美适配的界面,且用合适的呈现方式,多余的东西一点都不该有。用户怎么方便怎么来。」

AI 可以是手机,可以是眼镜,可以是相机,也可以是网页,者是任何新的新媒介。用户表达意图,AI 自动调用资源与工具,并且自行判断以什么方式交付给你:

我们在路边看到一朵花,拍照本身就代表意图,结果以识别卡片呈现。

我们抱怨减肥难,就应该直接生成可以行动的工具,而不是一段文字。

即便是查旅行攻略如此简单常见的需求,也不该只是一串文字,我们对一个地方的感兴趣触发点往往是一张绝美的风景图,或者一段精彩的旅行视频。

未来的可能性还包括:

走在陌生的城市街区,不用打开地图,停下来的一瞬间,AI 已经帮你指明方向;

在商场扫过一件衣服,还在犹豫,AI 立刻呈现「3D 试穿效果」以及家中有什么单品可以配搭;

开会或者学习时,稍许皱眉,AI 就立刻帮你生成一套通俗易懂的脑图,并配合案例讲解。

这些预测和想象指向同一个逻辑:AI 的价值不在于技术炫技,而在于当用户表达一个微弱意图时,产品能以最适合的交互方式响应。

这也正是灵光展现出的产品哲学——并不急于堆砌更多能力,而是克制地探索,希望每一个功能点,随着时间推移都能发挥更高的用户价值。

从这个角度看,2025年的灵光更像是一个小而美的新尝试。它所完成的探索意义明确:既然AI 已能理解图像、声音与文字,那么我们表达意图的方式也可以是拍一张照片、说一句话,而产品给用户的交付也不止于一次文字作答而是一种交付。

把交付链路尽可能压缩,让交付结果尽可能丰富。从单一文本扩展为界面、结构与工具。

当交互方式一次次被拓宽,人的创造力也会换一种形态涌现:人不再只是提问者,人可以是自我生活的创造者。

图:Unsplash

本文来自微信公众号“AI闹(ID:ainowainow)”,36氪出海经授权转载,如需转载请联系原作者。

欢迎填写表单,获取 AI NOW! 专访机会

AI 技术正在加速全球化进程,全球化带来的市场需求与数据流动反哺着 AI 创新。36氪出海·AI 栏目携手 AI NOW!(AI 闹),聚焦 AI 从业者的多元化视野,挖掘从技术研发到市场落地的实践,探索如何融合 AI 与各行业知识,把握未来 AI 应用场景趋势。如果您是 AI 创业者,或大企业 AI 业务负责人,欢迎扫描下方二维码,填写表单,获得 AI NOW! 专访机会。由于沟通专访的企业较多,AI NOW! 团队希望首先了解您的基本情况,并在筛选后与您联系,请您尽量留下具体、准确的信息。期待共同打造 AI 时代最好的人物访谈。

英文服务

服务KrASIA 英文媒体服务助力中国公司提升全球品牌

在全球经济复杂格局的当下,英文报道不仅是向海外客户和消费者传递价值主张的重要手段,也是企业在世界范围内的认知沉淀。英文媒体 KrASIA(kr-asia.com)致力于向世界介绍中国商业和文化。英文网站约60%的读者为东南亚核心国家的商业人群。KrASIA 通过优秀的搜索引擎优化,专业的英文内容和可靠的社交媒体矩阵,以及全球顶级信息数据平台彭博终端和道琼斯 Factiva 等外部收录平台,帮助中国公司提升全球品牌。如果您的公司对英文传播有相关需求,或者希望与 KrASIA 合作提供出海服务,欢迎点击“此处”或扫描下方二维码,获取 KrASIA 媒体服务刊例和工作人员的联系方式。

加入36氪出海学习交流群

目前,36氪出海学习交流群已经吸引超过15,000位出海人加入,他们来自国内外初创企业、行业巨头、投资机构等。在出海社群里,我们为成员挑选整理每日全球跨境资讯,帮助出海人把握最新动态;定期组织出海交流活动,链接出海生态圈,寻找潜在合作伙伴。欢迎添加36氪出海小助手微信(ID:wow36krchuhai-xzs2)申请入群,一同出海!

分享
//
热门行业
|
市场
|
公司
汽车出海
广告图片
关注公众号
扫一扫即刻关注
36氪出海微信公众号

推荐阅读


深度解析

  • TikTok 败诉,全球化的艰难一章才刚刚翻开

    TikTok 案背后, 是更多在美国开展业务的中国企业们,将集体迎来一个并不乐观的信号。

    社交文娱

    TikTok 败诉,全球化的艰难一章才刚刚翻开

    刚刚