《智能涌现》独家获悉,近日,百度召开2024年第三季度总监会,由百度集团创始人、董事长兼首席执行官李彦宏,以及百度内部总监级以上管理人员参加。
第三季度,也被称为百度的战略季。在李彦宏近万字的发言中,AI仍然是主角。以AI为轴心,李彦宏提及了搜索、数字人、智能体、大模型调用、萝卜快跑等业务的发展战略。
更重要的是,在AI资源紧缺、造血尚早的当下,百度也需要对业务的发展策略进行取舍。比如,李彦宏提到,百度不碰Sora类的视频生成,“10年、20年都可能难以商业化应用”。
他也指出,ToB业务尽量不碰吃力不讨好的项目制,尽量推出标准化产品。而文心一言改名后的ToC新搜索应用“文小言”,在推广上则不会像字节跳动的豆包、月之暗面的Kimi那样激进。
以下是《智能涌现》对百度2024年第三季度总监会李彦宏发言稿的整理和总结:
搜索:智能体是搜索与大模型结合的方向
李彦宏认为,搜索的重构进度是比较慢的,但是他也理解该业务历史沿革周期较长,员工的观念难以在短时间内做出调整和转变。
目前,他认为搜索和大模型的结合,更多应该是在智能体上。在他看来,智能体现在还并不是一个行业的共识,只是百度下的一个赌注,“我们会认为智能体未来会是内容、服务、信息的新载体,甚至是主要的载体。“
但基于这样的假设,李彦宏认为,智能体跟之前的视频流或者图文流内容生态,都会面临同样的问题:你怎么把它分发出去?
问题的解法,在他看来,搜索还是一个主要通道,“因为智能体的形态对话流。如果是靠上下滑动的操作,是没有办法跟智能体去做结合和交互的。”
对于智能体的发展趋势,李彦宏判断,随着基础模型越来越强大,智能体的门槛会越来越低;但与此同时,智能体也可以把天花板拉得非常高,因为智能体的自我反思、进化、工具的使用等技术,都还非常早期,以及多智能体的群体协作,目前在产业上还没有看到实际的落地。
因此,李彦宏认为,若是深入到各个场景中去研判,智能体能构建的东西还很多,想象力仍然存在。
他还提到,智能体已经初步验证了商业价值,“今天我们有几十万家广告主,已经有上万家在尝试接入商业智能体,让它的广告效果更好、转化率更好,然后更好地去触达和沟通这些目标客户,并且是愿意真金白银地付费。”
基于对搜索的全新认知,李彦宏认为,搜索的重构和重建应该分成两步:
● 搜推融合:
搜索做任何的改变,不仅要看对搜索场景下核心业务指标的影响,也要看对Feed这个核心业务指标的影响。
空框推荐(比如百度搜索框中会预置一些词和句子)的本质是一种推荐,因为这个词不是由用户来Input的,只有用推荐的理念来做才是正解。
● AI要和移动生态结合:
AI需要跟移动生态做进一步融合,比如图像用户界面和自然语言界面怎么结合会更自然,这会是未来搜索发展的一个范式。
数字人:未来主流的产品形态是真人和虚拟人的交互
在李彦宏看来,PC和移动互联网时代的主流交互形式,是真人和真人的交互,代表产品是微信。
“我们现在很难想象虚拟人和虚拟人之间的交互有什么实际价值”,李彦宏提到,“所以我觉得价值还是落在真人和虚拟人的交互。”
但他也坦言,真人和虚拟人交互的Use Case,需要一定的摸索过程,这个过程会伴有阵痛——今年以来,百度就面临这样一种阵痛,因为虚拟人的效果开始没有那么好,此时往上强推,对用户体验是一种损害。
不过,李彦宏依然乐观地认为,技术的进步会倒逼产品的提升,未来虚拟人和真人之间的交互体验,甚至会超过真人和真人之间的交互。
具体到虚拟人的落地场景,李彦宏提到了直播。他认为,今年的电商直播是很主流的一个产品形态,他会思考董宇辉、辛巴这样的大V的特点和能力,能不能被数字人所复制,“这里面还是有一点想象空间的”。
李彦宏举了一个可以跑通的场景:百度电商直播有很大一部分已经是数字人直播,脚本完全由AI生成。现实中,有很多冗长的数据,真人主播不一定能完全记住,但是数字人在记忆上完全没有问题,甚至比真人更好。
除了AI脚本生成,李彦宏认为互动是另一个比较重要的场景,哪怕这一块对数字人来说还有难度。
在虚拟人上,李彦宏还看到了更多的产品形态。除了直播外,还有视频。他提到,数字人直播应该对标视频中的真人能力,而不是直播中的真人能力,因为数字人从理论上来讲,应该经过了大量的训练和打磨,就好比很多高质量的主流视频,也经过了一遍遍的打磨和重拍。
智能体:未来更多合成数据会被用于训练
李彦宏认为,数字人直播和智能体是同根同源的,因为数字人直播有自己的知识库,和workflow这些基本要素。当智能体和多模态两块技术相结合,可能就是未来数字人的演进方向。
他提到,百度自2023年Q4起开始重视智能体的技术发展,今年智能体领域越来越火热。他观察到,OpenAI发布的o1模型是基于强化学习打造的,代表了OpenAI对智能体的期待,代表了训练范式从Transformer回归到强化学习,意味着需要设计很好的奖励模型。
目前对Scaling Law的质疑声越来越多,但李彦宏认为,中国市场环境中其实很多有价值的数据还没有被真正应用于训练,比如直播相关的数据和多模态数据。
在他看来,强化学习和Scaling Law一样面临着算力和数据的瓶颈,未来更多训练数据会靠合成数据来补充,而且是要靠对技术或者场景的具体理解来合成。
李彦宏判断,未来智能体能大幅提高人类的工作效率,但要释放智能体的潜力,还需要很多技巧。2023年3月,李彦宏曾提到50%的人类工作,到最后还是提示词工程。如今,他还是持相同的观点。打磨提示词,是释放智能体潜力的其中一个技巧。
再者,李彦宏提到,智能体上下文的语境中有个很重要的概念,叫“工作流”。工作流简单来讲就是“套路”,如果能把套路拆解清楚,那它就成了工作流,未来AI和机器就能把它自动化。
“今天世界上大部分方法论,其实还没有被数字化。”李彦宏认为,其中还有很大的价值释放。
大模型的调用:AGI是百度的长期目标
李彦宏提到,现在大模型的调用有一些新的共识,比如通过大模型蒸馏出的小模型,在小模型当中是很有竞争力的,会比从头开始训的小模型能力更强。
当下,李彦宏比较重视API的调用量,因为调用量越大,反馈越多,就能去提升基础模型的能力,也代表市场对百度基础模型能力的认可。
同时,李彦宏也提到了一些非共识的判断:
● API的调用质量比数据更重要。如果只强调调用数量的话,很容易引起作弊;
● 大模型的效果整体还是优于调优过后的小模型。如果对响应速度和推理成本要求很高,可能更适合使用调优后的小模型;但对时间不敏感,想要效果好,还是用大模型。
他也强调,AGI是百度的长期目标。李彦宏认为,AGI不可能是半年、一年内就能实现的。
因此在发展过程中,百度需要有所取舍。李彦宏提到,短期内大模型还是要为场景去做优化,他也不追求一个统一的、通用的、在排行榜上能测出来第几名的大模型,而是想看看在应用场景中,百度的模型是不是超越了竞品,是不是真正实现了比真人做的东西更好、效率更高。
关于团队组织形式,他认为百度要内外部的协同,比如共享研发资源,共同承担研发成本,而且要确定在百度选定的核心场景中去领先,而不是追求一个完全通用和强大的版本。
萝卜快跑:数据飞轮越简单越好
李彦宏认为,萝卜快跑已经走在了世界的前列。
他提到,所谓的L4的技术路线一直都有争论:一条是所谓的特斯拉坚持的端到端纯视觉,另一条是基于规则的路线。在他看来,两条路线各有各的道理,主要看谁先跑出L4。
比如,今天特斯拉的方案,能不能在武汉实现完全无人化驾驶,或者两到三年后能不能超越分层的端到端。李彦宏认为,二三十年后是可以实现的,但是拐点在哪里,决定了百度现在采用什么技术路线去解决这个问题。
针对2024年7月萝卜快跑代替人类司机的话题,李彦宏也分享了两点思考:
● 历史上的工业革命其实都是在颠覆底层最辛苦的工作,同时也创造了一些更舒适、更优雅的工作。比如说今天没有人抬轿子了,也没有马夫了。
李彦宏认为,搞创新就是要去替代那些最辛苦的工作,让劳动力转移到更不辛苦的工作上去。技术的进步,总体来说还是比较积极的。
● 人工智能时代,甚至是 AI 和大模型带来的机遇中,应该也包含着组织创新和流程创新的机遇。
李彦宏认为,数据飞轮是AI原生应用成功的充分必要条件,但这其中还有很多大家想不清楚的东西:
比如数据飞轮应该是基于特定领域的know-how或者数据来做的,但业务流程是不是真的在不断生产这个领域的知识和数据?这件事情你是不是有意识地去做?李彦宏认为,这方面的行业意识还没那么强。
同时,他认为数据飞轮越简单越好。因为节点越多,转起来越慢、越复杂,每个飞轮的规模也不大。所以李彦宏希望设计的少就是多,简单就是复杂。
资源分配:基础模型至少要在中国领先同行半代
李彦宏认为,目前百度的资源主要聚焦在让长板更长。至于补短板的时间点,就是当不补短板,长板就成不了的时候。
在他看来,目前百度的资源分配重点有以下几块:
● 基础模型至少要在中国领先同行半代。百度会继续保持对基础模型的投入;
● 在重点场景上要超过竞品,要能为业务和产品创造价值,而不是毫无差别地去提升基础模型的通用能力;
● 在新一轮的组织调整中,HCG(健康事业群组)并入了MEG(移动生态事业群),这样整体效率会更高;
● 内容生态要建设得足够稳固和有特色,才能做成很多其他工作。比如智能体可以说是“诗和远方”,但眼下还是要做好用户心智,让创作者知道来百度创作或者提交内容有什么好处,或者让用户感知到在百度上可以看到什么样的内容,或者百度擅长什么样的内容。
其中,李彦宏特别提到了对于ACG(智能云事业群组)的规划:
● 首先,ToB业务一定要标品化。标品化对应的就是项目制,项目制有很多需求,需要派很多驻场人员,要有很多的后台研发改造。
像Comate这样的标准化产品,虽然现在还卖不了多少钱,不够有竞争力,但李彦宏觉得没关系,这种产品的起点比较低也是可以包容的,因为只要持续的投入,把它的门槛提高,拉大跟竞品的差距,未来还是一个好的方向。
● 其次,ACG要聚焦中腰部的客户。李彦宏认为,那些可以作为标杆的特大客户,很多时候从他们身上赚不到什么钱;特别长尾的也不好做——因为手上没什么钱。
取舍: 不做视频生成,没必要激进推广
最后,李彦宏提到了战略取舍,也是对总监会内容的一个总结。首先是四个“取”:
● 继续坚持投入下一代模型的训练中;
● 继续打造智能体的生态,虽然这还不是产业的共识;
● 以API调用为牵引来发展智能云;
● 萝卜快跑要继续扩大规模。
最后是三点“舍”:
● Sora这种视频生成的投入周期太长了,10年、20年都可能拿不到业务收益,那么无论多么火爆,百度都不去做;
● New App“文小言”的推广没必要像豆包、Kimi那样激进;
● 项目制能不碰就别碰,如果要碰,就得安全地挣到钱。
头图|Pexels
本文来自智能涌现,文|周鑫雨,编辑|苏建勋 杨轩,36氪出海经授权转载。
如何正确选择目标市场,并因地制宜制定市场战略,成为企业出海至关重要的一环。为帮助企业更好地把握出海机遇,10月23日下午2:30,36氪出海携手出海基地在北京举办交流活动。来自安永大中华区和梅卡曼德机器人的重磅嘉宾将带来全球热门出海目标市场的最新趋势,深入解析企业全球化市场战略的关键方法论,并结合企业自身案例,分享出海实践中的宝贵经验,帮助企业更好地实现全球新市场拓展。欢迎扫描下方二维码,填写表单,报名参加本次活动。活动报名将于10月22日中午12:00截止。
加入36氪出海学习交流群
目前,36氪出海学习交流群已经吸引超过15000位来自国内外初创企业、行业巨头、投资机构等出海人加入。在出海社群里,我们面向群成员挑选整理每日全球跨境资讯,帮助出海人把握最新动态;定期组织出海交流活动,链接出海生态圈,寻找潜在合作伙伴!欢迎添加36氪出海小助手微信(ID:wow36krchuhai-xzs2)申请入群,一同出海