阿里通义千问主力模型直降97%，大模型赛道也卷起来了

大模型赛道，开启残酷价格战。

5月21日，阿里云宣布通义千问 GPT-4 级主力模型 Qwen-Long，API 输入价格从0.02元/千 tokens 降至0.0005元/千 tokens，直降97%。随后百度智能云也宣布，百度文心大模型的两款主力模型 ENIRE Speed、ENIRE Lite 全面免费，立即生效。

此前，字节跳动已宣布旗下豆包主力模型在企业市场的定价只有0.0008元/千 Tokens，0.8厘就能处理1500多个汉字，比行业价格便宜99.3%。除此此外，幻方、智谱也官宣了新的价格体系。

这样的趋势，同样也在国外发生。OpenAI 在刚刚结束的春季功能更新会上，宣布了其最新模型 GPT-4o，不仅性能有大幅提升，所有用户均可免费使用。

业内普遍的认识是，此轮价格战的主要目的是把“蛋糕做大”，推动大模型使用进入快速增长阶段。但对于一些规模较小、实力较弱的模型提供商来说，价格战往往会导致利润空间的压缩，可能会在这场竞赛中被淘汰“出局”。

大模型掀起“价格战”

经过2023年大模型领域的摸索，由 ChatGPT 带热的 AI 大模型，在今年走到了终端应用时代。随着竞争加剧，单纯的技术竞争之外，“价格力”成为国内外厂商比拼的关键一环。

其中广受瞩目的是，5月14日 OpenAI 召开春季发布会，正式推出新一代旗舰 AI 模型“GPT-4o”，不仅在功能上大幅超越 GPT-4 Turbo，在价格上更是带来惊喜。

据官方介绍，新模型 GPT-4o 用户不用注册，功能全部免费。在此之前，ChatGPT 的免费用户只能使用 GPT-3.5。而更新后，用户可以免费使用 GPT-4o 来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

当然，免费的前提被限制在一定的消息数量上，一旦超过规定数量，免费用户的模型将被切换回 GPT-3.5。而付费用户将获得更高的消息数量，至少是免费用户的5倍。

国产大模型在价格竞争方面，也不甘落后。5月6日，私募巨头幻方量化旗下的 AI 公司推出了第二代 MoE 模型 DeepSeek-V2，其 API（应用程序编程接口）定价为每百万 token 输入1元、输出2元（32 K 上下文），仅是 GPT-4 的近百分之一水平。

5月11日，智谱大模型官宣新的价格体系，入门级产品 GLM-3 Turbo 模型调用价格从5元／百万 Tokens 降至1元／百万 Tokens，降幅高达80%。

随后的5月15日，首次对外公布大模型产品的字节跳动，就主动打起了价格战。据悉，字节发布的自研大语言模型“豆包大模型”，其豆包 Pro 32k 模型正式定价是1千 Tokens 0.8厘，比行业的价格降低99.3%；豆包 Pro 128k 模型正式定价为是1千 Tokens 5厘钱，较行业价格降低了95.8%。

对此，火山引擎总裁谭待解释称，一方面，字节可以在大模型产品上做到低价，在模型结构、训练、生产等技术层面有很多优化手段能够实现降价，另一方面则是因为市场对降价呼声比较大。

字节跳动之后，其他互联网大厂纷纷跟进。5月21日，阿里云也加入大模型价格战，宣布通义千问9款商业化和开源模型降价。

据了解，这9款大模型整体推理输入价格降幅为67%-97%，有2款开源模型提供七天免费优惠。

其中，通义千问 GPT-4级主力模型 Qwen-Long 的 API 输入价格，从0.02元每千 tokens（大模型文本中的最小单位）降至0.5厘每千 tokens，降幅为97%。

这意味着，1块钱可以买200万 tokens，相当于5本《新华字典》的文字量。此外，不久前发布的通义千问旗舰款大模型 Qwen-Max，API 输入价格降至0.04元/千 tokens，降幅达67％。

仅仅数小时之后，5月21日下午，百度在其公众号发文称，文心大模型两大主力模型 ERNIE Speed 和 ERNIE Lite 全面免费。

百度这两款大模型发布于今年3月，支持8 K 和128 K 上下文长度。按照过去的定价，ERNIE Lite 输入0.003元/千 token，输出0.006元/千 token。ERNIE Speed 价格为输入0.004元/千 token，输出0.008元/千 token。

至此，群雄竞逐的大模型价格战正式进入白热化。

厂商忙于“做大蛋糕”

在大模型这样“烧钱”的行业，偏偏打起了价格战，原因何在？加快商业化落地或是主要目的。

“池塘有多大，鱼就有多大，现在整个池塘还在培养的过程。”谭待表示，目前大模型仍处于百家争鸣的状态，需要大家一起实现应用落地、降低成本，让更多人受益。

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光也称，阿里云这次大幅降低大模型推理价格，目的就是希望加速 AI 应用的爆发。阿里云预计未来大模型 API 的调用量会有成千上万倍的增长。

目前来看，相比缺乏付费意愿的 C 端用户，B 端企业服务仍是大模型目前最主流的商业化路径。

国际数据公司 IDC 曾在2023年四季度开展过一次 AI 应用调研，结果显示，在100家受调企业中，对生成式 AI 完全没有规划的企业比例只有7%，这也意味着超九成被调查企业已布局了 AI 应用。

5月16日，在百度2024年第一季度财报电话会上，百度创始人、董事长兼首席执行官李彦宏透露，继上季度与中国三星、荣耀合作后，本季度，小米、OPPO、vivo 等手机厂商均接入文心大模型 API。

李彦宏表示，大模型的合作领域还在从手机向 PC 和电动汽车领域拓展，联想和蔚来汽车也在季度内与达成合作。

其中率先投入使用的生成式 AI，已帮助相关企业实现增收。爱奇艺第一季度在线广告营收15亿元，同比增长6%。其中，效果广告营收同比两位数增长。这主要得益于生成式 AI 赋能广告提质增效，AI 制作广告素材带动游戏、短剧等行业广告主投资回报率提升超50%。

字节跳动的 AI 路线图一直颇为神秘，从目前披露的信息来看，豆包大模型已经在字节跳动内部多个业务场景落地，包括基于豆包大模型打造 AI 对话助手“豆包”、AI 应用开发平台“扣子”、互动娱乐应用“猫箱”，以及星绘、即梦等 AI 创作工具，并把大模型接入抖音、番茄小说、飞书、巨量引擎等50余个业务。

目前，豆包 App 已在苹果 APP Store 和各大安卓应用市场可下载。

值得一提的是，声称性能已居国内第一梯队的腾讯混元大模型，同样将“产业实用”作为发展大模型的核心战略。

腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生介绍称，腾讯发展大模型的核心战略是“产业实用”，“构建起离产业最近的 AI，助力千行百业智能化升级”。

据了解，腾讯云智能行业大模型也已在金融、医疗、教育、汽车、能源等20多个行业落地。此外，腾讯还将于5月30日发布基于混元大模型、面向 C 端的助手 APP“腾讯元宝”。

截至目前，腾讯大模型似乎还未参与到眼下的“价格战”中来。

成本困境仍有待解决

在不断击穿底价甚至免费的“激进”策略下，大模型厂商“跑马圈地”的意图明显。但在价格降至“白菜价”后，还能否覆盖掉昂贵的训练成本？

从成本的角度来看，大模型的训练和维护成本非常高昂。据媒体报道，Gemini Ultra 的训练成本高达1.91亿美元，而 GPT-4 的开发成本估计为7800万美元。

除此之外，大模型提供服务时还大量消耗其他资源。据《纽约客》杂志引援国外研究机构报告，ChatGPT 每天要响应大约2亿个请求，在此过程中消耗超过50万度电力。

加州大学河滨分校研究显示，ChatGPT 每与用户交流25-50个问题，就可消耗500毫升的水。

毫无疑问，大模型的高昂成本增加变现难度。在行云集成电路创始人季宇看来，大模型的商业落地与早期互联网时代相比区别很大，边际成本仍然非常高。大模型每增加一个用户，基础设施需增加的成本是肉眼可见的，一个月几十美元的订阅费用根本不足以抵消背后高昂的成本。

在此背景下，目前市场上主要的大模型参与者，都在通过技术优化等方式不断推动训练成本的降低，以加速大模型的商业化落地。

以字节豆包大模型为例，谭待坦言降价的背后主要原因是技术上可以实现，未来还有很多手段继续降低成本。

据其介绍，火山引擎在技术上有非常多优化手段，可以降低大模型成本，此外在工程上可以通过分布式推理的形式将底层算力使用得更好；另外，在混合调度方面，可以把不同负载作为混合调度，这样的成本也大幅下降。

银河证券研报认为，DeepSeek-V2 提升数据集质量及优化架构，大幅提升训练效率，降低训练成本，训练所需计算量约为 GPT-4 的1/20，但性能上基本相差无几。

不过，并非所有人都认同简单粗暴的“价格战”打法。“大模型从训练到服务都很昂贵，算力紧缺是这一赛道的集体挑战，行业应当共同避免陷入不理性的 ofo 式流血烧钱打法，让大模型能够健康地蓄能长跑。”零一万物 CEO 李开复称。

北京智源人工智能研究院院长王仲远也认为，大模型卷价格是一把双刃剑，价格降低有利于产业普及和推广，但如果价格低于企业实际成本，将扰乱市场。

更值得关注的是，对于资金雄厚的大厂而言，降价将能够扩大用户群体，从而进一步平衡收入和成本。但对于资金紧张的创业公司，价格战可能就是让企业淘汰出局的致命一击。

时至今日，大模型仍属于新兴事物，其商业化是一个复杂且充满挑战的过程，企业想要跳出“烧钱”的怪圈还需更多的尝试。

图｜Unsplash

本文来自微信公众号“鸿途FLY”，作者：肖洒，编辑：深海，36氪经授权发布。

活动｜聚焦科技创新合作，上交会·日本大阪企业技术推介会即将举办

6月12日，第十届上交会境外主宾城主题日活动——日本大阪企业技术推介会将以“遇见科技世博，共赴未来社会”为主题，在上海市世博展览馆1号会议室举办，为与会企业介绍日本大阪市的商业趋势与出海机遇，并通过项目对接，促进中日企业的交流与合作。此外，本次活动还将围绕节能环保、先进制造、健康医疗等领域，邀请中日企业开展项目对接交流，促进城市间科技经贸合作。欢迎扫描下方二维码，填写表单，报名参加本次活动。我们将根据话题相关度，对报名申请进行筛选。通过活动审核的用户，我们将有专人联系，同步参会信息。活动报名将于2024年6月11日中午12:00截止。

活动｜迪拜商业论坛中国，解锁出海中东机遇

2024年8月21日至22日，迪拜商业论坛中国（Dubai Business Forum China）将在北京开幕。作为享誉全球的峰会，本次论坛将迎来中国顶尖的商界领袖；由迪拜知名企业组成的代表团也将访问中国，与诸多中国企业进行对话、建立联系，共同探索合作的方向和机遇。迪拜商会（Dubai Chambers）将主办本次迪拜商业论坛中国。如果您对这场全球性的峰会感兴趣，您可以扫描下方二维码，填写36氪出海的预约表单，申请参会席位。我们将向迪拜商会提交您的报名信息，并待审核通过后与您联系，确认您的出席。

加入36氪出海学习交流群

目前，36氪出海学习交流群已经吸引超过13000位来自国内外初创企业、行业巨头、投资机构等出海人加入。在出海社群里，我们面向群成员挑选整理每日全球跨境资讯，帮助出海人把握最新动态；定期组织出海交流活动，链接出海生态圈，寻找潜在合作伙伴！欢迎添加36氪出海小助手微信（ID：wow36krchuhai-xzs2）申请入群，一同出海！