从Kimi Chat说起
如果要问最近一段时间里国内AI(Artificial Intelligence,人工智能)界最出圈的产品是什么,那么Kimi Chat(Kimi智能聊天机器人程序)或许是最为合适的答案。在过去几个月中,这款大语言模型凭借着其卓越的长文本处理能力,一下子在强敌林立的大模型圈里脱颖而出。在今年年初,KimiChat的用户还不足百万,而到了三月,其用户量已经达到了三百多万。随着用户量的迅速增长,这款AI应用很快就成为了各大媒体争相报道的焦点,而开发这款应用的AI独角兽公司月之暗面,以及该公司的天才创始人杨植麟更是成为了网络的热搜词汇。甚至还有一些券商不甘寂寞,赶忙搞出了一连串“Kimi概念股”来供投资者参考。
随着KimiChat的爆火,“长文本”这条原本相对冷门的赛道很快就变得拥挤了起来。目前,KimiChat可以支持的文本处理长度为20万字,内测支持的文本长度为200万字。为了能够技压Kimi一头,各大AI企业新发布的模型在处理文本长度上的能力可以说是一个比一个恐怖。比如,360很快就宣布已在内测500万字长文本的处理功能,百度的文心一言则宣布将免费开放能够处理200万—500万字长文本的能力,而阿里的通义千文则更是开放了1000万字的长文本处理能力……这种一家更比一家长的做法,真是“卷”出了新高度。
Kimi Chat在将文本处理的限制提升到了200万字之后,完全超出了实际的使用需要。毕竟,200万字已经差不多等于一整套《莎士比亚全集》的长度,一般用户几乎没有什么需要去一次性整理或提炼如此庞大的文本。各大AI企业不断“卷”文本处理长度,究竟有什么实际的价值?
在阅读了一些相关的资料后,我终于恍然大悟:从根本上讲,AI企业们疯狂地“卷”文本处理长度,或许并不是因为它有什么实际的用处,而只是因为从技术上实现它其实并不那么困难。现在,处理长文本的技术路径其实无外乎外部召回、模型优化、注意力计算优化等几条,而每一种技术路径都已经有了大量的公开文献甚至开源程序。因此对于那些实力较为雄厚的AI企业来说,要加入这个功能其实很容易,只不过最初基于种种原因,没有及时提供这一功能而已。然而,当KimiChat借助长文本意外爆火之后,这个冷门功能就成了用户用来比较大模型性能的重要参考指标之一。这样,为了让自己的产品不至于在用户心中排序掉队,AI企业们就不得不将更多的资源投入到这个功能上。
有意思的是,有媒体曾对某AI企业进行采访,问为什么该企业要将大量资源投入到长文本的竞争,而不是将它们投入到更为高端的功能,比如像Sora(由OpenAI开发的AI视频制作工具)那样的文本生成视频(以下简称文生)上。企业方面的回答是:那个门槛太高,卷不动。这个回答,实在是耐人回味。
内卷是一个多输的结局
各大AI企业竞相涌入长文本赛道,只是如今AI圈内卷的一个表现而已。事实上,从2022年末ChatGPT(GPT智能聊天机器人程序)的发布引发了AI大模型热潮以来,整个AI圈就经历了很多轮的内卷。一开始是卷模型,然后是卷参数,再后来是卷多模态……在每一轮内卷中,企业们都争得头破血流,但从事后看,似乎所有的内卷都没有什么意义,甚至还有些荒唐。
对于AI行业的发展而言,无谓内卷的负面影响是巨大的:
其一,它会带来一种对所有人的浪费。从性质上讲,无谓的内卷其实是“囚徒困境”的一种体现。博弈论的知识告诉我们,它可能将所有人都带入更为糟糕的境地。
其二,它可能会给真正的创新者带来巨大的伤害。虽然内卷会对所有AI企业都造成浪费,但由此造成的损害并不是对称的。现实中,创新需要巨大的投入。如果创新者被动卷入了这种无谓的消耗,那么它们本不充足的资源就会更加捉襟见肘。
其三,即使对于胜出者而言,这种由内卷得来的胜利也是脆弱和无利可图的。著名的互联网出版人、Web2.0概念的提出者蒂姆·奥莱利(TimO'Reilly)在最近为科技媒体《信息》(The Information)撰写的一篇评论中指出,现在的AI圈似乎正在出现“优步问题”(Uber Problem)。他指出,几年前网约车(网络预约出租汽车)刚刚在市场上出现时,各大网约车平台曾进行过一次疯狂的低价大战。最终,欧美市场上的优步(Uber)、中国市场上的滴滴(滴滴打车)分别依靠巨额的补贴,成为了市场的“垄断者”。然而,和过去的垄断者不同,优步和滴滴并没有任何的定价权。只要一尝试提价,用户就会倒向其他的小网约车平台以及巡游出租车,它们的市场份额就立即出现大量流失。这导致了它们虽然控制了巨大的市场份额,但盈利状况却一直非常糟糕。在奥莱利看来,如今的AI圈似乎也正在步网约车的后尘,如果这种情况继续,那么即使某个AI企业最终从内卷中胜出,它的市场地位也将非常脆弱。
其四,从长期看,这种内卷也会对消费者的福利构成损害。AI企业的内卷需要大量投入资源,从长时段看,为了对这种巨量的投入进行补偿,企业要么能在未来对消费者收取更高的费用,要么就需要设法压缩各种费用,以降本增效。但这些努力都可能最终损害到消费者。关于这一点,我们依然可以从网约车行业的发展史来找到对应。当补贴大战的胜利者们发现很难通过提价来让自己盈利后,就转而设法去增加向司机要求的分成。这样一来,司机的劳动积极性就受到了打击,其服务质量也就随之下降了。现在,一些网约车司机的服务质量甚至还不如传统的巡游出租车,相当一部分的原因就在此。虽然AI和网约车在行业性质上存在着一定的不同,但我们依然可以就此推论,如果无效内卷持续进行,那么未来消费者们可以享受到的服务质量将会大打折扣。
综合以上分析,我们可以得到结论:AI行业的疯狂内卷,最终将会导致一个“多输”的结局,无论是企业还是消费者都不会从中受益。
内卷为何产生?
这样一种大概率会导致“多输”的行为,又为何会被行业中的众多AI企业共同选择呢?它其实简单延续了数字时代企业的普遍发展逻辑,而这种发展逻辑的形成,则是行业特征的演变、战略思维的变化,以及产业和投资关系的变动等因素共同作用的结果。
相比于传统的工业时代,数字经济时代的新兴行业有很多新型的特征。其中,最为关键的两个特征就是规模经济和网络效应。
首先要看规模经济。在关于数字经济的各种著作中,“零边际成本”是人们津津乐道的一个词汇。然而,很多著作在讨论“零边际成本”时,都忽略了实现它的前提是巨量的固定资本投入。比如,虽然网约车平台多接入一个用户的边际成本接近为零,但前期搭建平台所需要的资金却是巨量的。这种前期的高固定成本投入和后期近零边际成本的结合,就决定了数字行业的规模经济特征——当一个企业的规模变得更大时,其前期的固定成本将会得到更大的分摊,因而它们在平均成本上的优势就会变得更大。
再看网络效应。所谓网络效应,指的是使用某种商品的总人数对使用该商品的用户效用的影响。现实中,很多数字产品都具有显著的正网络效应。它们的用户群体越庞大,用户对它们就越喜欢,该产品也就可以进一步吸引更多的新用户。
无论是规模经济还是网络效应其实都提供了一个隐喻:在数字经济时代,要想在市场上获得成功,规模将是关键。在这种隐喻之下,规模就超越了质量、差异化等一系列指标,成为了企业追求的最重要目标。
伴随着这个变化,甚至出现了很多著名的企业战略理论。比如,硅谷的投资人里德·霍夫曼(ReidHoffman)就曾经提出过一套著名的“闪电式扩张”(Blitzscaling)的理论。该理论的核心观点是:现代的商业环境充满了不确定性,而要战胜不确定性,企业就需要优先考虑扩张的速度而非效率,然后通过快速行动来构建自己的竞争优势。基于这个核心观点,霍夫曼提出了很多非常颠覆传统的论断。比如,为了保证扩张的速度,企业可以容忍不完美的产品、不在乎用户的感受,以及容忍混乱的管理。在现实中,“闪电式扩张”理论的影响非常巨大。无论是当年网约车大战的参与者,还是现在仍在AI赛道上积极内卷的企业家,很多都是这套理论的忠实拥趸。
“闪电式扩张”的一个后果是,它让企业对于资金的需求变得空前强烈。要迅速实现规模的扩张,企业就必须大量“烧钱”。现实中,很少有企业可以支持如此巨大的投入。那些初创企业的情况更是如此。
在这种情况下,企业对于外部投资人的依赖将会变得更为强烈。为了获取投资者的认可,企业家们就必须更多地在进行经营决策时听取他们的意见,由此,企业的经营将会从“面向用户”异化为了“面向投资”。通常来说,比起处在一线的企业家,投资人们无论是在对市场的感悟,还是对信息的掌握上,都会逊色不少。与具有创业激情的企业家相比,投资人们会更为关心一些看得见的指标,比如具体的市场份额,以及市场上流行的某些产品功能等。这样的后果是,技术和市场的发展方向很大程度上将会从企业家主导转向资本主导。
上述的故事正在AI行业重演。众所周知,AI模型的开发是一个对资金要求很高的行业。要训练一个大模型,需要的GPU就达到了数千个。仅这一项,所需的资金就可能达到数亿元。这使得除了少数的在位巨头之外,大部分的AI企业必须寻求外部投资者的支持。而从投资人的角度看,为了保证其投资的回报,他们会对企业的能力进行甄别。作为非专业人士,他们的甄别指标经常是一些外界比较容易观测的项目,比如该企业开发的模型在参数量上是否领先,是否具有某些市场上热捧的功能(如多模态能力、长文本处理能力),以及模型的市场份额是否比对手更高等。为了迎合投资人的这些要求,多数AI企业即使不愿意,也会不得不被动地加入无意义的内卷。
内卷为何没有前途?
从AI企业经营者的角度看,如果他们想走出内卷,就必须先对自己的商业模式进行反思。如前所述,现在很多的AI圈内人都笃信霍夫曼的“闪电扩张”理论,认为只要能够借助资本之势抢占市场先机,即便自己的产品并没有那么出色,也可以迅速让自己在市场上站住脚跟。至于产品的特色,以及相关的盈利模式等问题,则可以留待以后再谈。不过,这种思路存在着很大的问题。(1)竞争无壁垒,扩张难守成
霍夫曼在阐述“闪电扩张”的理念时,也强调了在迅速扩张之后建立壁垒的重要性。这一点似乎一直被人们所忽略。在一些人看来,AI领域已经天然存在着两个壁垒——规模经济和网络效应。既然这两个特征天然有利于规模更大的企业,那么只要一心把市场规模做起来,它们就可以帮助自己阻挡市场的侵蚀。遗憾的是,这样的观点认识可能并不正确。
先看规模经济问题。正如我们已经指出的,规模经济现象是前期的高固定成本投入和后期的零边际成本(或低边际成本)共同作用的结果。那么,AI产业是否具有这样的特征呢?应该说,在模型的训练和开发阶段,高固定成本投入的要求是存在的。不过,在模型的推广阶段,却很难看到零边际成本的情况。在当前的实践中,除了像ChatGPT这样的明星模型可以在完全没有任何宣传的情况下实现用户量的高速上升外,多数AI模型都必须借助大量的推广才能吸引用户。据报道,即使如Ki-miChat这样在国内堪称现象级的产品,其平均获客成本也达到了10元。更为重要的是,为提供相应的服务,维护用户的不流失,AI企业还需要付出大量的额外成本。并且当用户的规模达到一定程度之后,拥挤效应还会导致边际成本呈现上升的趋势。根据这些情况,我们不难发现虽然AI行业确实可能在一定的范围内存在规模经济,但它绝不是无限的。
再看网络效应。不少AI企业的经营者认为,AI作为一种数字产品,理所应当具有网络效应。但其实,这很可能是一种误解。
从性质上讲,网络效应分为两种:一种是直接网络效应,另一种则是间接网络效应。所谓直接网络效应,即产品的用户数量对用户评价的直接影响。所谓间接网络效应,指的则是产品的用户数量对用户评价产生的间接影响。在平台条件下,有一种特别的间接网络效应,被称为组间网络效应。这种网络效应指的是,处于平台两边的用户对平台的评价都会因另一侧平台用户数量的增加而得到提升。对于平台而言,组间网络效应是十分关键的,因为它会产生一种类似“鸡生蛋、蛋生鸡”的回振效应。这种回振效应的存在,让相关的补贴策略往往可以产生可观的乘数效应。所以,在当年的网约车大战中,各大平台之所以会不遗余力地对用户进行补贴。
在对于网络效应有了以上了解之后,我们可以来看一下AI大模型是否具有上述的网络效应。
先说直接网络效应,即使它存在,效应也不会很大。至少在现阶段,AI大模型更多还是被人们当成工具来进行使用。而一款模型用户的多少,显然不会对产品的性能产生什么影响,因而也不会影响用户的评价。尽管在实践当中,那些用户更多的AI模型多少带来些口碑效应,但也不会太多。恰恰相反,对于AI这样的产品,人们反而有一种尝鲜的偏好,当有性能接近的新模型出现时,人们会更倾向于尝试它们,这就会导致旧模型用户的流失。以ChatGPT为例,它在所有AI大模型中,起步是最早的。到目前为止,也很少有新模型的性能能够全面超越它。但在过去的半年多中,ChatGPT活跃用户却一直在迅速流失。
再看间接网络效应。从理论上讲,这是存在的。因为AI企业通常会将用户和模型之间的交互数据用来进行模型的进一步训练。从这个意义上讲,模型用户的增长确实有助于模型性能的改善,并且让用户对模型的评价得到提升。不过,考虑到模型的训练需要的数据量是巨大的。从量的角度看,由此产生的网络效应可能是非常小的。
综上,既然AI模型的规模经济和网络效应都不足以成为天然的壁垒,那么依靠“烧钱”得到的市场份额就很难轻易守住。即使某个企业确实成功占据了市场,它也可能像当年的优步和滴滴那样,只是一个毫无市场力量的“垄断者”。
(2)模型难盈利,投资难回本
除了缺乏天然的壁垒之外,AI企业面临的更大问题其实是盈利模式的缺乏。从实践看,现有AI模型的常见盈利模式主要包括几类:一是直接向C端用户出售会员服务;二是向开发者销售API接口;三是将AI作为云服务向B端用户提供。不过正如我们指出的,在行业高度内卷的环境下,前两种服务的价格已经被压到很低。相比之下,第三种盈利模式是可以实现获得相对较高的利润的,但它需要企业同时有云服务项目作为支持。然而,在现实中,多数AI企业并不具有这样的业务。这就导致了目前市场上大批的AI企业都看似搞得红火,但却很难真正地赚到钱。无论是对于AI企业本身,还是整个AI赛道的发展来说,这种仅依靠外部资金输血的经营模式都是相当不利的。
如何走出内卷?
针对以上问题,AI企业在重新构建商业模式的时候,就需要将构建壁垒和寻找盈利模式作为最为重要的两个任务。
(1)壁垒的构建
早在20世纪30年代,以乔·贝恩(Joe Bain)为代表的经济学家们就对市场壁垒问题进行过深入的探讨。后来,包括贝恩的再传弟子迈克尔·波特(Micharl Porter)在内的一大批学者又进一步对这一问题进行了拓展。贝恩和波特的研究都强调了差异化是一类十分重要的市场壁垒。虽然这个观点看似很常识化,但在产品日益同质化的AI行业却非常有启发性。具体到操作层面,AI企业可以从两个维度来进行差异化:
一方面,它们可以选择一些独有的,且门槛较高的技术来开发相关的功能,以此确保自己至少可以在一段时期内领先市场上的对手。这样,即使相关的竞争对手也开发同样的功能,它们也可以保证自己有充足的时间来对功能进行升级,从而让自己相对于对手的优势可以被持续保持。在实践中,OpenAI的Sora其实就采用了这一策略。由于OpenAI在文生视频方面的优势十分明显,所以其他的竞争对手自然就知难而退,不敢轻易烧钱与之竞争。
另一方面,它们可以考虑针对某一个具体行业,开发为其专用的AI模型。专用模型市场要比通用模型市场更为易守难攻,需要积累大量的专用知识和投入额外资金,也很难被对手模仿和抢夺市场。虽然在理论上,专用模型市场潜力不如通用模型市场,但考虑到通用模型市场现在的内卷程度,它倒不失为AI企业的一个可行选择。
(2)盈利模式的选择
再看盈利模式的选择。在我看来,对于这个问题,有两条思路可以考虑。
一方面,如果AI企业决定采用差异化策略,选择某个利基市场作为突破点,那么它就可以选择非常直接的盈利模式,通过收取服务费用来获得收益。如前所述,在利基市场上,企业可以很容易建立自己的壁垒,从而获得较大的定价权。在这种情况下,即使这种简单的盈利模式也可以确保企业获得足够的收入。
另一方面,如果AI企业并未采用差异化策略,那么直接提供AI模型就很难获取收入。在此情况下,它需要考虑利用AI模型作为吸引用户的手段,然后从其他互补的渠道来获得收入。在操作层面,实现这一点的方法有很多。
比如,可以将AI模型与某个与其互补的产品进行捆绑或同时销售。比如,现在的AI工具虽然已经普及,但实际中人们关于如何使用这些工具的了解并不多。考虑到这一点,AI企业可以仿效IBM(International Business Machines Corporation,国际商业机器公司)等硬件企业所采用的销售产品捆绑服务的做法,在销售AI模型的同时捆绑教授用户如何使用模型的课程,以及其他的相关服务。
另外,构建平台也是一种思路。如前所述,现在的OpenAI正试图将GPTStore(基于OpenAI的GPT技术的在线市场平台)打造成一个新的平台。虽然从目前看,它没有取得预期效果,但总体思路上依然是正确的。可以设想,如果OpenAI有朝一日将这个平台理顺,那么它就可以像苹果收取“苹果税”一样,通过向发生在GPTStore上的交易收取佣金来获取稳定收入。
当然,除了打造应用商店平台之外,打造社交平台也是一个不错的主意。现在的AI模型大多只重视人和AI交互,而没有考虑使用AI工具的人与人之间的交互。但其实,这一点可以有很大的想象空间。AI企业完全可以搭建一个平台来让用户分享自己用AI生成的作品,并以此为切入点将其向社交网络的方向引导。一旦这个网络可以形成一定的规模,其盈利潜力也将可观。
总而言之,如果AI圈内的企业可以放弃对市场规模的执念,根据自身的特点有针对性地选择自己的利基市场,设计自己的盈利模式,那么走出疯狂的内卷或许也并不是那么难。