中国AI大模型竞速：机遇当头与人潮汹涌

钱玉娟2023-04-15 08:58

经济观察报记者钱玉娟任晓宁实习记者陶思羽

“大模型最疯狂时的一张照片。”日前出门问问CEO李志飞从极客公园创始人兼总裁张鹏的朋友圈“盗图”，并写下如上配文。那是2月12日，张鹏在他组的一个饭局上拍的。

短短两个月时间过去，照片中的多位科技圈企业家，相继涌入通用人工智能（AGI）的浪潮中，张鹏不禁在图片配文中感慨，这是“最早一批AGI信徒的聚会”。

饭局时李志飞感慨自己“过度兴奋和严重缺少睡眠”，用他自己的话说，“那时的我想不顾一切地学OpenAI搞法，去做大模型。”

然而，两个月飞逝而过，李志飞想法变了，4月10日，他说，自己变成了“大模型劝退派”。回看让他“冷静”下来的大背景：首先是当天，大模型领域不只“添丁”王小川，还有商汤科技发布了大模型体系，昆仑万维提早宣布“天工”大模型也将启动邀请测试；其次是在那之前，百度文心一言发布、阿里通义千问启动测试，华为盘古大模型与京东“ChatJD”大模型也已经“犹抱琵琶半遮面”。4月14日，腾讯也加入竞赛，推出新一代算力集群，用来训练大模型。

在社交媒体上，不少人将大模型比拟为当前科技互联网产业，一个新的“造梦场”，不同于其它的是，这个领域中的逐梦人，需要的是协同大于竞争。

从新冠疫情黑天鹅突袭到经济趋向复苏，整整三年过去，没想到在ChatGPT之后，一股竞赛风乍起，将中国AI创业这一池春水吹皱，甚至涌起一波浪潮。

一批人，涌入浪潮

“这是一个确定性的机会，如果输了，五年最高亏一百亿美金，但要是成了，20年赚一万亿美金。要是你，怎么选？”某科技上市公司CTO告诉记者，一家公司即便数据不够多，但有一定的资本、算力技术等资源，“是我，我也会选择做大模型。”

4月13日，知乎创始人兼CEO周源走上“2023知乎发现大会”的舞台，对外发布了联合面壁智能开发的中文大模型“知海图AI”。

两天前，4月11日晚，李志飞在朋友圈发出一张对于“AGI本人”的邀请函，预告出门问问将在月底进行AIGC相关战略发布。

周源、李志飞都曾在两个月前参加了一个饭局。2月12日，张鹏在一家日料店组了个局，赴约者就有李志飞、周源、搜索引擎搜狗的创始人王小川以及松果出行创始人翟光龙。

彼时席间，张鹏拍照留念并预言，“这是个有历史意义的照片。”当他4月10日将合影发在朋友圈时，坐在正中央、笑得灿烂的王小川官宣入局大模型创业，产品命名为“百川智能”。

有意思的是，就在王小川现身的搜狐网络大厦内，还有另外一个投身大模型创业的人，美团联合创始人王慧文。

“新办公室第一天，切个蛋糕。”4月6日下午，王慧文一则朋友圈发出，蛋糕上写着他创立的公司名“光年之外”，而定位地址正是搜狐网络大厦。记者了解到，王慧文一经宣布闯入AI大模型领域创业，其项目就获得VC认购高达2.3亿美金，之后美团创始人王兴还参与了公司A轮投资，出任董事。

资本青睐之外，王慧文的AI团队还吸引了搜狗输入法之父马占凯加入，后者甚至表示要“与公司共赴AGI通用人工智能的伟大征程”。

在王慧文官宣要做中国版OpenAI的前一天，极客公园的创业者社区“前沿社”进行了一场关于通用大模型的线上交流会，张鹏抛出观点称，“OpenAI正在展现出一场革命的开篇，这将是互联网和移动互联网之后，同等量级的产业变革。”

在与会者中发起投票时，王小川是第一个投票认同的人，之后他在参加张鹏的组局小聚中，还表达了入局决心。

在参加那场“AGI信徒的聚会”时，李志飞已经投身大模型相关创新研发很长一段时间。

百度是国内大厂第一个吃螃蟹的角色。3月16日，李彦宏在百度大厦内发布了文心一言，他当时的表现被外界评价为“略显紧张”。他说这是百度必须要去做的事。

张勇担任阿里云智能CEO后的首度公开亮相，便是迎接这股AI浪潮，4月11日，他对外宣布阿里巴巴的所有产品，在未来都将接入“通义千问”大模型，进行全面改造，同时千行百业也将基于这一大模型，开发具备自己行业能力的“专属大模型”。

在百度、阿里之后，腾讯也有了大模型方面的动作。4月14日，腾讯发布面向大模型训练的新一代HCC（High-PerformanceComputingCluster）高性能计算集群。腾讯称，基于新一代集群，训练万亿参数的AI大模型，时间将缩短至4天。上一代训练时间为11天。

阿里在大模型方向上的动作，一度被称之为“CEO工程”。闻风而动的企业非常多，其中抓起这一“竞赛”项目的CEO中，软件工程专业出身的周源，让人多少有些意外。

在张鹏看来，“周源的思想很先进”，因为周源出现在那个“AGI信徒”的聚会中，外界对于知乎是否要闯入大模型领域倍加关注。周源的逻辑是，通过联合研发与战略投资的方式，与国内大模型团队面壁智能达成深度合作，4月13日也正式发布了两者合作推出的“知海图AI”中文大模型。

大模型，各有路径

并不是因为竞争危机，让李志飞发出“劝退”论，在他看来，“OpenAI那种不看ROI（投资回报率）而去探索AI天花板的做法，在中国没土壤，学不来。”甚至，他断言，在中国聚焦落地的大模型“将会有几十家而卷出天际，大概率跟上一代AI公司一样，商业化异常艰难。”

被李志飞一针见血指出的产业现实，确实“卷”得厉害。除了大厂，越来越多的中厂也在大模型的垂直应用领域“投石问路”。

4月9日，360集团创始人周鸿祎对外展示了360版的GPT大语言模型，公布了基于这一大模型开发的人工智能产品矩阵“360智脑”，落地搜索场景并面向企业用户开放内测。

周鸿祎称，未来，360智脑会与浏览器、数字助理、智能营销等场景应用结合。

4月10日，有赞推出了基于OpenAI的GPT-4大模型驱动开发的AI产品“加我智能”。

有赞创始人兼CEO白鸦透露，“加我智能”仅开发了一个月时间，目前只接入了一个厂商的大模型，未来会通过更多市场头部厂商的大模型合作，训练它的结果。

“不是所有企业都需要从头开始训练大模型。”阿里云智能CTO周靖人对记者表示，阿里云会为行业企业提供一个“一键生成”大模型的能力，在授权之下，去理解相关企业的各种模态数据。

周靖人告诉记者，阿里云希望进一步把技术门槛降低，能让更多的开发者参与进来。谈及技术路线，他观察“参赛者们”，“都在取长补短，大家在尝试不同的方向。”

创新奇智CTO张发恩最近就被多家制造工厂的负责人催促做研发，“他们对大模型技术跃跃欲试。”4月13日，创新奇智推出了工业大模型产品“奇智孔明”，并在两家制造业公司开启试验。

火热氛围下，伴随加入者增多，大模型产品也越来越多。趣丸网络副总裁庄明浩忍不住询问：有没有做国内大模型聚合站的？快记不过来了。随后有人给他发来了一个AI工具导航网址，里面聚集了上百个大模型平台和产品网址。

最近，李志飞总有一种“分裂”状态：既要思考大模型形而上学的“高贵”，又得接受其应用落地的“庸俗”。在他看来，一些大模型相关的学术问题至今没有被解决，不过是被大家从实用主义角度规避或近似解决了，“短期看，确实也没有更好的办法了。”

这番话说出第二天，李志飞作为大模型参赛选手之一，也敲定了其AIGC战略发布会的时间，4月20日，在这个被戏称为“大模型月”的阶段，他决定“让行业更卷”。

不过，李志飞希望劝退那些“因为FOMA而匆忙下场的创业者（包括大佬）。”记者询问获悉，“FOMA”即“FearofMissingOut（错过恐惧）”的缩写，特指一种营销策略，即通过制造“紧迫感”或“错过”的感觉，来促使人们参与某件事情。

代表着人类先进技术演进的AI行业不应如此，李志飞认为，大模型领域更需要有决心、热爱且擅长的人涌进来。

聚焦目前闯入的创业人，每个人都希望抓住机遇，成为其中的一个弄潮儿。

日前有入局者就国内大模型和OpenAI的差距发表言论而引发争议，一时间，入局者之间打起了口水战。

李志飞更希望未来同行，能够和睦共处，“找到自己的定位，为人类实现AGI以及AGI落地的事业，做出自己独特的贡献。”

道不同，亦可为谋

《ChatGPT：读懂人工智能新纪元》一书的作者、前沿科技领域作家陈根用非标准答案，测试了ChatGPT、文心一言和通义千问。在他看来，后两者相距前者，“还需要一段路要走，目前更不适合去谈对标。”

如果一定要打分，陈根觉得，国内两厂的大模型“在努力跨过及格线”，相较而言，国内已经发布的大模型都是在ChatGPT带来的压力下，快速推出的产品，“技术层面还不足以充分准备”，更大的差距是，ChatGPT已经公开销售，实现商业化，反观国内，陈根直言，“实验室产品，区别不言而喻”。

体验过多个国内产品后，互联网观察人士葛甲觉得，国内互联网公司并没有为此做好准备，都在匆匆上马。百度就是一个最明显的例子，文心一言上线已有月余，可产品依旧需要邀请码才能体验，未对公众开放。

4月中旬，国内上线的一系列大模型产品，同样都在内测，目前没有一款向公众开放。宣布接入大模型技术的国内大厂业务，同样没有对外开放。庄明浩认为，网信办发布《生成式人工智能服务管理办法（征求意见稿）》后，国内大模型产品的内测时间可能还会进一步延长。

庄明浩最近体验了国外大厂嵌入大模型技术的产品，比如微软的搜索引擎Bing，使用效果超出他的预期。除了传统搜索界面外，Bing界面右边有一个对话框，他打开一个英文报告，要求对话框总结报告要点。几秒钟后，一个详实简洁的中文总结完成了。

即便国内发展相对缓慢，大模型风潮并未受到影响，多位受访者透露，6月底之前，国内或将有50种类ChatGPT的产品问世，到年底，国内AIGC战局中的“参赛者”，甚至可能达到上百家。

一位AI上市公司技术负责人告诉记者，与2个月前相比，ChatGPT技术方面已经不是难题，当前包括GPT3.5在内的大模型技术都已经开源，这意味着创业公司不需从0起步，也能开发出自己的大模型。在这个赛道的技术层面，大厂和创业公司可以处在同一起跑线上。

“可能有的公司有一些技术储备，但绝大多数都是想搭上概念股东风，股价涨一涨，就完事了。”葛甲对此也表示理解，因为近期ChatGPT概念股的确表现很好，今年2月至今，昆仑万维公司涨了近2倍，360公司涨了1倍多，“资本市场上很久没找到强而有力的题材了，突然来了这么一个，一定要抓住机会。”

在资本逐利性的驱动下，产业内会萌生一种寻找下一个技术热点的冲动。陈根印象里，科技行业的大多数热点，往往是从华尔街或硅谷先引发，之后传导至全球资本市场。

而今的大模型热潮也不例外，硅谷的一只蝴蝶扇动了翅膀，ChatGPT一经发布，科技大佬、创业者争相拥趸。

“这就如同互联网技术的出现一样，不主动，就会面临被动淘汰的危机。”陈根表示，谁率先突围成功，谁就有机会提前建立技术与应用的护城河与生态圈，进而被市场较早认可。

正因如此，在新技术、资本及企业求生欲，这三方力量驱动下，各厂涌入大模型，引发竞赛潮。

量子位联合创始人李根在AI产业深入观察多年，他更认可创新工场董事长兼首席执行官李开复对大模型的定位。

3月中旬，李开复也宣布亲自筹办新公司，成为众多创业者之一，当时他将“大模型技术变革驱动的浪潮叫作AI2.0。”李根认为，这是准确且有逻辑的判断，“这波浪潮就是AlphaGo为代表的AI1.0的延续。”

李根认为，区别于元宇宙等概念，大模型浪潮背后，会有关键技术对原有业态的颠覆式变革与创新。

人工智能产业是一个长坡厚雪的赛道，其中形成的大模型相关技术，既不是ChatGPT诞生时“一蹴而就”，也不是ChatGPT火爆后“一时兴起”，李根告诉记者，在此之前，大模型早就已经有近10年左右的蓄力、研究，自2018年以来，业内包括商汤科技、阿里等有实力的玩家，都开始在这个方向上进行投入、研究。

“GhatGPT火爆后，就像是一把火炬点燃起来。”李根看到，伴随更多的资源、人、关注度被投注到大模型领域，此前幕后的工作也推向台前，各大厂也开始用最大的资源加速。

竞逐赛，风险防范

在大模型领域，机遇会属于谁？风险又该如何规避？“就像是一场千团大战。”上述AI上市公司技术负责人以当年O2O领域的格局演变为例，各厂集体参战，但最终留在市场上拼杀的只有两极：美团和饿了么，基于此，他预判一年半时间之后，国内或会跑出三五家通用大模型平台，其余大部分都将不复存在。

李彦宏说，现在国内大厂都看好AI大模型，创业公司的机会很少，没有必要再重新发明一遍轮子。这一言论遭到了王小川的反驳，后者官宣入局大模型竞赛后表示，“历史上每次发生大的变化，都有创业公司的机会，并且创业公司会比大公司跑得快。”

技术不是本质差异化问题，最终考验的还是商业化落地能力。庄明浩觉得，行业走到后期，会和云服务的市场越来越像。“不会一家独大，而是每家都有自己擅长的领地和机会。”

李根把大模型比作发电厂，未来重要的是提供电能、输出电能……对比各家，随着时间推移，能体现各家特色的能力，完全取决于服务提供者的基因或背景。

中国社会科学院科学技术和社会研究中心主任段伟文认为，没有一家企业愿意错过颠覆式的技术浪潮，尤其是对中国企业而言，“错过可能意味着落后、掉队。”

机遇当头背后，有一把风险的达摩克利斯之剑悬于头顶。

在国内AIGC领域一片火热时，海外对模型训练的担忧和反对声音日渐加剧。

3月29日，特斯拉以及推特的CEO马斯克，与1000多名人工智能专家及行业高管签署联名信，呼吁暂停训练比GPT-4更强大的人工智能系统至少六个月，理由是这种系统对社会和人类构成潜在风险。

“中国一定要迎头赶上。”在周鸿祎看来，马斯克等人的请愿并不影响中国发展自己的大语言模型，一个现实是，“目前中国相关技术水平距离GPT-4至少还有两年差距”，他认为，现在担心风险为时尚早。

在大模型影响下，国内一些变化已经发生。4月12日，蓝色光标发布邮件，决定无期限全面停止创意设计、方案撰写、文案撰写、短期雇员四类相关外包支出。此前，蓝色光标曾宣布将接入百度文心一言的能力。

更早之前，游戏行业也有人受到影响。3月2日，心动游戏CEO黄一孟发文说，和两个游戏团队聊天，团队一把原画外包团队给砍了，团队二把翻译外包公司给砍了，AI已经开始实际影响很多人的工作岗位了。

上述AI上市公司技术负责人表示，未来会有更多行业受到影响。ChatGPT面向两类人，一类是学会使用它的，一类是被它替代的。伴随ChatGPT的潘多拉魔盒开启，AI大模型这条路已经不可逆转。

段伟文认为，从技术上讲，安全治理不必采取特别措施，但在技术发展、探索的过程中，行业正陷入一个治理的悖论中，尤其涉及内容安全，一旦追求“绝对性”，大模型领域的创新便有了监管风险。

作为一种内容生成技术，“不能没有数据作为原料。”段伟文认为，AIGC是一种全新的内容生成方式，目前法律上对内容的侵权界定，早于这种使用形式之前提出，在他看来，国内要大力发展AIGC，或需重新界定内容使用的边界。

李根感慨，现在的信息技术文明，虽是人工智能浪潮里的一个小浪花，激起的却是千行百业甚至普罗大众对AI的新一轮认知。

钱玉娟经济观察报记者

TMT新闻部记者
长期关注并报道TMT领域的重大事件，时刻保持新闻敏感，发现前沿趋势。擅长企业模式、人物专访及行业深度报道。
重要新闻线索可联系qianyujuan@eeo.com.cn
微信号：EstherQ138279

新浪微博腾讯微博微信朋友网人人网

热新闻

视频推荐

总编对话｜从中国走向世界——对话松下电器中国东北亚公司总裁CEO木下步

聚焦主业提升品牌：恒安集团接班人的长期主义理想

希捷科技全球执行副总裁暨首席商务官郑万成：未来五年，中国将成为全球生成数据最多的市场

电子刊物

点击进入

用户名登录/手机号登录 还没有账号？免费注册

中国AI大模型竞速：机遇当头与人潮汹涌

热新闻

视频推荐

电子刊物

用户名登录/手机号登录

还没有账号？免费注册