2024年首批大模型备案名单公开。近日,据媒体报道,一批包括小米、BOSS直聘、智联招聘、脉脉在内的大模型服务宣布完成大模型备案并公开提供服务。
自2023年8月《生成式人工智能服务管理暂行办法》(以下简称“《办法》”)生效至今,已经有四批、超过40家企业宣布完成大模型备案。其中既有字节、百度、阿里等互联网大厂,也不乏百川智能、智谱AI等初创企业,应用场景包括教育、电商等。
大模型市场正从“百模大战”跨入“千模大战”。在竞争逐渐升级的当下,这数十位“先行者”探索之路走得怎么样?从它们的实践中,能窥见怎样的未来趋势?
大模型备案是企业相关服务和产品走向市场要迈过的第一道门槛。
2023年8月15日正式施行的《办法》规定,如果企业提供的相关服务具有舆论属性或者社会动员能力,应依照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。
“评估与备案工作完成,意味着企业具备了完善的算法安全管理机制以及风险控制、应急响应的能力。”观韬中茂(上海)律师事务所合伙人吴丹君告诉21记者,大模型产品、服务通过完成这些工作证明其安全性,才能进一步向市场,公开提供服务。
吴丹君告诉21记者,以算法备案为例,大模型企业应当在需要通过互联网信息服务算法备案系统进行填报和备案手续,所需信息包括服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等。
“备案中准备难度较高的两份文件包括主体信息中的《落实算法安全主体责任基本情况》以及算法信息中的《算法安全自评估报告》,在这些文件中,企业需要提供算法安全机构设置和算法安全管理制度和风险应对措施等实质内容。”她指出。
而大模型算法的复杂性和大规模可能会增加备案的难度,尤其是在填报《算法安全自评估报告》时,企业需要对技术和数据进行充分说明。此外,算法数据的质量和完整性对备案申请也非常重要,企业需要详细说明算法使用的数据,如果数据存在缺陷或缺失,可能会影响模型的准确性,从而增加备案的难度。
在四批国产大模型通过备案的过程中,大模型监管已经形成了比较稳定的节奏,逐渐走向常态化。“这意味着更多的企业可以合规地开展大模型服务,AI应用的落地有了更加稳定可靠的环境,这些大模型能够赋能更多的产品,提高自己的竞争力。”吴丹君指出。
完成备案后,先行者将真正走向市场,接受考验。
在技术和商业的多重竞争中,大模型厂商时刻需要做出选择。其中最核心的两个选择依然是:做通用大模型,还是垂直大模型?应用针对B端,还是C端?
业界普遍将去年8月31日,视为国内大模型市场进入全新阶段的标志。在8月31日获得第一批备案的大模型方向很一致,那就是做通用大模型。这些起跑早的厂商有智谱AI、MiniMax、百川智能、百度、阿里、华为等12家企业和研究机构。
时间来到2024年,越来越多大模型面向垂直领域。在最新公开的第四批备案名单中,14个备案大模型里只有李开复的零一万物,做的是通用大模型。
其余13个大模型,要么属于特定类型、特定行业,比如新壹视频大模型针对视频生产,魔方大模型背后的创思远达是物联网上市企业,主要面向智能汽车和物联网;要么作为生产力工具,帮助改进原生产品。Boss直聘、智联招聘、脉脉、小米、什么值得买的大模型便采用这种思路。
就像业界常说的那样,通用大模型是讲究时机的资本游戏。从备案的时间来看,厮杀通用大模型的头部初创、大公司已经早早入局,“赶晚集”的公司需要想办法找到细分领域。
但名单中也有例外,上文提到的零一万物就在去年11月才发布Yi系列大模型。在斯坦福大学研发的评测榜单中,Yi的性能超越Meta的Llama 2,被视作开源大模型的尖子生。之所以能成为后起之秀,也是因为Yi在多个全球排行榜上都位列前茅,有硬实力的保障和开源的卖点。
对于选择To B还是To C,战略不像选择通用或垂直大模型那样清晰。在去年第二批大模型备案名单公开时,华安证券报告曾指出,首批通过备案的大模型聚焦C端应用,第二批则集中于B端产业化, ToB、ToC 齐头并进的现象显现。
随后的两批备案名单也验证了这一预测。第四批获得备案的14个大模型,一半选择To B,一半选择To C。
不过从资源投入的角度来看,大公司和初创企业的步伐有着明显不同:梳理数据发现,大公司手握流量入口,约74%的备案大模型面向C端市场。而B端的商业确定性更强,超过50%的初创公司大模型针对B端客户。
经过了一年的沉淀,结合具体应用无疑是一个大趋势。至于是开发一个能定制的超级大模型,还是多个垂直小模型,目前还是由自身的资本“血条”做决定。
不管对于哪种大模型,寻找下游的使用场景都是关键。获得第四批备案的大模型,基本都提出了明确的使用场景。
不过数据显示,近一半的应用落地在原有产品的场景中。其中,问答社区与大模型使用体验最为接近,比如脉脉和知乎都将AI功能内嵌在社区中,辅助搜索或创作。
以知乎为例,去年4月知乎用知海图AI开发了“热榜摘要”功能,即用AI抓取优质问答,帮用户概括要点,但并没有掀起水花。AI摘要容易覆盖创作者的答案,与主打差异性、多样化的社区也不够匹配,似乎已经被战略性放弃。知乎最新上线的功能是AI“智能标题”,重点转向内容源头的创作者。
在原生业务之外,新场景的探索更加谨慎。只有教育、消费、数字人三个领域的备案大模型在两个以上。
教育领域的备案大模型有网易的子曰大模型、面壁智能的Luca。前者提供虚拟人口语教练、语法精讲、AI 写作指导等服务,应用于网易有道APP、有道学习机。后者由知乎领投天使轮,主要服务知乎系产品。今年1月,面壁智能CEO表示将与知乎知学堂合作,尝试在职业教育的教学环节应用AI。
数字人与大模型结合的典型应用,是第三批备案的小冰大模型。该开发团队的前身为微软(亚洲)互联网工程院人工智能小冰团队,今年1月与钉钉官宣了最新合作,计划为钉钉提供AI数字员工——上传个人视频和音频数据,就可以复制自己的虚拟人物分身。不过尚不清楚的是,数字人作为“助理”能具体分担哪些工作。
目前的AI数字人,主要还是与消费、电商场景绑定。第四批备案的摹小仙大模型提供了AI模特定制功能,主要用来生成商品营销图。新壹视频大模型将数字人应用到内容播报、电商直播,部分还面向影视娱乐产业。
事实上,数字人在生成式AI爆发前就有了一定市场。小冰CEO在采访中提到,有大模型语言能力、多模态能力的加持,数字人能“更像人”。但大模型的交互速度不够快,数字人场景还有很诸多技术限制。艾媒咨询数据显示,2022年中国虚拟人核心市场规模约120亿元,同比增长94.2%,预计2025年将达480亿元。
以上获得备案的公司,几乎都宣称已接入多家企业客户,不过大部分公司没有单独披露大模型带来的收入。尽管一些领域的应用前景逐渐清晰,但到目前为止,市场并未看到明显的营收增长,最直接的商业回报仍然是一个未知数。
以商业化为行业主题的2024年,竞争只会更加残酷。大模型的推理成本远比训练成本高,进入市场应用阶段,消耗钱的速度会更快。自身“造血能力”不够强的大模型公司,可能会过得更加艰难。
来源:21世纪经济报道 作者:肖潇,冯恋阁