近日,AI初创公司出门问问(Mobvoi)近日通过港交所聆讯,并于4月2日披露通过聆讯后的资料集,拟主板挂牌上市。
作为诸多媒体笔下的港股“AIGC第一股”,从其聆讯后资料集披露的2023营收来源来看,公司44.5%的收入来自“AI企业解决方案”,其次是占比32.31%的“智能设备及其他配件”,第三才是营收1.18亿元的“AIGC解决方案”,占比23.19%。但往前回溯,2021年该项业务营收仅为682.20万元,年复合增长率超300%。
值得注意的是,相较于此前已通过IPO的其他AI企业,起家于语音交互技术的发展背景,以及高速增长的AIGC业务也为出门问问带来了大量的C端用户。在大模型相关的个人信息与数据安全合规问题愈加受到社会关注的当下,出门问问的IPO是当前业内不多见的实践案例,其相关信息披露内容与形式或将成为其他志在上市的大模型企业重要参考。
从营收数据来看,出门问问的财务情况近年来呈不断改善的趋势,但如同尚处于发展期的大模型产业本身,其业务构成与盈利能力仍在不断变化中,面临相当的不确定性。
已披露的数据显示,2021年、2022年、2023年财年,出⻔问问营收分别为人民币3.979亿元、5.002亿元、5.071亿元,归属于本公司权益股东的年内全面亏损总额分别为2.051亿元、9.856亿元、8.674亿元,三年亏损总额超过20亿元。
不过在去除受可赎回优先股及普通股的账面值变化等因素后,出门问问2022年与2023年调整后盈利分别为1.09亿元与1753.5万元。
在出门问问自身看来,投资与研发的高昂支出,是短期内影响盈利能力和经营现金流量的主要因素之一。其在聆讯后资料集“风险因素”一章中提到,由于所处的AI行业技术不断进步,公司需要投入大量资源,包括财务及人力资源,以紧跟AI行业的最新发展,从而扩大供应范围,并增强其解决方案在市场上的竞争力。因此,出门问问预计将继续在研发方面进行大量投资。
但从当前人工智能产业的商业实践来看,缺乏有效变现模式、商业化推进困难依然是绝大多数企业面临的现实问题,也是出门问问在盈利预期中考虑的关键因素。
2021财年中,出门问问一度占比80%以上的最大的营收来源“AIoT解决方案”收入3.38亿元,此后该部分业务规模快速下滑——2022年营收1.97亿元同比降低41.69%,2023年“智能设备及其他配件”营收1.64亿元,在其他两大业务种类不变的前提下,如将其与“AIoT解决方案”等同,则进一步下滑16.98%。
对此,出门问问方面的解释为受疫情影响导致新旗舰产品推迟推出影响。记者梳理发现,2023年5月其曾在海外发布了旗下主打穿戴设备TicWatch系列新品TicWatch Pro 5,但该产品至今未开启在国内市场的官方销售渠道。
与之对应的是,随着2022年大模型热潮的兴起,AIGC收入在出门问问的营收占比快速上升。2021年该项业务营收仅为682.20万元占比1.71%,2023年“AIGC解决方案”营收1.18亿元占比23.19%,年复合增长率超300%,相关业务一定程度上冲抵了AIoT业务收入下降的影响,成为出门问问最重要的增长极。
从市场发展趋势来看,根据灼识咨询报告,以收入计,中国AIGC市场的市场规模已由2020年的人民币1亿元增至2022年的人民币4亿元,2020年至2022年的复合年增长率为100.8%,预计市场规模于2027年达到人民币326亿元。
此前,出门问问已多次高调宣布加码布局AIGC,并推出大模型“序列猴子”;2023年初公司CEO李志飞公开喊话称要在大模型领域创业,做中国的OpenAI。
具体到产品,在AIGC板块公司旗下拥有AI配音工具“魔音工坊”、数字人制作平台“奇妙元”、企业数字员工“奇妙问”三款主打产品,合作品牌客户包括抖音、快手、中国移动、中国电信等。据出门问问在聆讯后资料集中的说法,其2022年相关领域570万美元(约合4123万人民币)的收入占全球AIGC市场份额约0.9%。
除出门问问外,在大模型发展浪潮带动下,2023年包括第四范式、云知声、声通科技在内的多家AI企业密集开启IPO冲刺。
在上述企业中,第四范式已于去年9月于港股上市,但其主营业务为面向企业的决策类人工智能应用,而非生成式人工智能。其他与AIGC相关的上市公司中,阿里、百度等传统互联网巨头的生成式大模型只是其诸多业务的一部分,商汤、云从科技等主营AI的企业虽然近年来也在大力发展生成式AI,其在上市时也主要是以面向B端的智能服务为主。
因此,虽然出门问问港股“AIGC第一股”的名头受到质疑,但作为在IPO阶段AIGC业务占比就已超过20%的企业,其上市案例也具备一定的稀缺性和参考价值。
在合规方面,聆讯后资料集中重点提到了《数据安全法》《个人信息保护法》,及去年发布的《生成式人工智能服务管理暂行办法》。其在“风险因素”中表示,倘未能遵守有关AIGC服务、数据安全、隐私及个人信息保护的不断变化的中国法律法规,可能使其面临法律或行政诉讼,这可能会对声誉及业务运营产生重大不利影响。
而对于大模型产业发展至关重要的数据方面,出门问问表示其数据主要来自两个方面:一是获得直接授权的数据来源(包括解决方案的内容创作者、企业、雇员、消费者以及用户),二是从第三方供应商购买的与提供AIGC解决方案有关的少量语音数据。
值得注意的是,在聆讯后资料中,出门问问还在多处重点提及了大模型训练数据与用户个人信息数据间的关系及其合规性。
在“风险因素”部分,其表示会通过自互联网寻找全面且具有代表性的数据集来训练数据……“集团努力并将继续采取措施确保从训练数据提供商、互联网及其用户处取得的数据有适当授权、合法性及准确性”。
此外,在“行业概览”部分,其表示自垂直领域市场和付费用户获得的丰富高质量数据有助于提高训练算法的效率,并显著优化模型;在“监管概览”部分,其表示公司于网站上披露算法的主要运行机制,并与训练数据提供方签订协议,以直接或间接的形式获取个人信息主体的同意,确保数据来源的合法性。
但梳理出门问问及其主打AIGC产品魔音工坊的用户协议和隐私政策,其中并未直接提及有关大模型训练及相关用户授权的内容,仅表示:“如阁下选择接受收集诊断性和使用数据,即表示阁下同意出门问问及其子公司和代理可以收集、维护、处理和使用诊断性、技术性、使用及相关信息……以便提供和改善出门问问的产品和服务……”
“该情况一定程度上是因为出门问问的产品并非直接提供大模型服务。”清律律师事务所首席合伙人熊定中表示,不同于当前市面上常见的对话类产品,出门问问主要提供的是语音处理等大模型应用服务,而前者如果要使用用户数据进行大模型训练,通常是需要在隐私协议等文件中写明的。
对于出门问问此类情况是否需要告知用户,目前在行业中则存在一定争议。
熊定中表示,根据《生成式人工智能服务管理暂行办法》的规定,严格来说使用用户数据进行训练都需要取得个人同意,但并未说明该规定需要以单独同意还是一揽子同意的方式取得。
而根据《个人信息保护法》,需要取得单独同意的情况要看使用个人信息训练大模型的行为是否构成法律意义上的个人信息处理行为。如果不构成,以一揽子的方式包含在“改善产品及服务”的条目下获得用户授权一定程度上不违反现有合规要求。
“但大模型训练通常并不直接和服务体验相关,个人建议企业如需使用用户数据进行训练,还是应尽量在相关协议中写明。”熊定中表示。
来源:21世纪经济报道 作者:吴立洋