21世纪经济报道记者雷晨 北京报道
2024年,生成式人工智能仍然是最引人注目的“科技焦点”。随着国内人工智能大模型的持续优化和升级,自然语言交互和多场景内容生成的能力不断提升。
科大讯飞(002230.SZ)去年在人工智能通用大模型及行业大模型方面坚定投入并取得进展。其业绩预告显示,公司2023年预计实现营业收入超过200亿元,较上年增长约7%;预计实现归母净利润6.45亿元至7.3亿元,较上年增长15%至30%。
1月30日,科大讯飞发布讯飞星火认知大模型V3.5。科大讯飞相关负责人对21世纪经济报道记者表示,星火V3.5是首个基于全国产化算力平台“飞星一号”训练的全民开放大模型,在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等核心能力均较讯飞星火V3.0显著提升。
中航证券研报指出,不断创新的生成算法、预训练模型、多模态等技术融合带来了AIGC技术变革,拥有通用性、基础性多模态、参数多、训练数据量大、生成内容高质稳定等特征的AI大模型成为了自动化内容生产的“工厂”和“流水线”。
公开信息显示,目前涉及AIGC的产业可大体分为以下三大方面。
一是算力和数据存储。高算力、海量数据训练是打造领先人工智能模型的基础。其中,云计算可以提供超大算力计算平台和海量数据存储平台,海量数据汇集为AI模型提供强大的数据支撑。
另外,AI处理器等高端芯片的研发可以为AIGC提供算力支撑,算力作为数据加速处理的动力源泉,其重要性不言而喻。AI处理器芯片可以支持深度神经网络的学习和加速计算,相比于GPU和CPU拥有成倍的性能提升和极低的耗电水平。
二是AI算法。ChatGPT所基于的NLP(自然语言处理)是人工智能发展的核心课题之一。对话交互类AI算法龙头厂商在自然语言处理(NLP)、数据标注方面都具有先发优势。算法上,数据标注属于AIGC算法的生成关键步骤,而在自然语言处理,AIGC已经对此方向应用产生深远影响,例如已经实现的虚拟人与自然人的对话、AI作图、AI底层建模。
三是具体应用。由于具备海量文本创作、图片生成、视频生成等需求,娱乐、传媒、新闻、游戏、搜索引擎等行业都是AIGC技术的潜在应用厂商,可应用场景相当广泛。
例如,A股上市公司中文在线(300364.SZ)上线了AI辅助写作功能,可以通过针对不同的描写场景生成对应关键词和辅助词语,大幅提升写作效率和内容可读性。而随着AIGC的逐渐成熟,相关产品商业化的发展有望得到极大的推动。
经查询公司公告、互动易或媒体信息,截至目前,A股AIGC概念公司共有46家,其中深市主板10家,创业板21家,沪市主板9家,科创板6家。
从公司布局情况来看,A股AIGC概念公司以布局AI算法、AIGC具体应用为主。
譬如,寒武纪(688256.SH)、海光信息(688041.SH)等公司,通过布局高端处理器、加速器等芯片产品和系统的研究、开发,重点聚焦算力与存储领域;科大讯飞、汉王科技(002362.SZ)、拓尔思(300229.SZ)等通过布局人脸识别、大数据、智能交互技术等技术,在AI算法领域具有较大优势;中文在线、果麦文化(301052.SZ)等公司由于具有较多版权内容资源以及文本数据库,在AIGC具体应用具有先发优势。
从行业及公司经营来看,A股AIGC概念公司行业较为集中。
据统计,46家公司主要集中于信息技术和互联网行业。其中信息技术行业16家,互联网行业12家,其余公司分散在电子制造业、新闻出版业、商务服务业等行业。此外,有19家公司属于战略性新兴产业,主要集中于新一代信息技术以及数字创意产业。
随着国内人工智能技术的不断进步,大模型的优化和升级持续推动自然语言交互和多场景内容生成能力的提升。
“公司已在2023年启动了更大参数的大模型训练,以全力对标GPT-4,讯飞将在2024年上半年全力实现这一目标。”科大讯飞相关负责人对记者表示。
1月30日,科大讯飞发布讯飞星火认知大模型V3.5是首个基于全国产化算力平台“飞星一号”训练的全民开放大模型,进一步对标国际最先进水平,在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等核心能力均显著提升,将助力科研、工业等领域刚需应用提质增效。
据悉,音频创作、视觉创作和文本创作是科大讯飞AIGC的三大模块。在音频创作方面,科大讯飞在2022年发布了全新的语音合成系统,即多情感多风格SMART-TTS系统。“这是一个端到端的方案,输入文本直接得到语音输出,SMART-TTS提供11种情感,每个情感有20档调节能力,停顿、重音、语速等关键属性也可以进行调节。”科大讯飞方面表示。
在虚拟人多模态合成方面,科大讯飞从2018年首发多语种虚拟人口唇驱动,2021年发布了2D真人捏脸系统。目前已经形成了3D虚拟口唇表情和动作的AI驱动到AI贯穿3D形象构建的全流程。
此外,科大讯飞在AIGC方面产品创新也有一些探索,讯飞推出了讯飞智作APP,可结合音频、视频、文本等AIGC能力,打造一个音视频内容的AI创作基地。在讯飞音乐的词曲家平台,通过AI辅助作词作曲,可以帮助创作者提高生产力。通过歌曲试音及质量分析,能够使采买人和音乐人之间的沟通变得更加顺畅。
去年年底,利亚德(300296.SZ)发布了LYDIA动作大模型。这得益于利亚德·虚拟动点多年来在空间计算和动作捕捉领域积累了大量的动作数据。
“利亚德现有业务OptiTrack光学动捕擅长对精度需求更为看重的行业场景,而LYDIA大模型聚焦于解决对于动作数据获取效率更为看重的行业场景。简言之,LYDIA注重效率,OptiTrack注重精度,两者相互配合,高效运作,为不同需求客户创造价值。”利亚德集团副总裁、虚拟动点CEO刘耀东在接受21世纪经济报道记者采访时指出。
其表示,在AI方面,利亚德围绕以空间计算为核心的光学计算、惯性计算、光惯融合计算、无标记点识别计算法和AI大模型进行布局,并持续加大投入,不断提升空间计算算法技术,持续迭代动作大模型。
生成式人工智能技术的快速发展和应用,有望为传统产业的转型升级和创新发展注入强大动力,推动经济社会持续向前发展。
根据Gartner的估算,2025年AIGC产生的数据将占所有数据的10%。根据量子位智库的估算,预计到2030年,AIGC市场规模将超过1万亿人民币规模。
从商业模式来看,面向B/G端客户,讯飞星火大模型落地方式主要分为三种:其一,讯飞助力政府、高校等打造公共算力及大模型能力平台,提供星火大模型、算力底座、资源调度等端到端解决方案。例如近期科大讯飞中标的湖北利川项目是政府通过专项债部署公共算力底座助力当地数字经济建设。其二,基于客户自有硬件,讯飞提供星火智算平台以及私有化部署和训练的“软件+服务”私有化解决方案。其三,通过星火一体机满足行业大模型训练完成后应用快速发展阶段的边缘计算和推理需求。
B/G端项目落地的整体流程主要包括:技术调研、产品选型、项目立项、可行性研究、挂网、投标、项目建设及验收等环节,客户从技术调研到招投标一般至少需要6个月,私有化部署需要经历方案对接、效果验证和测试阶段。科大讯飞将与客户共同开发相关产品服务,助力客户提升业务效率和产品竞争力,参与分享共创价值。
在C端方面,2023年科大讯飞办公产品家族率先将星火认知大模型应用于实体产品中,具备了文稿提炼、文稿生成等核心能力,带来产品性能和智能的飞跃。
星火大模型对AI智能硬件销售的增长产生了显著推动作用。去年“双11”期间,讯飞学习机、智能办公本、翻译机、录音笔、智能助听器等产品继续保持高质增长,并获得2023“双11”京东&天猫7个品类销售冠军;讯飞AI硬件在全周期销售额同比增长126%。
“LYDIA动作大模型是利亚德自主研发的专业能力大模型,具备对空间动作数据的‘认知、感知、预测、生成’等核心能力,在全球范围的空间计算、动作生成领域率先探索了AIGC的新模式。”刘耀东表示。
提及未来应用层面的拓展,刘耀东告诉记者,LYDIA是目前全球范围为数不多真正实现动作生成的大模型,就是希望可以解决部分应用场景。
值得一提的是,LYDIA还支持与其他软件平台打通和调用,使其生成的动作文件可以被生态伙伴用于商业化,这也为其应用场景的开拓提供了有效支持。
刘耀东认为,在撬动数字资产方面,AIGC与大模型可以沉淀更多动作数据,让空间计算快速赋能千行百业。通过对动作资产的生成、应用创造更多场景,构建数据资产平台。