AI大模型的快速发展正对半导体产业链的多个维度引发旺盛需求,除了备受关注的GPU计算能力之外,与之相匹配的存力也在同步成长。
AI相关存储需求的提振,甚至已经在帮助存储头部厂商加速摆脱增长缓慢的难题。
调研机构Gartner就预计,2024年全球半导体行业收入将增长16.8%至6240亿美元,存储器市场将实现66.3%成长性是其中主要驱动,其中NAND闪存部分预计收入同比增长49.6%至530亿美元,DRAM运存部分预计增长88%至874亿美元。
当前阶段,更重要的是产业链之间积极协同,以助推算力产业链共同发展,进而驱动AI大模型真正落地。
近日,联想凌拓首席执行官陆大昕在接受采访时强调,现在谈AI的行业应用为时过早。“关于人工智能到底能发挥什么作用,行业场景很复杂、细分,更需要有行业沉淀来支撑模型,形成人工智能的逻辑,这需要有一个共识。”
因此他认为,现在可能还处在人工智能真正改进人类工作和生活的“前夜”。在这个阶段,更多是要做好基础设施,考虑怎样围绕细分行业打造一个完整的生态系统。
至于AI引发的驱动力将率先来自哪里,联想凌拓产品管理与营销高级总监林佑声对21世纪经济报道记者表示,公司也在观察探讨。“我们当然希望存储在AI风潮能有快速增长。但AI产业还在发展初期阶段,有一个演化过程。AI并不能迅速为人类带来很多改变,这其实是一点点由数据、模型、训练等积累完成,这些积累与存储的增长都有关系。”
AI大模型加速发展背后,迫切需要的是优质数据和计算能力支撑。
近日举行的联想凌拓2024技术大会上,联想凌拓首席执行官陆大昕在演讲中指出,作为算力价值发挥的基础,数据存储是提升数据质量和处理效率的利器。数据存储技术的不断演进,使得智能数据管理的性能及效率日益攀升。某种意义上,数据即为算法。
他进一步分析,根据相关机构测算,中国人工智能产业市场规模的年复合增长率已达25.6%,可以说充满生机和活力。中国政府从2017年开始,从国家政策层面先后推出了12项促进人工智能产业发展的重大举措,足见重视。
人工智能产业包括多种要素:数据、算力、框架、模型及应用,其中算力是推动人工智能发展的重要基础,涉及AI芯片、云计算和边缘计算等技术,为人工智能提供强大的计算能力和数据处理能力。
陆大昕表示,其中数据是人工智能时代的原动力,原因在于:其一,数据是一切智慧物体传递知识的媒介。当前人工智能系统大多是基于机器学习来构建,但是作为知识的载体,数据才是人工智能体系中最关键的要素。
其二,传统概念里,算法是由人类设计并构建,但在人工智能系统中其解决具体问题的算法,是由人工智能系统通过对数据不断训练、学习、推理而形成,也即由数据驱动,其性能高度依赖数据的质量。
其三,据分析,高质量数据可能在2026年前将被耗尽,因此高效地使用数据资源是当前人工智能所面临的重大挑战。
其四,数据的流动性决定了人工智能系统能够使用的资源范围,当前可供使用的资源种类包括边缘计算资源、数据中心资源及云资源。但如果数据流动性不足,则会严重束缚可使用的范围,限制人工智能技术的发展。
其五,数据的可获取性决定了人工智能的效率。如果在数据获取困难的环境中,无法期盼出现高效率、高质量的人工智能系统。
“综上,数据在人工智能时代是不可替代的核心要素,直接决定了人工智能系统的发展速度、效率。而数据的获取、存续、流动,以及高效使用都需要依赖优秀的数据存储及数据管理平台。”陆大昕总结道。
IDC数据研究表明,全球数据量正迅速增长,预计2026年将达221ZB。在企业数字化转型过程中,云计算、大数据及AI等技术的迅速发展,对数据管理的容量、性能和全生命周期管理等带来全新需求。
它也对存储行业提出了挑战。林佑声对21世纪经济报道记者分析,人工智能是一个技术创新总集,如果只看重算力、只强调高带宽,但是没有其他技术、数据种类进行匹配,其对大模型的能力支持也将有限。
“因此,要从底层的介质到应用的匹配,到带宽、算力,整体安全性配套、甚至节能都考虑在内,才能有一套可持续的产品体系。现在人工智能引发算力风潮,但后来会发现,当你要套用具体行业模型的时候,是不完整的,它需要有一套完整的体系支持。” 他指出。
谈及存储行业如何与AI发展需求的适配,林佑声受访时强调,在AI应用落地过程中,如果没有一系列配套,会发现训练将面临瓶颈。
“因为数据有不同格式,从不同维度得到的数据,必须做数据规整、清理、建模、训练等,这将由不同IT应用推进。算力也不是简单堆叠GPU就可以,如果没有充足、可自由流转的数据,没有数据管理、数据安全,AI也无法做成。同时相关产业链设备需要软件和硬件良好结合,进而达到节能、可持续发展的诉求。”他续称,综上,要考虑数据的萃取、流动、管理、安全、节能,这将需要一个生态,而不是单一技术可以解决问题。
对于产品构建思路,林佑声分析,AI应用对现代数据管理技术的诉求,主要有四方面:性能、简化管理、安全、节能。
具体来说,AI需要有海量数据、高速计算处理,那么性能如何适配;海量数据需要有数据的收集、准备,从训练到计算到应用部署提供相关服务,还涉及从边缘到云端的数据流动和管理,如何简化管理非常关键;同时面对海量数据计算,如果一味讲数据访问更快、数据容量更大,没法可持续发展,因此节能、绿色非常重要。
“另外,伴随容器技术的发展,存算一体,尤其是存算联动以释放资源流动性,成为数据驱动AI坚实的技术基础。人工智能的算力和技术其实是紧密结合体,基于容器技术可以实现存与算的资源整体调度,帮助人工智能应用更为灵活。所以存算联动将是人工智能应用部署非常重要的发展方向。”他进一步分析,海量的存储趋势下,分布式存储成为联想凌拓增长最快的存储细分领域。
据介绍,联想凌拓应用了如下一代SSD(固态硬盘),能够有更大容量、更高性能并且更加节能,甚至可以部分取代未来传统的机械式硬盘(HDD);NetApp AFF C系列和Lenovo ThinkSystem DG系列则具备大量数据快速处理能力;MagnaScale数据管理平台V4.0可以承载海量非结构化数据,通过冷热分层,提升数据管理功能。
“存储系列产品将更需要软硬结合、高度集成,不是简单的通用服务器、数据库,它是存储技术和介质,要求整个存储系统有非常强的底层适配能力。”陆大昕总结道。
来源:21世纪经济报道 作者:骆轶琪