Sora爆了,SRAM要火?

上海证券报2024-02-21 09:21

Sora火爆出圈,让更多的新技术、新概念被市场所追捧。2月20日,北京君正尾盘突然直线拉升,实现20CM涨停。记者发现,公司股价涨停背后是SRAM(静态随机存取存储器)概念在驱动。

SRAM究竟是什么?为何能够迅速引来资金的追捧?

事情的起因是,AI芯片公司Groq2月19日宣布,其大模型Groq每秒输出近500个token,成为全球最快大模型。这个速度可以秒杀ChatGPT-3.5。后者每秒生成速度仅为40个token。

Groq如此之快,背后全靠其自研的LPU芯片(语言处理单元)。LPU,是Groq专为图形渲染而设计、包含数百个核心的并行处理器,能够为AI计算提供稳定的性能。

资料显示,Groq是由谷歌TPU第一代设计者乔纳森·罗斯(Jonathan Ross)于2016年所创立。不同于传统的CPU和GPU架构,Groq从头设计了一个张量流处理器(TSP架构,以加速人工智能、机器学习和高性能计算中的复杂工作负载,并将其定义为“语言处理单元”,即LPU。

值得关注的是,与GPU使用高带宽存储器(HBM)不同,LPU使用的是静态随机存储器(SRAM)。

而北京君正不仅专注于存储芯片,其主营产品正是嵌入式存储和静态随机存储器(SRAM)。由此,公司也迅速被敏锐的资金追捧,股价20日尾盘被直线拉至涨停。

SRAM能否对行业带来改变甚至颠覆呢?

据Groq披露,一张LPU配备一块SRAM,内存是230MB。支持运行一个AI模型,要配置约256张LPU,这需要4个满载的服务器机架。一张LPU卡销售超过2万美元。

可是,同样的AI模型采用GPU运行,只需要1个H200,相当于1/4个服务器机架密度。

简单计算,256*2万美元=512万美元。H200还没有公价,英伟达官网显示,一张H100价格不超过4万美元。即便是按照H200价格翻倍计算,那显而易见,采用SRAM可比采用GPU贵多了,增加几十倍以上成本。

对此,有存储界人士表示,为了提升10倍的速度,增加大几十倍成本,该路径短期内不具备大规模使用的可能性,也就不可能颠覆GPU了。

责编:展   雪   校对:冯雯君   图编:赵雁旎

Baidu
map