记者 陈奇杰 继字节跳动、腾讯云等大模型厂商之后,5月21日,阿里云也加入大模型价格战,宣布通义千问9款商业化和开源模型降价。
整理发现,这9款大模型整体推理输入价格降幅为67%—97%,有2款开源模型提供七天免费优惠。其中,通义千问GPT-4(美国人工智能公司OpenAI的大语言模型)级主力模型Qwen-Long的API(应用程序编程接口)输入价格,从0.02元每千tokens(大模型文本中的最小单位)降至0.0005元每千tokens,降幅为97%。
阿里云介绍,Qwen-Long是通义千问的长文本增强版模型,最高支持1千万tokens长文本输入,降价后价格约为GPT-4的1/400。对比来看,GPT-4、Gemini 1.5 Pro(谷歌公司旗下大模型)、Claude 3 Sonnet(人工智能初创公司Anthropic旗下大模型)和Ernie-4.0(文心一言4.0)每千tokens输入价格分别为0.22元、0.025元、0.022元和0.12元,均远高于Qwen-long。
降价当日,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在阿里云AI智领者峰会上称,阿里云这次大幅降低大模型推理价格,目的就是希望加速AI应用的爆发。阿里云预计未来大模型API的调用量会有成千上万倍的增长。他还认为,不管是开源模型还是商业化模型,公共云+API将成为企业使用大模型的主流方式。
2024年被认为是AI应用元年。但在业界看来,推理成本过高依然制约着大模型规模化应用。降价有助于吸引更多的产品使用者,除了阿里云,近期国内外已有多家大模型厂商下调了旗下大模型产品的价格。
5月11日,智谱AI宣布,为了让更多人都能使用该公司的入门级模型产品,GLM-3 Turbo 模型的调用价格由5元每百万tokens调整为1元每百万tokens;5月13日,OpenAI发布性能更强大的GPT-4o模型,API调用价格降低了50%;5月15日,字节跳动首次对外公布大模型产品动态,并把旗下豆包大模型的计价单位从分降到了厘;日前,腾讯云也在官网下调了混元大模型的推理输入价格。