阿里云加入大模型价格战主力模型Qwen-Long降价97%

陈奇杰2024-05-21 14:19

记者陈奇杰 继字节跳动、腾讯云等大模型厂商之后，5月21日，阿里云也加入大模型价格战，宣布通义千问9款商业化和开源模型降价。

整理发现，这9款大模型整体推理输入价格降幅为67%—97%，有2款开源模型提供七天免费优惠。其中，通义千问GPT-4（美国人工智能公司OpenAI的大语言模型）级主力模型Qwen-Long的API（应用程序编程接口）输入价格，从0.02元每千tokens（大模型文本中的最小单位）降至0.0005元每千tokens，降幅为97%。

阿里云介绍，Qwen-Long是通义千问的长文本增强版模型，最高支持1千万tokens长文本输入，降价后价格约为GPT-4的1/400。对比来看，GPT-4、Gemini 1.5 Pro（谷歌公司旗下大模型）、Claude 3 Sonnet（人工智能初创公司Anthropic旗下大模型）和Ernie-4.0（文心一言4.0）每千tokens输入价格分别为0.22元、0.025元、0.022元和0.12元，均远高于Qwen-long。

降价当日，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在阿里云AI智领者峰会上称，阿里云这次大幅降低大模型推理价格，目的就是希望加速AI应用的爆发。阿里云预计未来大模型API的调用量会有成千上万倍的增长。他还认为，不管是开源模型还是商业化模型，公共云+API将成为企业使用大模型的主流方式。

2024年被认为是AI应用元年。但在业界看来，推理成本过高依然制约着大模型规模化应用。降价有助于吸引更多的产品使用者，除了阿里云，近期国内外已有多家大模型厂商下调了旗下大模型产品的价格。

5月11日，智谱AI宣布，为了让更多人都能使用该公司的入门级模型产品，GLM-3 Turbo 模型的调用价格由5元每百万tokens调整为1元每百万tokens；5月13日，OpenAI发布性能更强大的GPT-4o模型，API调用价格降低了50%；5月15日，字节跳动首次对外公布大模型产品动态，并把旗下豆包大模型的计价单位从分降到了厘；日前，腾讯云也在官网下调了混元大模型的推理输入价格。