通义千问宣布开源

钱玉娟2023-08-05 00:25

记者钱玉娟

继海外开源大模型体系推出并实现商用化后，8月3日，阿里云宣布其自研的大模型通义千问正式开源，成为首个宣布大模型开源的大型中国互联网科技公司。具体来看，通义千问70亿参数的通用模型Qwen-7B和对话模型Qwen-7B-Chat，均上架在AI模型社区魔搭ModelScope，开源、免费、可商用。

据了解，魔搭社区是阿里云在2022年牵头发起的一个AI模型社区，借此服务AI开发者。官方数据显示，目前魔搭社区聚集了超20家顶尖人工智能机构贡献的1000多款开源模型，是中国大模型开源的第一门户。

不过，在此之前的6月，由王小川创立的人工智能创新科技公司百川智能，先后推出了70亿规模参数的Baichuan-7B开源模型，以及号称拥有130亿的参数规模的Baichuan-13B模型，率先成为国内推行完全开源、免费可商用的大模型创业公司。

在加入魔搭社区的开发者飞鲸看来，尽管通义千问开源的模型参数只有70亿，但经过微调后，模型的数学推理能力表现不错，“对于一些常见的加减乘除应用题，答得还可以。”

伴随通义千问开源消息发出，两个模型在社区上架后，应用开发者等用户既可从魔搭社区直接下载模型，也可通过阿里云灵积平台访问和调用Qwen-7B和Qwen-7B-Chat两个模型。当用户使用上述开源大模型体系的过程中，阿里云会提供包括模型训练、推理、部署、精调等在内的全套服务。

今年4月推出自研大模型通义千问后，今年7月，阿里云宣布将促进中国大模型生态的繁荣作为首要目标，向大模型创业公司提供智能算力、开发工具等服务。

谈及当前国内外开源的模型，飞鲸认为对包括他在内的开发者们帮助极大，“可以基于自己的业务领域需求，做finetune（微调）或者和本地知识库对接，实现快速地业务落地。”

飞鲸告诉记者，在一些垂直领域并不需要参数量很高、通用能力很强的模型，而是“希望一些小甜点”，他举例到，比如几十到百亿左右参数规模的模型，结合垂直领域数据，就可以发挥很好的价值。

阿里云方面认为，开源大模型可以帮助用户简化模型训练和部署的过程，用户不必从头训练模型，只需下载预训练好的模型并进行微调，就可快速构建高质量的模型。

TMT新闻部记者
长期关注并报道TMT领域的重大事件，时刻保持新闻敏感，发现前沿趋势。擅长企业模式、人物专访及行业深度报道。
重要新闻线索可联系qianyujuan@eeo.com.cn
微信号：EstherQ138279

热新闻

总编对话｜从中国走向世界——对话松下电器中国东北亚公司总裁CEO木下步

聚焦主业提升品牌：恒安集团接班人的长期主义理想

希捷科技全球执行副总裁暨首席商务官郑万成：未来五年，中国将成为全球生成数据最多的市场