零一万物李开复：用最少的芯片、最低的成本去训练“能力所及”的模型

钱玉娟2024-05-13 21:10

记者钱玉娟 5月13日，创新工场董事长兼CEO李开复带队孵化的AI公司零一万物，正式发布了千亿参数规模的闭源模型Yi-Large。这是零一万物发布的首个闭源模型，也是首个千亿参数规模模型。

这次Yi-Large发布，许久未露面的李开复还通过个人抖音账号对发布全程进行了直播。他介绍，在斯坦福评测机构AlpacaEval 2.0官方认证的最新模型排行榜上，Yi-Large模型的英语能力主要指标LC Win Rate（控制回复的长度）排到了世界第二，仅次于美国人工智能研究公司OpenAI旗下最新大模型ChatGPT-4 Turbo。

在各家大模型进入能力力求对标ChatGPT-4的阶段，零一万物在Yi-Large模型能力评测和展示环节，也表示在通用能力、代码生成、数学推理、指令遵循等多方面，模型指标超越了ChatGPT-4、Google Gemini 1.5等同级模型。

除了发布闭源模型Yi-Large，李开复还宣布零一万物早先发布的Yi-34B、Yi-9B等中小尺寸开源模型，版本可升级到Yi-1.5系列。借此机会，零一万物公开了开源、闭源双轨大模型的战略布局。

2023年零一万物创立，以开源模式进入AI领域。2023年11月，零一万物首发Yi系列开源模型，仅一个月后，Yi-34B版本模型成为国内唯一一个被英伟达AI Playground（AI游乐场，一个提供预训练模型和资源的平台）收录的大模型。

Yi系列开源模型发布后，零一万物收到了来自全球开发者的反馈，“从学习、导航、销售、API（应用程序编程接口）的应用到商业写作，都已经开始有早期用户”。李开复认为模型开源会让全球每个用户受益，他甚至觉得，学生、创业者、老师、科研人员、公益组织都需要用大模型，但“无论用ChatGPT-4还是Yi-Large，（他们）都会嫌太大、太贵”。

与OpenAI这一超级独角兽在巨额融资后可以用超级多的GPU展开模型训练不同，“我们是务实的AGI（通用人工智能）信仰者”，李开复说，零一万物走出了一条适合自己的路，就是用最少的芯片、最低的成本去训练“能力所及”的模型。

谈及零一万物的发展方向，李开复称，“我们的精力不会放在行业预测，也不会用大力出奇迹的唯一思维，（去）追求能不能用一百亿美金、一千亿美金（预测AGI的燃点）”，他认为与零一万物相关度更高的是“AI普惠点”，他希望团队成为一个“点燃者”，帮助开发者通过API和Yi系列模型，在电商、社交、娱乐等领域打造出AI时代的淘宝、微信、抖音等。

“现在是分秒必争。”李开复看到国际大厂都在不断迭代进步，零一万物的步伐也在加快，在推出Yi-Large大模型的同时，零一万物内部已经启动了下一代模型Yi-XLarge的相关训练。

李开复称，目前“不是可以做一个模型，然后就休兵半年、一年的时间”，团队正朝着美国前沿大模型去探索模型技术的进步。李开复也见证着中国公司在一个新的环境里快速并野蛮生长，“当然会有一家又一家（公司）慢慢地转型甚至退场”，但他随后说，眼下中国模型市场还在成长中，不要低估中国创业者的生命力。