零一万物李开复:用最少的芯片、最低的成本去训练“能力所及”的模型

钱玉娟2024-05-13 21:10

记者 钱玉娟 5月13日,创新工场董事长兼CEO李开复带队孵化的AI公司零一万物,正式发布了千亿参数规模的闭源模型Yi-Large。这是零一万物发布的首个闭源模型,也是首个千亿参数规模模型。

这次Yi-Large发布,许久未露面的李开复还通过个人抖音账号对发布全程进行了直播。他介绍,在斯坦福评测机构AlpacaEval 2.0官方认证的最新模型排行榜上,Yi-Large模型的英语能力主要指标LC Win Rate(控制回复的长度)排到了世界第二,仅次于美国人工智能研究公司OpenAI旗下最新大模型ChatGPT-4 Turbo。

在各家大模型进入能力力求对标ChatGPT-4的阶段,零一万物在Yi-Large模型能力评测和展示环节,也表示在通用能力、代码生成、数学推理、指令遵循等多方面,模型指标超越了ChatGPT-4、Google Gemini 1.5等同级模型。

除了发布闭源模型Yi-Large,李开复还宣布零一万物早先发布的Yi-34B、Yi-9B等中小尺寸开源模型,版本可升级到Yi-1.5系列。借此机会,零一万物公开了开源、闭源双轨大模型的战略布局。

2023年零一万物创立,以开源模式进入AI领域。2023年11月,零一万物首发Yi系列开源模型,仅一个月后,Yi-34B版本模型成为国内唯一一个被英伟达AI Playground(AI游乐场,一个提供预训练模型和资源的平台)收录的大模型。

Yi系列开源模型发布后,零一万物收到了来自全球开发者的反馈,“从学习、导航、销售、API(应用程序编程接口)的应用到商业写作,都已经开始有早期用户”。李开复认为模型开源会让全球每个用户受益,他甚至觉得,学生、创业者、老师、科研人员、公益组织都需要用大模型,但“无论用ChatGPT-4还是Yi-Large,(他们)都会嫌太大、太贵”。

与OpenAI这一超级独角兽在巨额融资后可以用超级多的GPU展开模型训练不同,“我们是务实的AGI(通用人工智能)信仰者”,李开复说,零一万物走出了一条适合自己的路,就是用最少的芯片、最低的成本去训练“能力所及”的模型。

谈及零一万物的发展方向,李开复称,“我们的精力不会放在行业预测,也不会用大力出奇迹的唯一思维,(去)追求能不能用一百亿美金、一千亿美金(预测AGI的燃点)”,他认为与零一万物相关度更高的是“AI普惠点”,他希望团队成为一个“点燃者”,帮助开发者通过API和Yi系列模型,在电商、社交、娱乐等领域打造出AI时代的淘宝、微信、抖音等。

“现在是分秒必争。”李开复看到国际大厂都在不断迭代进步,零一万物的步伐也在加快,在推出Yi-Large大模型的同时,零一万物内部已经启动了下一代模型Yi-XLarge的相关训练。

李开复称,目前“不是可以做一个模型,然后就休兵半年、一年的时间”,团队正朝着美国前沿大模型去探索模型技术的进步。李开复也见证着中国公司在一个新的环境里快速并野蛮生长,“当然会有一家又一家(公司)慢慢地转型甚至退场”,但他随后说,眼下中国模型市场还在成长中,不要低估中国创业者的生命力。

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。
TMT新闻部记者
长期关注并报道TMT领域的重大事件,时刻保持新闻敏感,发现前沿趋势。擅长企业模式、人物专访及行业深度报道。
重要新闻线索可联系qianyujuan@eeo.com.cn
微信号:EstherQ138279
Baidu
map