记者 钱玉娟 北京时间5月15日凌晨,被美国人工智能研究公司OpenAI“截胡”的谷歌,如期举办了一年一度的Google I/O 2024(2024谷歌开发者大会,下称“谷歌I/O”)。
大会上,谷歌发布了多个新产品、新工具、新功能,包括:最新款大模型Gemini1.5 Pro的上下文窗口从100万tokens(最小输入单元)升级到200万,并推出轻量化模型Gemini 1.5 Flash;推出文生图新模型Imagen 3、音乐创作大模型Music AI Sandbox、视频生成模型Veo;将AI融进了搜索功能,将在美国推出“AI概览”(AI Overviews);发布了AI通用智能体项目Project Astra和谷歌下一代开源模型Gemma2。
如果没有OpenAI“截胡”的话,这将是今年科技圈的“沸点”。
在谷歌I/O前一日,北京时间5月14日凌晨,OpenAI召开了春季发布会。该发布会十分简短,仅花了不到30分钟,宣布了全新旗舰模型GPT-4o,以及在大模型ChatGPT中免费提供更多功能。但GPT-4o的“类人”响应速度,让观看者感觉VPA(虚拟个人助理)的实现指日可待。这让科技圈提前沸腾了。
宝宝树、米茶公社创始人王怀南熬夜观看了OpenAI的春季发布会。他也曾是谷歌亚太区CMO(首席营销官)。他称,老东家(谷歌)5月14日(美国当地时间)在美国加州召开大型产品发布会,“一定是以AI为主线条的”。在他看来,OpenAI用看似不经意的26分钟,挑战了一家公司一年一度的重大发布,“这是一个四两拨千斤的举措”。
两小时,谷歌连环回击
相比于OpenAI不到30分钟的春季发布会,谷歌I/O花了近两个小时,公布了多个新产品、新工具。
今年谷歌I/O的主舞台设在了加州海岸线湖公园内的圆形剧场。开幕前一天,谷歌CEO桑达尔·皮查伊(SundarPichai)在台侧拍下一张图片,发出了他的第一篇LinkedIn(领英)帖子,并配文,“迫不及待地想看到这些座位上坐满了来自世界各地的开发者”。
从目前网络上流出的大会相关图片来看,圆形剧场座无虚席。在大会开场,桑达尔·皮查伊也说,现在已经有超过150万开发者正在使用谷歌的原生多模态大模型Gemini。
但这场围绕AI的竞赛,还在进行中。
大会上,谷歌宣布诞生一年的Gemini实现着能力跃升,除了1.5 Pro进阶版的上下文窗口拓展至200万个tokens,轻量级模型1.5 Flash的上下文窗口也达到了100万个tokens。Gemini的功能方面也有不少拓展,例如移动对话体验,交谈更自然,模型也可引入安卓系统的底层,多模态的Nano版模型还包括诈骗监测等功能。
谷歌还推出Imagen 3、Music AI Sandbox、Veo三个大模型应用。其中视频生成模型Veo可以生成超过一分钟的视频,更是被视为谷歌反击OpenAI的文生视频大模型Sora的产品。
谷歌还发布了AI通用智能体项目Project Astra和融进了Gemini的搜索功能AI Overviews。
谷歌DeepMind的CEO戴密斯·哈萨比斯(DemisHassabis)首次现身谷歌I/O。他展示了Project Astra(高级视觉和对话响应智能体项目,该项目代表着谷歌对人工智能助手的未来愿景),在展示过程中,他一边实时拍摄一边与手机中的AI Agent(助手)交谈,AI Agent展现出多模态理解和实时对话能力。
从大会视频来看,Project Astra的表现不错,虽然它的响应速度比起“与人类的响应时间相似”的GPT-4o要慢一些。如果不是OpenAI率先发布了GPT-4o,ProjectAstra极有可能是点燃大众对VPA畅想的那一个。
在OpenAI召开春季发布会之前,市场曾广传OpenAI将推出AI搜索功能。但本业是搜索的谷歌,率先将AI功能放进了自己的搜索业务。
谷歌称,基于最新版本Gemini,用户可以对搜索引擎提出任何想知道的事情,或者需要做的事情,比如“寻找波士顿最好的瑜伽或普拉提工作室”,除了给出搜索结果,搜索引擎还可以做工作室介绍,给出门店距离、工作时间等信息;当用户需要“创建一个饮食计划”时,搜索引擎也可以完成。
“我们最大的投资和创新领域之一,是我们的创始产品——搜索。”桑达尔·皮查伊回顾了谷歌创建搜索至今25年的历史,重点分享了在Gemini变革下,谷歌AI搜索实现的水平提升。
在OpenAI缺席AI搜索赛道之后,谷歌通过AI Overview、“Circle to Secarch”画图即搜功能,以及视频搜索等多个功能的突破,让自家支持多轮推理、规划能力、视频提问等功能的AI搜索,面向市场进行展示,也给予竞争对手有力的回击。
谷歌的创新危机
尽管亮相了多项更新和多个产品,也未能完全洗去市场对谷歌创新力的质疑。
接近两个小时的谷歌I/O,谷歌推出的新产品、新工具、新功能,甚至新基建等,总计数目多到超过二十款,也将谷歌对AI的重视和在AGI(通用人工智能)方向上的发展投入展露无遗。
“(市场侧)对谷歌I/O的反馈都很积极。”一位在谷歌工作十余年的人士称。
但王怀南说:“谷歌并没有抓到眼球。”大会上,谷歌从CEO到多个产品的总负责人都有出场介绍,OpenAI的春季发布会仅有三个人出场介绍GPT-4o,但在王怀南看来,这三个人就“完全把背后有数百甚至上千人准备的两个小时的谷歌I/O的光芒掩盖掉了”。
王怀南说:“如今的谷歌像极了老微软。”这并不是一个积极的描述。因为对王怀南这种二十多年前从硅谷走出的人来说,微软“没有创新,只懂赚钱,没有理想,没有使命,产品混乱”。
王怀南看完谷歌I/O后称,虽然这次谷歌发布的新产品、新工具、新功能、新基建等数量众多,但发布的产品“全是保护自己的商业利益和保护搜索的产品”。时值如此关键的竞争时点,几乎是“革命的关头”,曾经被视为AI创新标杆的谷歌却用一个保护性的想法,保护着它现有的搜索习惯和搜索的商业模式,这让他想到了当年的微软。
但如今的微软步伐也轻快了起来。微软不仅巨额投资OpenAI旗下的ChatGPT,还将旗下Bing搜索的服务器、搜索数据甚至算力等倾斜支持OpenAI进行大模型训练,系列投入让微软“跨步走上了AI革命的直通车”。
王怀南称,他看到了一个“轻装上阵,不靠搜索吃饭”的微软,甚至发现那个“老旧的、缓慢的、被动防御的、碎片化的”微软,变得灵活且以用户为导向,这就像过去那个“凭借创新时不时让大家惊艳到不可思议的老谷歌”。
这就让谷歌的劲敌不只是年轻的OpenAI,还有正在改变的微软。
当下的谷歌在迸发活力的OpenAI和微软的反衬下,“急需断掉自己创新的原始思维。”但王怀南同时也称,目前谷歌重投AI并进行组织调整的动作,让他看到了想象空间。
搜索引擎起家的谷歌,当前对AI的重视程度也越来越高。大会现场,谷歌也统计,桑达尔·皮查伊和戴密斯·哈萨比斯两个小时主题演讲中,提及AI多达121次,Gemini出现的频次并不输于Google一词。
但桑达尔·皮查伊在大会上也称,“目前谷歌仍处于AI平台转型的初期”。出门问问创始人李志飞也通过社交媒体表示,眼下的AI产业也处于早期阶段,无论是技术发展还是商业竞争,“离终局还很远”。
李志飞称,OpenAI的一些操作“越来越机会驱动”,除了有心机和谷歌抢头条,创始人“言必AGI”的状态也不被他看好。基于此,他也称,在沿着惯性和顺着势能一路狂奔的路上,OpenAI也要考虑一下“如何避免成为AI时代的先烈”。