重组团队、重金投入,谷歌AI业务能否重回巅峰?

钱玉娟2024-04-27 11:59

经济观察报 记者 钱玉娟 美国东部时间4月25日,谷歌母公司Alphabet发布财报。2024年第一季度,Alphabet的营收为805.39亿美元,同比增长15%,创下2022年初以来的最快单季增速;净利润为236.62亿美元,同比增长57%。

财报发布后,Alphabet股价在美股盘后时间大涨,截至发稿,股价涨幅超过11%。谷歌的总市值也达到了1.96万亿美元。

谷歌CEO(首席执行官)桑达尔·皮查伊(SundarPichai,下称“皮查伊”)在财报发出后的业绩会上表示,在Gemini(谷歌旗下的多模态大模型)时代,谷歌的发展很顺利,“我们在AI(人工智能)研究和基础设施方面拥有领导地位,再加上遍布全球的产品,这为下一波AI创新奠定了良好的基础。”

但在之前的一段时间,谷歌AI业务的进展一波三折。2023年2月,谷歌的AI聊天机器人Bard在官宣视频中出现照片识别错误,Alphabet股价在次日暴跌9%。此后,谷歌发布的Gemini1.0模型陷入造假传闻,推出的Gemini1.5Pro模型又被Sora(美国AI研究公司OpenAI旗下的文生视频大模型)抢去了风头。

与此同时,谷歌也在不断调整AI团队架构。4月18日,皮查伊给全体员工发布了邮件,宣布全面整合谷歌的AI团队,表示此举将有助于更迅速高效地开发AI产品和服务。

从2012年第一次识别出猫,到2016年在人机大战中战胜顶尖人类棋手,谷歌旗下的AI项目曾经代表着人类最前沿的技术探索。但在OpenAI旗下AI聊天机器人ChatGPT引发的大模型技术浪潮中,谷歌在AI领域的优势不再。

而最新发布的财报显示,Alphabet在今年一季度的AI资本支出达到120亿美元。重组团队、重金投入,能否让谷歌的AI业务在未来重回巅峰?

重组团队攻向AI

谈及皮查伊近日发布的全员邮件,一位在谷歌工作十余年的人士说:“从来没看到过CEO(发送过)这么长的邮件。”

这是一篇标题为《建设我们的AI未来》的长文,皮查伊在文章开头表示谷歌正在进行一场波及全公司的变革,最先需要变化的是模型与研究。

皮查伊宣布将谷歌专注于大模型以及负责AI技术安全等研究的谷歌研究部门GoogleResearch,全面整合到AI业务部门GoogleDeepMind之中。

上述谷歌人士称,谷歌在战略层面进行组织调整,是为了更聚焦且高效地推进大模型与应用端的融合,从而加速AI技术的开发与创新。本次调整不只是出于技术层面的考虑,也是因为谷歌内部的业务太复杂了。他向经济观察报出示了一张表格图,图中纵向展示的是谷歌的几十个产品线或业务部门,横向展示的是谷歌设立的4个主要技术栈方向——Mobile(移动端)、Web(全球广域网)、AI(人工智能)、Cloud(云计算)。

此前,皮查伊已经对谷歌的AI团队采取了一系列调整动作。2023年4月,他选择将谷歌旗下的 GoogleBrain、DeepMind两个AI研究团队进行合并,创建了新部门GoogleDeepMind。GoogleDeepMind主要专注于通用AI模型研究与创新,由DeepMind原联合创始人兼 CEO戴密斯·哈萨比斯(DemisHassabis,下称“哈萨比斯”)担任负责人。

对于上述两个团队的合并,皮查伊认为,尽管谷歌拥有两个排名世界前三的AI团队,但在开始建立更强大模型的时候,谷歌不仅需要更庞大的计算资源,也要从纯粹的AI研究转向商业化,还需要投入大量资源开展测试和确保安全。

上述谷歌人士也表示,DeepMind此前一直是AI强化学习的早期探索者,“在谷歌内部是一个相对独立的存在”。他认为,在谷歌将所有专注于AI创新研究、开发的人才整合至哈萨比斯的团队后,可以在接下来更为激烈的模型进化中做到全力出击。

Gemini模型演进

ChatGPT中“T”代表大模型技术Transformer,由谷歌DeepMind团队最早发明的。然而,在OpenAI抢先用生成式AI产品打响市场后,谷歌不但姗姗来迟,甚至在Bard的首秀中“翻车”。

2023年11月,谷歌全新推出的大模型Gemini具备语言、听力与视觉等方面的多模态交互能力,还可以在数据中心、移动设备等多类型平台上运行。

Gemini模型家族共有三个量级的产品,分别是可用于特定任务和端侧的Nano版,可用于多任务的Pro版,以及模型能力最强的Ultra版。谷歌在今年2月16日宣布升级Gemini1.5Pro,风头却被同日推出的Sora抢尽。

IT投资人、新加坡VibraniumCon-sulting副总裁陈沛认为,市场忽视了Gemini的模型进化,Gemini1.5Pro支持的文本长度可达1000万tokens(to-ken为大模型文本中的一个最小单位),“能力已经与GPT-4(OpenAI旗下的大模型)不相上下”。

陈沛称,尽管GeminiUltra版至今没有接受公开排行榜的测试,但这一版本模型的参数规模远大于GPT-4。行业内的共识是,谷歌在模型创新能力上正在反超OpenAI。

斯坦福大学AI研究所在4月15日发布的《2024斯坦福AI指数报告》也重点提及了Gemini。过去一年,谷歌发布的基础模型最多。此外,GeminiUltra版本的训练成本预计达到1.91亿美元,而GPT-4的训练成本仅为约7800万美元。

4月 15日在加拿大举行的TED2024大会上,曾有参会者邀请哈萨比斯评价微软与OpenAI计划开发价值达1000亿美元超级AI计算机的动作。哈萨比斯表示,虽然谷歌内部并不谈论在提升AI计算能力方面具体的投入数字,但随着时间推移,谷歌的投资后续将超过1000亿美元。

在上述谷歌人士看来,谷歌并非近两年才将AI作为重点。早在2017年,谷歌就提出了“AI第一”战略。除了广为人知的Transformer技术和战胜顶尖人类棋手的AI机器人AlphaGo,谷歌还有很多AI创新武器“不急于亮出来”。他认为,谷歌在当前的AI模型竞赛中没有跟风去拼速度。

加速端侧落地

4月中旬,极客邦科技创始人兼CEO霍太稳在美国参加了 GoogleCloudNext2024大会。在大会的主题演讲环节,谷歌宣布将与中国手机厂商OPPO、一加合作,为它们的2024款手机产品提供Gemini模型支持。

此前,华为、小米、vivo、OPPO、荣耀等国内手机厂商,都发布了具备大模型能力的手机。但谷歌推进AI模型落地端侧的动作,让霍太稳感受到了国内厂商与谷歌之间的差距。“尤其在硬件芯片方面,谷歌自研了TPU(张量处理器),还广泛应用了英伟达高端GPU(图形处理器),这是(国内厂商)能力所不及的。”霍太稳说。

从谷歌对外释放的信息看,旗下智能手机Pixel8与Pixel8Pro都将在今年6月的季度更新中具备GeminiNano模型的服务能力。在陈沛看来,用户若想在手机上流畅地使用最高性能的GeminiUltra模型,谷歌还需专门优化大模型的性能、响应延迟和能耗。

易观分析高级分析师陈晨称,目前手机厂商主要与芯片、大模型等厂商进行战略合作,部分目的是解决大模型在端侧的适配以及模型能力应用边界等问题。“要想实现大模型在端侧的高效运行,厂商要平衡算力与能效、智能化与便携化之间的诸多问题。”陈晨说。

不过,与GPT-4相比,Gemini模型具备在端侧率先落地应用的优势。陈沛告诉经济观察报,谷歌拥有安卓移动应用生态,近来还在尝试将一些生成式AI功能更新到安卓APP中,这些都为Gemini模型在端侧的创新应用提供了土壤。

上述谷歌人士称,国内的安卓市场是割裂的,每家手机厂商都可以有自己的分发渠道,甚至可以自研操作系统,“一旦(它们的)手机应用出海,只有两个可以依靠的分发渠道,一个是AppleStore(苹果旗下移动应用市场),一个是GooglePlay(谷歌旗下移动应用市场)。”

一位手机行业人士向经济观察报证实,国内手机厂商选择与谷歌合作,看重的更多是Gemini模型与海外市场的适配性。他说,国内厂商虽然早早展开AI能力自研,在端侧模型方面进行了相关应用创新,但它们的AI能力和模型服务“在海外是不可用的,或者说不适用于海外用户”。

此外,手机厂商对于大模型端侧落地和应用创新的推动,也是Gemini模型加速迭代的催化剂。

2023年末,一加中国区总裁李杰接受经济观察报在内的媒体采访时表示并不看好当时的“大模型手机”,直言“(它们)更像是一个噱头”。时隔两三个月,一加的母公司OPPO便发布了全新的AI战略,一加也在今年3月推出了支持大模型的Ace3V智能手机。

上述谷歌人士透露,除了国内手机厂商,三星也在和谷歌方面接洽,寻求大模型的合作。

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。
TMT新闻部记者
长期关注并报道TMT领域的重大事件,时刻保持新闻敏感,发现前沿趋势。擅长企业模式、人物专访及行业深度报道。
重要新闻线索可联系qianyujuan@eeo.com.cn
微信号:EstherQ138279
Baidu
map