新V观海外:全球AI视频赛道已现百舸争流之势

陈沛2024-07-26 10:57

陈沛/文 今年二月OpenAI突然放出Sora生成视频的精美效果时,应该很难想到在接下来短短几个月时间,AI视频的各个新老对手纷纷发力,在AI生成视频的赛道上竞相追逐。

老对手纷纷跟进

长期处在AI发展最前沿的谷歌DeepMind自然不甘落后,在五月谷歌I/O大会上推出Veo模型,宣称能生成1分钟1080P高质量视频,并在官网展示了多个从文本提示词生成的视觉效果连贯的精美视频。但目前Veo模型还处于私有预览版,没有对公众用户开放,用户需通过谷歌实验室的VideoFX平台申请,获得访问权限后才有机会使用。

另一家深耕视频领域的AI公司Runway也在六月发布新版视频模型Gen-3 Alpha,将生成视频时长从前一版的4秒左右增加至10秒,已向付费用户开放使用。Runway同时还发布了AI生成视频的提示词指南,包括运镜方式、动作方式、文字效果、艺术风格等多方面的说明,帮助用户更好地使用AI视频服务。

新对手也不甘示弱

近期陆续还有多家初创公司以“Sora挑战者”的姿态登场。

Luma在六月推出公开可用的视频生成服务Dream Machine,可生成5秒的视频,生成等待时间约在2至3分钟左右。虽然生成时长和视频质量并不像宣传中的效果,但其公开可用性仍在业内引发很多关注。本周,Luma继续在生成视频中新增了loop功能,通过让背景动态效果循环起来的方式,将生成视频长度延长至十几秒,同时保证了视频效果的一致性。

Haiper也在七月突然出现在广大公众视野中,支持用户公开访问,能生成并延长至8秒高清视频。Haiper的生成功能也颇具特色,为首次使用的用户提供了结构化提示词,降低首次体验的不确定性。同时,Haiper还为生成视频提供了多社交平台共享接口,这应该与创始人之前担任伦敦Tiktok机器学习负责人的背景有关。

Odyssey则高调宣称将能够生成好莱坞级别的视觉效果,直言现在这些基于互联网公开低质量视频训练的AI视频模型根本达不到专业级视频的水平。虽然Odyssey还没有未正式提供视频生成服务,但近期已经获得了900万美元种子轮融资,投资者中不乏谷歌创投(Google Ventures)、DCVC、Air Street Capital等AI领域知名投资机构。

OpenAI努力维持Sora热度

面对这些新老对手的你追我赶,OpenAI身处在狼烟四起的AI视频赛道中并非毫无反应。除了此前发布基于Sora制作的首部品牌商业广告之外,OpenAI近期还频频放出由Tammy Studio、Studio Tim Fu等AI艺术工作室使用Sora制作的样片。

不过,这些样片对于OpenAI用来维持Sora热度的实际效果有限。因为用户发现这些深度使用AI的工作室做出的视频虽然设计精美、天马行空、配乐考究,但依然能看出物体细节和动作协调性方面的问题。而且这些样片的惊艳感已经下降,广大用户呼声最高的还是何时能够公开访问Sora。

目前,OpenAI并没有推出Sora服务的准确时间表,而这看上去也情有可原。一方面,在正式推出Sora服务前,AI直接生成1分钟长视频的等待时长和推理成本必须大幅优化,以适应用户反复调整提示词、迭代生成视频的需求;另一方面,AI生成视频在传播错误信息、伪造内容方面的滥用风险要比AI生成文本高的多,Sora必须全面开发阻止不安全内容生成的内置防护措施和鉴别机制,才能在推出服务时尽可能消除AI生成视频的风险。

Baidu
map