商汤科技栾青：视频生成AI或将重塑数字文娱行业

胡群2023-11-15 14:49

记者胡群 11月13日，凤凰卫视正式推出旗下面向AI时代的全新业务——“凤凰智媒AI数据业务”，并发布首批“中文访谈对话数据集”和“正向价值对齐数据集”。据凤凰卫视融媒体研发副总经理冯伟表示，凤凰数据的核心目标是推动AI数据领域华语数据的丰富与共享，同时为中华文化的传承与传播提供AI时代的探索思路和解决方案，让AI与中华文化认知对齐更简单。

“现在大模型生成结果主要以文字和图片为主，但大家在互联网上消费内容大都以视频为主，文字消费可能还不到1/10，图片的占比更低。在海外视频生成已经成为大模型竞争的主要领域，国内暂时还没有公开的通用视频平台或者产品发布出来，但视频生成也将会面临巨大挑战，如所需要的数据规模会更大，对资源的消耗也会更多。”商汤科技数字文娱总经理栾青在当日举办的“数聚未来——凤凰大模型数据研讨沙龙”上表示，当前市场对于大模型的未来发展及应用暂时处在探索阶段，需要各方力量共同努力。

“视频的AI生成也许会让整个文化娱乐行业生态重建”。在论坛期间，栾青接受记者采访时表示，目前已经有非常多的人物类视频由AI生成，在短视频直播等领域打开了新的生态模式，未来通用视频生成将激发更多商业模式涌现出来。

：文字工作者未来将能用大模型在很短时间内将文字生成视频？

栾青：当前市场对于大模型的未来发展及应用暂时处在探索阶段，需要各方力量共同努力。至今大模型已发布数百种，但在应用端仍然缺少“杀手级”应用。虽然大模型可以轻易实现文生文、文生图，但不可否认的是，现在互联网文娱消费中，文字和图片的占比非常低，而视频，尤其是短视频的占比非常高，特别是二三线城市，乡村居民在视频上的时长远远大于文字和图片。

设想一下，如果记者通过大模型可以很轻松将文字转化为视频，会发生什么？媒体无疑将会发生巨大变化，受众群体不再单一。而这一功能可能会更深受影视编剧们欢迎，因为他们的创意可以很快呈现出来。

目前国内厂商发布的大模型主要还是集中在文生文、文生图领域，但-放眼国际上的大模型已经探索至视频生成，甚至厂商间竞争已经非常激烈。国内拥有更大更丰富的市场和上下游生态，当前在人物类视频领域已经形成了比海外更加丰富的应用，比如数字人的短视频和直播营销。未来国内大模型在视频应用等领域的各种创新场景激励下或将能够突围，甚至弯道超车，从而构建新的内容生态。

：GPT-4Turbo支持128k上下文已被称为“史诗级”更新，视频生成AI对技术将会提出怎样的要求？

栾青：这的确需要技术上的突破，但现在技术上是以指数级方式迭代，乐观估计明年年中将能看到更多实践应用的雏形，会以更加实用性的应用形式涌现。当然这可能是现实发展到那一步，我们才能知道它能实现哪些功能，现在还没有办法给出定论。正如凤凰卫视此次推出的数据平台令人振奋，我们期望行业中有更多的媒体、企业能参与其中，推出更多具备结构化、更丰富的数据资源。

但是，过程中也面临巨大挑战，视频生成AI无疑需要更多数据开源，资源消耗也会更多，门槛会更高，还将面临法律法规的约束。但值得肯定的是，一旦这种产品推向市场，整个数字文娱行业将会被重塑，甚至还将带来更多行业的巨变。