阿里大文娱CTO郑勇：生成式AI已融入文娱生产并大幅缩短制作周期

沈怡然2023-08-18 09:08

记者沈怡然 8月17日，阿里大文娱CTO郑勇在媒体交流会上首次公开了团队使用生成式AI技术的过程。郑勇认为，相比工业、医疗、科学，生成式AI在文娱行业率先落地并融入了生产，可以大幅提升影视、游戏的制作效率，缩短生产周期，但在帮助精良制作、提升品质方面用处还不大，公司正关注相关技术的发展。

阿里大文娱是阿里拆分后的六大板块之一，集团实行董事会领导下的CEO负责制，并用AIGC将技术维度划分成C端和B端两部分，C端是通过投资和自研，产出妙鸭相机等应用；B端是用外部AI通用大模型赋能集团的影视、视频生产。

郑勇曾早期参与阿里云基础建设，包括第一代ECS系统的研发。他表示在2022年12月，团队开始尝试海外一系列AI工具，ChatGPT、Midjourney、Stable Diffusion等，并应用到多个业务场景中。“最初是员工自发地研究、使用新工具，去解决工作中的实际问题，包括用ChatGPT搭脚本框架”。郑勇认为，生成式AI率先渗透在文娱行业，是因为目前市面上成熟的工具仍然以大语言模型、文生图模型为主，而图文创作是文娱行业艺术表达的核心。

郑勇举例，动漫行业从原画制作、设计、到建模环节，都在尝试用Midjourney、Stable Diffusion来提效，缩短生产时间，公司相关业务也在实践，目前宣发环节，很多图片素材都用AI直接生成。

郑勇表示，不论游戏、影视还是短视频的生产，美工都是文娱行业中占比较大的部分，一些文生图工具提升了美工的效率，“AI能在几秒钟生成一幅画、一张海报，人类以往需要以周和月为单位来创作，过程中还需要大量的沟通、修改，现在大大缩短了我们的生产周期”。

但是，郑勇发现品质把控、提升质量方面的问题仍需要专业的人来解决，目前没发现比较好的视频生成和3D生成工具，而且市面上的生成式AI都是通用的大模型，在各领域都有一定积累，但是无法在某个领域生成十分极致的内容。在郑勇看来，目前生成式AI无法替代专业人士，只是革新了专业人士手中的工具，因为AI创作的水平和个人的审美、鉴赏力高度相关。郑勇曾对比理科生和美术生同样用Midjourney生成的图画，认为两者有很大差距。

阿里大文娱方面表示，集团正在为创新产品提供组织保障，已于今年6月成立了神力视界（深圳）文化科技有限公司，注资1亿元，经营范围包含人工智能应用软件开发、文艺创作、广播电视节目制作经营等，由阿里巴巴文化娱乐有限公司全资控股，法定代表人为郑勇。

郑勇表示，此前爆火的妙鸭相机就是依托神力视界的技术能力孵化出来的，接下来为了便于管理，妙鸭相机的公司主体也将并入神力视界。