阿里大文娱CTO郑勇:生成式AI已融入文娱生产并大幅缩短制作周期

沈怡然2023-08-18 09:08

记者 沈怡然 8月17日,阿里大文娱CTO郑勇在媒体交流会上首次公开了团队使用生成式AI技术的过程。郑勇认为,相比工业、医疗、科学,生成式AI在文娱行业率先落地并融入了生产,可以大幅提升影视、游戏的制作效率,缩短生产周期,但在帮助精良制作、提升品质方面用处还不大,公司正关注相关技术的发展。

阿里大文娱是阿里拆分后的六大板块之一,集团实行董事会领导下的CEO负责制,并用AIGC将技术维度划分成C端和B端两部分,C端是通过投资和自研,产出妙鸭相机等应用;B端是用外部AI通用大模型赋能集团的影视、视频生产。

郑勇曾早期参与阿里云基础建设,包括第一代ECS系统的研发。他表示在2022年12月,团队开始尝试海外一系列AI工具,ChatGPT、Midjourney、Stable Diffusion等,并应用到多个业务场景中。“最初是员工自发地研究、使用新工具,去解决工作中的实际问题,包括用ChatGPT搭脚本框架”。郑勇认为,生成式AI率先渗透在文娱行业,是因为目前市面上成熟的工具仍然以大语言模型、文生图模型为主,而图文创作是文娱行业艺术表达的核心。

郑勇举例,动漫行业从原画制作、设计、到建模环节,都在尝试用Midjourney、Stable Diffusion来提效,缩短生产时间,公司相关业务也在实践,目前宣发环节,很多图片素材都用AI直接生成。

郑勇表示,不论游戏、影视还是短视频的生产,美工都是文娱行业中占比较大的部分,一些文生图工具提升了美工的效率,“AI能在几秒钟生成一幅画、一张海报,人类以往需要以周和月为单位来创作,过程中还需要大量的沟通、修改,现在大大缩短了我们的生产周期”。

但是,郑勇发现品质把控、提升质量方面的问题仍需要专业的人来解决,目前没发现比较好的视频生成和3D生成工具,而且市面上的生成式AI都是通用的大模型,在各领域都有一定积累,但是无法在某个领域生成十分极致的内容。在郑勇看来,目前生成式AI无法替代专业人士,只是革新了专业人士手中的工具,因为AI创作的水平和个人的审美、鉴赏力高度相关。郑勇曾对比理科生和美术生同样用Midjourney生成的图画,认为两者有很大差距。

阿里大文娱方面表示,集团正在为创新产品提供组织保障,已于今年6月成立了神力视界(深圳)文化科技有限公司,注资1亿元,经营范围包含人工智能应用软件开发、文艺创作、广播电视节目制作经营等,由阿里巴巴文化娱乐有限公司全资控股,法定代表人为郑勇。

郑勇表示,此前爆火的妙鸭相机就是依托神力视界的技术能力孵化出来的,接下来为了便于管理,妙鸭相机的公司主体也将并入神力视界。

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。
大科创新闻部记者
关注硬科技领域,包括机器人及人工智能、无人机、虚拟现实(VR/AR)、智能穿戴,以及新材料领域。擅长企业深度报道及上市公司分析报道。发现前沿技术、发展趋势投资价值。
Baidu
map