跳动百科

AI视频迎来寒武纪爆发,专家称行业将3年走完百年影史 创意内容成竞争核心

封睿霭
导读 今年二月,OpenAI推出了首个文本到视频的生成模型Sora,其创新的一镜到底技术和高度统一的人物场景处理震撼了业界,将视频生成推向了年度技...

今年二月,OpenAI推出了首个文本到视频的生成模型Sora,其创新的一镜到底技术和高度统一的人物场景处理震撼了业界,将视频生成推向了年度技术热点之一。紧随其后,国内AI视频领域也迎来了前所未有的发展浪潮。

在最近的世界人工智能大会上,AI视频生成成为了焦点议题。众多创作者纷纷利用这一技术进行创意实验,如让甄嬛在视频中做出荒诞不经的行为,或让刘华强与瓜贩戏剧性地和解,甚至重现网络梗图中的夸张情景,这一切都得益于各种AI视频生成模型。

六月份见证了快手的可灵、Luma AI及Runway的Gen-3 Alpha等多个AI视频生成模型的集中发布,尤其是快手的可灵,被誉为中国的Sora,其生成视频的时长达到了120秒,并开放了多项功能,如图生视频、视频续写等。该模型在内测中展现出了惊人的能力,如模拟物理动态,赢得了极高评价,被认为是人工智能领域的又一重要进展。

尽管如此,当前的视频生成技术仍面临挑战,如可控性不足,难以保证人物形象、场景风格的连贯一致,以及运动流畅性、光影、语音自然度等方面的待优化。上海交大教授倪冰冰指出,生成算法常遇到结构和细节问题,比如物体的不正常增减、视觉错误等。她认为,尽管AI视频技术提升了生产效率,但在成熟的影视制作面前仍有差距。

对于AI视频的未来,美图公司陈剑毅预测,该技术正处于初级阶段,类似于电影行业的起步期,但可能在未来三到五年内经历快速发展,尤其是在网络文学和教育内容领域。不过,井英科技CEO朱江提到,AI生成内容的新鲜感可能很快消退,内容创新才是持续吸引用户的王道。

各大互联网企业,包括字节跳动、快手、阿里、百度、腾讯等,纷纷加码视频生成领域,竞争日益激烈。然而,如何实现商业化仍是一大难题,除了技术瓶颈,高昂的成本也是必须跨越的障碍。倪冰冰教授强调,未来需要新的架构和技术来支持高效且可持续的媒体生成能力。

对于这一新生的AI生成时代,朱江比喻为寒武纪的生命大爆发,充满了未知与机遇。他坚信,保持技术领先和深入理解市场需求,是在这场变革中立足并抓住机会的关键。