巨头们还不敢放出这种非常早期的试验性应用,但创业公司敢。

作者 | 宛辰

编辑| 靖宇

抖音和快手火了之后,短视频成为人们「杀时间」最高效的工具。但直到微信视频号推出后,人们才认真思考,短视频可能不仅是网红和「土味」大片的舞台,自己或许也能「分一杯羹」。

「现在学做短视频还晚吗?」估计不少人在搜索引擎问过这个问题。毕竟,不像公众号,只要有身份证、会写字就行。做短视频至少需要背景乐、视频素材、配音、字幕等一系列因素。就算是像「半佛仙人」那样仅有鬼畜表情包的视频,也需要创作者有简单粗暴的逻辑,和精彩的「贯口」能力。而这些挑战,拦住了大部分想投身短视频事业的人。

不过,随着 AIGC 技术的逐渐成熟,现在,只需要输入一个单词,就能生成配音、背景乐、图片兼备的短视频——一家叫 的网站,集成了大部分 AIGC 工具,满足了人们「一键生成短视频」的幻想。

是怎么做到的?现在的短视频网红和 UP 主们,是不是马上就要被淘汰了?

01

自动生成短视频的魔法

做视频,人如其名,真的很「Quick」。

用户只需在 网站输入提示语、描述清楚想要创建的视频主题, 就开始全自动生产短视频。

当你按下「提交」键, 做了以下事情:

在官网输入提示词Cat后,所展示的工作流程。|截图来源:

基于给出的提示, 先利用 GPT-3 的生成文本功能生成短视频脚本,再从脚本中自动提取或手动输入的关键字,基于这些关键字从免费的 库中选择背景视频,同时叠加由 DALL-E 2 生成的图像,并调用 Cloud 的文本转语音 API 来添加来自 免版税音乐库的合成画外音和背景音乐。

有了这些基本骨架, 生成的就是典型的 、 上的短视频。

在 输入 Cat 作为提示词,会自动生成短视频,如上:

正如上面展示的案例,看起来散装的 生成的短视频质量并不差,甚至还有点熟悉,一瞬间会让你想到生活中的很多场景。你甚至分辨不出来这段视频到底是机器做的,还是人做的。

科技评论者「评论尸」精辟地评论,「现阶段的几个技术应用的组合,确实可以彻底改变人类日常的内容消费习惯:,AI 作画,meme 和短视频。」 这样的工具所生成的短视频正是人们现在所喜欢的内容,「以动态表情包+AI 语音合成配音为主的梗可以在 和抖音反复流行」。

自媒体人评论尸展示一个抖音上流行的短视频。 完全可以自动生成这样的视频。|视频来源:《鼠巢,AIGC,可颂猫,短视频》

但也就这样了,「集各家之所长」的 并没有突破生成式AI目前所展现的可能性。

也正是由于其工作原理, 自动生成短视频的质量并不稳定。一个例子是背景视频的相关性,由于 目前仅限于 目录,随机选择的背景视频常常只是与主题稍微沾边;另一方面,DALL-E 2 生成的图像也显示了当前文本到图像生成技术的局限性,比如文本乱码和比例失调。创始人 Habib 表示,「每天都在测试和修补」。

短视频文案生成器_视频文案能生成短角本子吗_哪里能用chatgpt短视频角本生成文案

Habib 是一名自学成才的开发者,曾在 Meta 从事 Live 和视频基础设施相关工作,他在短短几周内就开发出了 这样一款短视频生成器。

尽管如此, 还是让我们看到了现有技术下生成式短视频的一种可能。毕竟,相比现有大公司,没有包袱的初创公司在产品上更大胆,因为几乎没有试错成本。

结合现有的 AI 技术,利用大量空镜短视频的重复、模板格式, 解决了必须自己生成镜头的问题。

那么, 这样的产品,会成为 Meta、谷歌等巨头,为简化短视频制作而开发的新功能吗?还是像很多生成式 AI 应用一样,不过是昙花一现的「玩具」?

02

当创作者开始

比拼「念咒语」

如果 (一款 AI 图片生成器)和 (一款 AI 文案生成器)的出现,让艺术创作者和营销人员这样特定领域的人看到了 AI 的生产力,那么 则进一步释放了像抖音、快手等短视频平台上普通用户的生产力。

短视频已经抢占了人们余暇时间的绝大部分注意力, 使得短视频创作有更低的门槛,它会给人们带来什么样的影响?

的创建者 Habib 表示, 是为了帮助创作者跟上受众的需求。通过为创作者提供快速轻松地制作优质内容的工具,帮助创作者增加内容输出、降低创作倦怠与灵感枯竭的风险,满足粉丝「不断增长」的需求。

听上去, Habib 似乎为 找到了绝佳的使用场景,切中了短视频创作者的痛点和刚需。但 真的可以帮助创作者满足受众的需求吗?

当生成短视频的门槛降低到只输入提示词后,短视频的数量的确可以想要多少就有多少。但不得不考虑另一个问题。

过去,短视频制作的每个环节——写脚本、拍素材、剪辑甚至配音,都可以区别竞争对手玩出花样、赢得流量;现在有了 ,大家比拼的就只剩输入的提示词了。当竞争规则变成谁念的「咒语」可以更容易让机器理解时,真的可以让创作者的内容脱颖而出吗?

恐怕相反,更有可能发生的是本就拥挤的短视频平台,充斥着同质化内容和垃圾内容。

对于垃圾内容的泛滥,Habib 认为,「短视频平台的算法,而不是 ,最适合确定视频的质量,制作低质量内容的人『只会损害自己的声誉』」。声誉受损自然会抑制人们使用 创建大规模的垃圾内容。换句话说,「如果人们不想看你的视频,那么这些视频就不会在 等平台上获得分发和传播,而且,制作低质量的内容也会让人们以负面的眼光看待你的账号。」

更迫切的问题在于, 面临着所有 AIGC 应用的共同挑战。

首先是生成式 AI 应用无法根除的「有毒」内容,即虚假有害或价值观不正确的短视频。

目前,GPT-3 依旧会散布虚假信息,特别是关于新近发生的事件,因为这些事超出了其知识库的范围。而由 GPT-3 改进而来的 被证明有可能使用性别歧视和种族主义语言。尽管 有「过滤器」相关技术来阻止这些有毒内容,但效果并不理想。

依托于 GPT-3 的 当然也不可避免地会生成有毒内容。

的作者 Kyle 和朋友在 做了一次测试——输入一些攻击性的提示,看看 会产生什么。

结果显示,诸如「犹太新世界秩序」和「9/11 阴谋论」这样明显有问题的提示并没有产生有毒的脚本。但是对于「向学生灌输批判种族理论」, 制作了一段视频,暗示批判种族理论可以用来给小学生洗脑。

这令人担忧,特别是对于那些使用 制作资讯视频的人来说。

对此,Habib 表示, 依靠 的过滤器来完成大部分的审核工作,并声称用户有义务手动审查 创建的每个视频,以确保「一切都在法律范围内」。

但这似乎站不住脚,如果真的如 Habib 所言,抖音快手这样的短视频平台早就可以省去繁重、昂贵的人工审核工作。而现实是,永远有下一个有毒视频在路上,靠所有人的自觉性并不可能。