机器之心原创
作者:泽南
最近一段时间,AI 作画的水平正在突飞猛进。在 Midjourney、Adobe Firefly 不断布局、落地图片生成技术的同时,有创业公司已经把眼光放到了视频生成上。
本周,推特上出现了不少新 AI 工具生成的短视频,引发了人们关注。这其中既有 AI 生成的「赛博朋克电影预告片」。
也有自然风格的动植物景象:
即使是拿手机去拍摄素材,估计都需要花费不少功夫,然而使用一个叫 Morph Studio 的 AI 来生成,从文字转换成视频只需要几分钟。在社交网络上,试过它的人纷纷点赞,有人还表示或许过不了多久,小成本的独立电影就要用上 AI 技术了。
对于使用者来说,这一轮 AI 生成视频的工具和此前「要革命绘画圈」的 AI 画图类似 —— 都是只需要几个提示词或是一段形容的语句,就可以生成出符合要求的内容,你不需要有多少摄影或绘画基础。简而言之就是毫无创作门槛。
目前,这款工具正在开放免费测试:https://discord.com/invite/2ffQj2UmSP
在 Morph 的官方 Discord 上,我们看到不少人正在尝试生成各种各样的内容:
其中虽然仍然存在一些 AI 风格的魔性图像,但高质量视频的内容已有不少,看起来很接近 AI 画图的水平。
AI 视频生成的赛道上,现在有不少创业公司正跃跃欲试。上个月 Runway 的第二代模型因为可以「从零开始生成视频」火了一把,而在学界,最近 AI 顶会上也不断有使用原图、提示词、草图甚至笔划指令的视频生成方法出现。看起来这一领域距离大规模实用化已经不远了。
前几天有人对几家公司视频生成的生成效果进行了对比,这几个工具使用的都是接近自然语言的提示词。
「独立电影风格、忧郁的眼神」:
「中世纪的骑士,穿着盔甲沐浴在阳光下」:
「海边行驶的跑车,落日在发动机盖上反射出光芒」:
看起来,用同样的 prompt 生成视频,Morph Studio 的效果相对而言是最好的。不论是描绘人物、动物、机械,真实、做旧还是二次元风格,Morph Studio 都能更忠实地反映人们给出的指令,生成更有逻辑且具有一致性的画面,视频内容动作的幅度也相比其他产品更加明显。
有业内人士评价,其产品输出内容的准确率(成功率)一直是领先于 runway 等产品的。此外,Morph的工程师还透露,在最近的一次更新之中,他们会大幅提升模型的单次生成时长,以获得更好的生成效果。
引发人们关注的 Morph Studio,目前还处于创业的早期阶段。这家公司成立于今年 4 月,在 5 月刚刚完成了价值数百万美元的种子轮融资。
Morph Studio 应用的方法是纯文本到图像,不借助任何文字以外的信息对视频进行生成,Morph团队的视频生成模型是基于扩散模型训练的。该模型能很好的保证画面的一致性和文字生成的视频的准确性。
从 AI 画图到 AI 生成视频,生成模型产出的内容增加了一整个维度。现在,我们可以通过 AI 演绎出一些简单的情节片段,在最火短视频应用中搞一些创作。这种技术在内容创作、应用场景、甚至商业模式上也可以有很多想象。
而对于 Morph Studio 来说,他们瞄准的是短视频这个应用方向。工程师们表示,目前该公司的目标是做一款面向消费级的社区产品,会先从discord进行技术与需求的验证。
此外,Morph 也计划通过网络社区寻找用户喜欢的主题和社区文化,针对不同主题和内容进行深挖,最终打造 Morph 自己的视频社区。