马斯克又来“硬刚”了!xAI视频大模型免费开玩,Sora 2要“绷不住”了吗?

温故智新AIGC实验室

TL;DR:

马斯克家的xAI又“搞事情”了,最新视频模型Imagine v0.9号称免费开玩,直接对标OpenAI的Sora 2!速度是亮点,但“翻车现场”也挺多,还有前英伟达大佬何宜晖加盟,这波AI视频大战,吃瓜群众表示很上头!

硅谷这俩“死对头”又杠上了!1 一边是OpenAI的Sora 2风头正劲,另一边,马斯克家的AI独角兽xAI也不甘示弱,凌晨直接甩出了王炸——最新视频生成模型Imagine v0.9,还宣布免费向所有用户开放!这波操作,简直是把“卷”字写在脸上了。

一周前,Sora 2才刚刚炫技,各种炸裂的生成视频刷爆朋友圈。这不,马斯克就带着他的“新欢”Imagine v0.9前来“踢馆”了。虽然xAI这次没放完整技术博客,但放出的几个视频案例和马斯克在X上的一顿“吆喝”,已经足够点燃AI圈的吃瓜热情了。

速度与“自由”:Imagine v0.9的“杀手锏”?

Imagine v0.9这次的亮点,咱们来捋一捋:

  • 速度“超神”:生成视频不到20秒!这简直是给Sora 2一个下马威啊,毕竟Sora 2生成个视频可能得等一两分钟。快,就是王道,尤其是在这个“注意力稀缺”的时代。
  • 免费狂欢:Sora 2还在搞邀请制,只对部分用户开放,而Imagine v0.9直接**“敞开大门”让大家白嫖**。这波操作,简直是“羊毛党狂喜”,也看得出马斯克想快速普及的野心。
  • 语音优先:用户直接动动嘴,就能创建视频、图像和文本,**“懒人福音”**模式开启,门槛直接拉到最低。

这还不算完,Imagine v0.9还集成到了Grok中,可以先文字生成图片再变视频,或者直接把你的照片“盘活”成视频。而且,这次还突破了原生音频+视频生成的界限,号称能**“秒生电影大片效果”,还能添加自然对话、丝滑的运动控制,甚至智能焦点转移**。听起来是不是很“炸裂”?

“翻车现场”与“深伪”隐忧:理想很丰满,现实有点骨感?

然而,理想很丰满,现实却有点骨感。智东西的小伙伴们亲自上手“盘”了一波,结果发现Imagine v0.9的**“翻车现场”**还真不少。1

比如,用Sora 2演示时的提示词“两名山地探险者在雪地里轮流大喊”,Imagine v0.9生成的视频中,人物确实张嘴了,但喊叫的音频却“离家出走”了,画面和声音**“各玩各的”**,这尴尬癌都要犯了。

“说好的‘喊叫’呢?嘴巴是张了,但感觉像是被‘静音’了,这波操作有点‘迷惑行为大赏’。” ——某不愿透露姓名的AI吃瓜群众

更离谱的是,当提示词是“一个男人后空翻”时,Imagine v0.9生成的主角,竟然能**“无视重力”在空中360度旋转**,这哪里是后空翻,简直是**“太空漫步”**啊!

而且,在语音自定义功能上,虽然能上传马斯克照片让他“开口说话”,但生成的声音和马斯克本人还是**“有点距离”。更让人细思极恐的是,Imagine v0.9在生成时并没有提示深度伪造(Deepfake)风险**。这功能要是被不法分子利用,后果不堪设想啊!

还有个小槽点,这玩意儿目前还不支持中文。让马斯克说“我和萨姆·阿尔特曼是好朋友”,结果只有“是好朋友”勉强听清。看来,想让AI说中文,还得再等等。

前英伟达大佬加盟:这波“挖人”值不值?

这次Imagine v0.9的背后,还有一个“彩蛋”值得关注:前英伟达高级算法工程师**何宜晖(Ethan He)**的参与。1 这也是马斯克今年7月把人家从英伟达“挖”过来后,何宜晖在xAI参与的第一个项目。

这位大佬可不是等闲之辈:

  • 2018年西交大计算机本科毕业
  • 2019年卡内基梅隆大学计算机视觉硕士
  • 曾是英伟达高级深度学习算法工程师,参与过英伟达世界基础模型Cosmos的研发!

从履历来看,绝对是技术大牛。马斯克这一波“挖角”,显然是为了给xAI的AI视频生成项目注入**“最强大脑”。不过,从目前Imagine v0.9的表现来看,虽然有亮点,但距离Sora 2的“封神”效果,似乎还有一段路要走。这或许也说明了AI视频生成这条赛道,真的不是人多就管用,还得看“内功”**。

AI视频生成竞赛升级:未来是“深度”还是“深渊”?

不到一周,OpenAI和xAI这对“欢喜冤家”就接连亮出了AI视频生成模型的“肌肉”。Sora 2在真实性、可控性、音效方面不断提升,甚至推出了Sora社交App,而xAI则通过免费开放来“吸粉”。这波神仙打架,让整个AI视频生成领域都变得火药味十足

尤其是Imagine v0.9的自定义语音功能,虽然“玩法”很多,但深度伪造的风险也随之浮出水面。未来,如何平衡技术进步与风险防范,将是所有AI视频模型提供商都必须面对的“终极拷问”。毕竟,技术是把双刃剑,用好了是**“造福人类”,用不好可能就是“制造混乱”**。

所以,是时候给这些AI巨头们敲响警钟了:在追求技术**“炸裂”的同时,也别忘了给用户筑起一道“安全墙”**啊!

引用