人跑光了产品却炸了?马斯克喜提AI视频“三金王”,Grok Imagine要把Sora卷哭了

温故智新AIGC实验室

TL;DR:

马斯克的xAI上演了一出“人去楼空,神作降临”的逆袭戏码。Grok Imagine在DesignArena盲测中狂揽三项冠军,不仅性能吊打谷歌Veo 3.1和OpenAI的Sora,价格还只要对手的几分之一。

虽然xAI的华人联创们近期传出“跑路”消息,但老马(埃隆·马斯克)的推特(现X)依旧处于狂欢状态。原因无他:xAI旗下的视频生成模型Grok Imagine刚刚在AI界的“奥运会”上完成了史诗级的“三金加冕”。

在DesignArena的视频排行榜上,Grok Imagine一举拿下了视频生成、图像转视频、视频编辑三个类别的冠军。这种“出道即巅峰”的表现,让不少等着看马斯克笑话的人直呼“真香”。

擂台实战:不靠噱头靠“盲测”

以前咱们看AI视频,总觉得那是厂商精心挑选的“买家秀”。但这次Grok Imagine登顶的DesignArena,玩的是硬核的Elo评分系统。简单说,这就是把两个AI生成的视频放在真人用户面前:不告诉你是谁做的,你觉得哪个好就投谁。

在经过超过46万次的“残酷”盲测后,Grok Imagine 1.0以1337分的Elo分数,直接把第二名甩开了33分。1 2

  • 文生视频: 你输入“一只猫在月球跳迪斯科”,它生成的视频不仅画面流畅,连背景音效都给你配齐了。
  • 图生视频: 给它一张静态梗图,它能精准理解逻辑,让画面“活”得毫不违和。
  • 视频编辑: 这才是真正的“降维打击”。想把视频里的汽车换成飞船?改个风格?加点特效?它平均只需1分5秒就能交卷,比某些还在“转圈圈”的竞品快了不止一个身位。1

“Sora是艺术大师,Veo是音频专家,而Grok Imagine更像是一个懂用户、活儿好还便宜的‘六边形战士’。”

技术大揭秘:为什么它能“又快又好”?

在AI视频领域,以前大家都信奉“大力出奇迹”,靠堆显卡、烧海量数据来硬砸。但xAI走了一条更聪明的路——构建Pareto前沿

通俗点说,这就是在质量、速度和成本之间找那个“黄金平衡点”。1

看看这组扎心的数据:生成一分钟带音频的视频,谷歌Veo要12美元,Sora可能要30美元,而Grok Imagine只要4.20美元2 3 这就好比大家都在赛车,别人开的是百公里耗油50升的油老虎,马斯克直接把一台高性能电动车开上了赛道,速度更快,电费还更便宜。

更难得的是,Grok Imagine在**指令遵循(Instruction Following)**上表现极佳。1 很多模型在处理复杂指令时容易“已读乱回”,但Grok能精准捕捉平移、变焦等电影级镜头语言,甚至在口型同步(Lip-sync)上也做到了业界领先。

行业“地震”:视频创作的“发短信时代”来了?

马斯克的野心从来不只是做一个好玩的工具。Grok Imagine的崛起,实际上预示着AI视频正从“贵族游戏”走向“平民工具”。

想象一下,你是一个只有几个粉丝的Vlogger,以前剪辑一段产品演示可能要熬几个通宵,现在只需输入几行文字,几分钟内,一段带专业运镜和音效的大片就诞生了。对于企业来说,营销视频、培训动画的成本将直接降到地板上。

甚至在马斯克的“全家桶”生态里,这款模型也有着恐怖的潜力:它能为特斯拉的FSD(全自动驾驶)提供模拟训练场景,也能让Optimus机器人通过视频更好地理解人类世界的物理逻辑。2

虽然目前Grok Imagine生成的片段大多在10-15秒左右,长视频的一致性仍有待优化,但这种“火箭发射式”的迭代速度已经让友商们感受到了阵阵寒意。4

下一个黑马,或许就在你敲下回车键的那一刻诞生。所以,你准备好当自己的“赛博导演”了吗?

引用


  1. 46.5万次盲测封王!Grok视频模型屠榜Arena,谷歌最强对手来了 · 新智元 · 2026/2/25 · 检索日期2026/3/19 ↩︎ ↩︎ ↩︎ ↩︎

  2. 人跑光了,AI视频炸了!马斯克狂发推:Grok Imagine三金封神 · 新浪财经 · 2026/3/19 · 检索日期2026/3/19 ↩︎ ↩︎ ↩︎

  3. Artificial Analysis Image to Video Leaderboard · Artificial Analysis · 2026/3/19 · 检索日期2026/3/19 ↩︎

  4. 马斯克视频生成模型首次交卷!电影级运镜+音效,免费可玩 · 凤凰网 · 2026/3/19 · 检索日期2026/3/19 ↩︎