神秘爆款模型被小米“认领”!雷军:160亿已到位,Grok你颤抖了吗?

温故智新AIGC实验室

TL;DR:

那个在OpenRouter霸榜多日的匿名大佬“Hunter Alpha”身份揭晓,居然是小米的MiMo-V2-Pro!雷军豪掷160亿,罗福莉深夜放话:这波“安静的突袭”直接把AI圈卷麻了,压力现在来到了DeepSeek这一边。

神秘“猎人”脱马甲,小米这波玩得有点野

前阵子,全球开发者都在满世界找一个叫“Hunter Alpha”的神秘模型。它在API聚合平台OpenRouter上一上线就开启了“收割模式”,连续多天霸占调用量日榜第一,累计调用的token数直接突破了1T1。大家都在猜,这到底是哪家大厂又在偷偷藏大招?是硅谷新贵,还是那个总是能搞出惊喜的“深海鱼”?

谜底终于在今天揭晓了。雷军带着小米MiMo-V2家族模型正式亮相,顺便一脸淡定地“认领”了这两件马甲:此前的Hunter Alpha正是MiMo-V2-Pro的早期内测版,而另一个Healer Alpha则是MiMo-V2-Omni1

这种“先在野外打成满级,再回来办满月酒”的行为,被小米技术大拿罗福莉形容为一场“安静的突袭”2。更狠的是,雷总直接在发布会上放话:MiMo-V2-Pro的榜单表现已经超过了马斯克的xAI Grok。今年小米要在AI研发上砸下超过160亿软妹币,主打一个“不差钱”且“进展比大家想得快”34

1T参数配上“混合注意力”:除了能干活,它还没套路

这次发布的MiMo-V2-Pro,定位非常清晰:为Agent(智能体)而生的旗舰模型

别看现在大模型满街走,但能真正搞定复杂长链路任务的其实没几个。MiMo-V2-Pro总参数量超过1T(万亿级),激活参数42B。它采用了一种叫**Hybrid Attention(混合注意力)**的架构1。简单理解,这就像是给AI的大脑装了一套“自适应变速箱”,在处理1M超长上下文时,既能保持敏锐的洞察力,又不会让推理效率崩盘。

罗福莉在推特(X)上透露了一个细节:为了让团队真正理解什么是Agent范式,她直接下了死命令——“谁到明天为止还没完成100次对话,谁就可以走人”1。这种硬核的“人肉测试”效果显著,MiMo-V2-Pro在长文能力和Agent场景稳定性上获得了史诗级强化。

在实际体感上,它在OpenClaw、Claude Code等智能体框架中表现出的“执行力”,已经逼近甚至在部分场景超越了Claude 4.6系列,但API定价却只有后者的1/51。小米这次不仅想当“隐形冠军”,还想把前沿智能的门槛直接踹飞。

“全能战士”Omni与“戏精”TTS,小米的底牌全翻了

除了Pro版,另外两位家族成员也各有千秋:

  • MiMo-V2-Omni(原名Healer Alpha): 这是一个原生全模态基座。它不只是能“看图说话”,而是通过统一架构把感知和行动深度绑定1。说白了,它能听懂环境音、分清谁在说话、看懂复杂的音视频,还能顺手帮你把GUI(图形界面)操作了。官方实测其音频理解力甚至超过了Google的Gemini 3 Pro1
  • MiMo-V2-TTS: 这是一个专门负责“声音表现力”的模型。小米用了上亿小时的语音数据进行预训练,让它不再是那种冷冰冰的播音腔。它不仅能克隆音色,还能精准控制情绪的起伏,简直是AI界的“实力派演员”1

结语:压力给到了DeepSeek?

小米这次的突然发力,让原本就热闹的国产模型赛道变得更加诡谲。在此之前,很多人猜测那个神秘的匿名模型是DeepSeek的V4版本,结果谜底揭晓,小米成了那个“截胡”的黑马1

目前,MiMo-V2-Pro已经正式开放API,并联合OpenClaw等五大框架提供限时免费支持。而隔壁的DeepSeek-V4据传也将在4月上线,主打长期记忆(LTM)的突破1

当小米开始用“万亿参数”和“160亿投资”说话,当“雷式效率”撞上AI Agent范式,今年的大模型混战,恐怕才刚刚进入最高潮。

引用