神秘爆款模型被小米“认领”！雷军：160亿已到位，Grok你颤抖了吗？

TL;DR：

那个在OpenRouter霸榜多日的匿名大佬“Hunter Alpha”身份揭晓，居然是小米的MiMo-V2-Pro！雷军豪掷160亿，罗福莉深夜放话：这波“安静的突袭”直接把AI圈卷麻了，压力现在来到了DeepSeek这一边。

神秘“猎人”脱马甲，小米这波玩得有点野

前阵子，全球开发者都在满世界找一个叫“Hunter Alpha”的神秘模型。它在API聚合平台OpenRouter上一上线就开启了“收割模式”，连续多天霸占调用量日榜第一，累计调用的token数直接突破了1T¹。大家都在猜，这到底是哪家大厂又在偷偷藏大招？是硅谷新贵，还是那个总是能搞出惊喜的“深海鱼”？

谜底终于在今天揭晓了。雷军带着小米MiMo-V2家族模型正式亮相，顺便一脸淡定地“认领”了这两件马甲：此前的Hunter Alpha正是MiMo-V2-Pro的早期内测版，而另一个Healer Alpha则是MiMo-V2-Omni¹。

这种“先在野外打成满级，再回来办满月酒”的行为，被小米技术大拿罗福莉形容为一场“安静的突袭”²。更狠的是，雷总直接在发布会上放话：MiMo-V2-Pro的榜单表现已经超过了马斯克的xAI Grok。今年小米要在AI研发上砸下超过160亿软妹币，主打一个“不差钱”且“进展比大家想得快”³⁴。

1T参数配上“混合注意力”：除了能干活，它还没套路

这次发布的MiMo-V2-Pro，定位非常清晰：为Agent（智能体）而生的旗舰模型。

别看现在大模型满街走，但能真正搞定复杂长链路任务的其实没几个。MiMo-V2-Pro总参数量超过1T（万亿级），激活参数42B。它采用了一种叫**Hybrid Attention（混合注意力）**的架构¹。简单理解，这就像是给AI的大脑装了一套“自适应变速箱”，在处理1M超长上下文时，既能保持敏锐的洞察力，又不会让推理效率崩盘。

罗福莉在推特（X）上透露了一个细节：为了让团队真正理解什么是Agent范式，她直接下了死命令——“谁到明天为止还没完成100次对话，谁就可以走人”¹。这种硬核的“人肉测试”效果显著，MiMo-V2-Pro在长文能力和Agent场景稳定性上获得了史诗级强化。

在实际体感上，它在OpenClaw、Claude Code等智能体框架中表现出的“执行力”，已经逼近甚至在部分场景超越了Claude 4.6系列，但API定价却只有后者的1/5¹。小米这次不仅想当“隐形冠军”，还想把前沿智能的门槛直接踹飞。

“全能战士”Omni与“戏精”TTS，小米的底牌全翻了

除了Pro版，另外两位家族成员也各有千秋：

MiMo-V2-Omni（原名Healer Alpha）： 这是一个原生全模态基座。它不只是能“看图说话”，而是通过统一架构把感知和行动深度绑定¹。说白了，它能听懂环境音、分清谁在说话、看懂复杂的音视频，还能顺手帮你把GUI（图形界面）操作了。官方实测其音频理解力甚至超过了Google的Gemini 3 Pro¹。
MiMo-V2-TTS： 这是一个专门负责“声音表现力”的模型。小米用了上亿小时的语音数据进行预训练，让它不再是那种冷冰冰的播音腔。它不仅能克隆音色，还能精准控制情绪的起伏，简直是AI界的“实力派演员”¹。

结语：压力给到了DeepSeek？

小米这次的突然发力，让原本就热闹的国产模型赛道变得更加诡谲。在此之前，很多人猜测那个神秘的匿名模型是DeepSeek的V4版本，结果谜底揭晓，小米成了那个“截胡”的黑马¹。

目前，MiMo-V2-Pro已经正式开放API，并联合OpenClaw等五大框架提供限时免费支持。而隔壁的DeepSeek-V4据传也将在4月上线，主打长期记忆（LTM）的突破¹。

当小米开始用“万亿参数”和“160亿投资”说话，当“雷式效率”撞上AI Agent范式，今年的大模型混战，恐怕才刚刚进入最高潮。

引用

神秘爆款模型被小米认领！雷军直言超过马斯克 xAI Grok，罗福莉透露MiMo-V2-Pro将开源 · InfoQ · (2026/3/19) · 检索日期2026/3/19 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
小米凌晨模型三连发：罗福莉称为智能体时代打造 · 新浪财经 · (2026/3/19) · 检索日期2026/3/19 ↩︎
神秘霸榜模型现真身：小米MiMo-V2 Pro，国内首个万亿参数+ ... · 新浪财经 · (2026/3/19) · 检索日期2026/3/19 ↩︎
「AI龙虾」爆红：当AI开始控制你的电脑｜梁伟聪 · 星岛加拿大 · 梁伟聪 · (2026/3/11) · 检索日期2026/3/19 ↩︎