阶跃星辰“杀疯了”：连训练框架都全掏出来，这波开源诚意直接拉满

TL;DR：

阶跃星辰这次是真没把大家当外人，Step 3.5 Flash 不仅模型开源，连“祖传”的训练框架和中间权重都全盘托出。这个专为 Agent 打造的“穿衣显瘦，脱肉有活”的 MoE 模型，正以 350 tok/s 的鬼畜速度，在“小龙虾”等开发者社区疯狂屠榜。

在大模型开源圈，有一种开源叫“开个门缝”，而阶跃星辰这次显然是直接把大门给卸了。

3 月 4 日，阶跃星辰甩出了一套重磅组合拳：正式开源 Step 3.5 Flash 模型及其预训练（Base）、中训练（Midtrain）权重，甚至连配套的 Steptron 训练框架也一并开源。¹² 这种“底裤级”的开源深度，在如今这个开源趋于保守、大家纷纷搞“黑盒”的环境下，确实显得有点不讲武德。

技术大揭秘：196B 的身板，11B 的油耗

如果你以为这只是又一个普通的开源模型，那可能小看了它的“智能密度”。Step 3.5 Flash 采用了目前大模型界最火的稀疏混合专家（MoE）架构。³

简单来说，它的总参数量高达 1960 亿，是一个妥妥的巨无霸。但神奇之处在于，它在处理任务时并不会全员出动，而是根据任务属性动态激活其中的 110 亿参数。⁴ 这就像一个拥有 200 个顶尖专家的超级顾问团，每次只需派出最懂行的 10 个人就能搞定问题。

这种“极致压榨”带来的结果就是：它既拥有抗衡 GPT-4.5 等顶级闭源模型的推理深度，又保持了毫秒级交互的轻盈感。在单流编程任务中，它的峰值吞吐量能达到 350 tok/s。⁵ 这是一个什么概念？你还没看完上一行，它已经帮你把代码写到下一屏了。

行业“地震”：Agent 的“大脑”终于不再卡顿

比起单纯的聊天机器人，Step 3.5 Flash 的野心更大——它是专门为 智能体（Agent） 而生的。

以往的 Agent 往往卡在“思考太慢”或者“上下文太短”上。为了解决这些痛点，阶跃星辰祭出了两大法宝：

MTP-3（三路多标语预测）：传统模型是“走一步看一步”，而它在生成当前词的时候，已经把后面几步都预演好了，专门治愈 Agent 的“推理拖延症”。³
3:1 混合注意力机制：针对长代码和海量文档，它采用了滑动窗口注意力（SWA）配比，最高支持 256K 超长上下文。¹ 实测在 SWE-bench Verified（软件工程基准测试）中拿到了 74.4% 的高分。

“过去开源模型只给结果，不给过程。这次连训练框架都给了，意味着企业可以用自己的私有数据，按照阶跃星辰的‘标准路径’复刻一个垂直领域的专家。” 某资深开发者如是评价。

未来预测：本地部署与“小龙虾”的热潮

现在的模型如果不谈本地化，总感觉少了点诚意。Step 3.5 Flash 对高端消费级硬件（如 Mac Studio M4 Max）进行了深度优化。³ 这意味着，你不需要购买昂贵的企业级服务器，在自己的工作室里就能安全、私密地运行一个顶尖的 AI 大脑。

市场给出的反馈也非常真实。目前该模型在 Hugging Face 上的下载量已突破 30 万次，并迅速登顶 OpenRouter Trending 第一名。¹ 尤其是在国内知名的开源项目 OpenClaw（被网友亲切称为“小龙虾”） 上，它的调用量已经飙升至前二。²

当一个模型既快、又稳、还开源得彻底，它在开发者心中的地位自然就不言而喻了。随着阶跃星辰下一代模型 Step 4 训练的启动，这场关于“智能上限”的竞速赛，显然才刚刚进入高潮。³

引用

阶跃星辰宣布Step 3.5 Flash全链路开源，OpenClaw调用量升至前二 · 新浪科技 · (2026/3/4) · 检索日期2026/3/4 ↩︎ ↩︎ ↩︎
很彻底！预训练+训练框架全放出，这一国产模型在“小龙虾”上掀起热潮 · 搜狐 · (2026/3/4) · 检索日期2026/3/4 ↩︎ ↩︎
阶跃星辰发布并开源最新旗舰基座模型Step 3.5 Flash · 东方财富网 · (2026/3/3) · 检索日期2026/3/4 ↩︎ ↩︎ ↩︎ ↩︎
阶跃星辰全面开源Step 3.5 Flash：预训练+训练框架全放出 · 知乎专栏 · (2026/3/4) · 检索日期2026/3/4 ↩︎
阶跃星辰全面开源Step 3.5 Flash：推理速度最高可达350TPS · 凤凰网科技 · (2026/3/4) · 检索日期2026/3/4 ↩︎