TL;DR:
阶跃星辰这次是真没把大家当外人,Step 3.5 Flash 不仅模型开源,连“祖传”的训练框架和中间权重都全盘托出。这个专为 Agent 打造的“穿衣显瘦,脱肉有活”的 MoE 模型,正以 350 tok/s 的鬼畜速度,在“小龙虾”等开发者社区疯狂屠榜。
在大模型开源圈,有一种开源叫“开个门缝”,而阶跃星辰这次显然是直接把大门给卸了。
3 月 4 日,阶跃星辰甩出了一套重磅组合拳:正式开源 Step 3.5 Flash 模型及其预训练(Base)、中训练(Midtrain)权重,甚至连配套的 Steptron 训练框架也一并开源。12 这种“底裤级”的开源深度,在如今这个开源趋于保守、大家纷纷搞“黑盒”的环境下,确实显得有点不讲武德。
技术大揭秘:196B 的身板,11B 的油耗
如果你以为这只是又一个普通的开源模型,那可能小看了它的“智能密度”。Step 3.5 Flash 采用了目前大模型界最火的稀疏混合专家(MoE)架构。3
简单来说,它的总参数量高达 1960 亿,是一个妥妥的巨无霸。但神奇之处在于,它在处理任务时并不会全员出动,而是根据任务属性动态激活其中的 110 亿参数。4 这就像一个拥有 200 个顶尖专家的超级顾问团,每次只需派出最懂行的 10 个人就能搞定问题。
这种“极致压榨”带来的结果就是:它既拥有抗衡 GPT-4.5 等顶级闭源模型的推理深度,又保持了毫秒级交互的轻盈感。在单流编程任务中,它的峰值吞吐量能达到 350 tok/s。5 这是一个什么概念?你还没看完上一行,它已经帮你把代码写到下一屏了。
行业“地震”:Agent 的“大脑”终于不再卡顿
比起单纯的聊天机器人,Step 3.5 Flash 的野心更大——它是专门为 智能体(Agent) 而生的。
以往的 Agent 往往卡在“思考太慢”或者“上下文太短”上。为了解决这些痛点,阶跃星辰祭出了两大法宝:
- MTP-3(三路多标语预测):传统模型是“走一步看一步”,而它在生成当前词的时候,已经把后面几步都预演好了,专门治愈 Agent 的“推理拖延症”。3
- 3:1 混合注意力机制:针对长代码和海量文档,它采用了滑动窗口注意力(SWA)配比,最高支持 256K 超长上下文。1 实测在 SWE-bench Verified(软件工程基准测试)中拿到了 74.4% 的高分。
“过去开源模型只给结果,不给过程。这次连训练框架都给了,意味着企业可以用自己的私有数据,按照阶跃星辰的‘标准路径’复刻一个垂直领域的专家。” 某资深开发者如是评价。
未来预测:本地部署与“小龙虾”的热潮
现在的模型如果不谈本地化,总感觉少了点诚意。Step 3.5 Flash 对高端消费级硬件(如 Mac Studio M4 Max)进行了深度优化。3 这意味着,你不需要购买昂贵的企业级服务器,在自己的工作室里就能安全、私密地运行一个顶尖的 AI 大脑。
市场给出的反馈也非常真实。目前该模型在 Hugging Face 上的下载量已突破 30 万次,并迅速登顶 OpenRouter Trending 第一名。1 尤其是在国内知名的开源项目 OpenClaw(被网友亲切称为“小龙虾”) 上,它的调用量已经飙升至前二。2
当一个模型既快、又稳、还开源得彻底,它在开发者心中的地位自然就不言而喻了。随着阶跃星辰下一代模型 Step 4 训练的启动,这场关于“智能上限”的竞速赛,显然才刚刚进入高潮。3
引用
-
阶跃星辰宣布Step 3.5 Flash全链路开源,OpenClaw调用量升至前二 · 新浪科技 · (2026/3/4) · 检索日期2026/3/4 ↩︎ ↩︎ ↩︎
-
很彻底!预训练+训练框架全放出,这一国产模型在“小龙虾”上掀起热潮 · 搜狐 · (2026/3/4) · 检索日期2026/3/4 ↩︎ ↩︎
-
阶跃星辰发布并开源最新旗舰基座模型Step 3.5 Flash · 东方财富网 · (2026/3/3) · 检索日期2026/3/4 ↩︎ ↩︎ ↩︎ ↩︎
-
阶跃星辰全面开源Step 3.5 Flash:预训练+训练框架全放出 · 知乎专栏 · (2026/3/4) · 检索日期2026/3/4 ↩︎
-
阶跃星辰全面开源Step 3.5 Flash:推理速度最高可达350TPS · 凤凰网科技 · (2026/3/4) · 检索日期2026/3/4 ↩︎