杨植麟与月之暗面:在技术理想主义的潮汐中,铸造Kimi的灯塔

温故智新AIGC实验室

TL;DR:

杨植麟,这位清华和卡内基梅隆的学术精英,以其对AGI的偏执和独特的技术理想主义,带领月之暗面在商业化波折后,通过Kimi-K2系列模型重回大模型舞台中央,挑战传统“烧钱”模式,并以其“i人”团队文化和对技术纯粹的追求,铸造着AGI时代的灯塔。

2025年盛夏,当Kimi-K2模型如同一道闪电划破沉寂,人们终于再次见识到杨植麟——这位在喧嚣与质疑中蛰伏半年的技术理想主义者——所坚守的底牌。在此之前,“月之暗面”这家年轻的大模型公司,一度因激进的市场投流策略与投资人朱啸虎的官司,被推到风口浪尖。用户活跃度下滑,质疑声四起,仿佛一艘驶向未知水域的船,迷失在商业的潮汐中1

然而,杨植麟并非不识人间烟火的“书呆子”。他深知市场竞争的残酷,也曾尝试通过巨额投放迅速占领用户心智。但在遭遇渠道欺诈的巨额损失1、以及DeepSeek-R1模型的意外“截胡”之后,这位骨子里流淌着纯粹技术血液的创始人做出了一个标志性决策:急流勇退,亲自叫停了“几乎70%的投流”,将所有目光重新聚焦于基础算法和模型能力的升级与突破1。这一刻,仿佛预示着一场“绝地反攻”的序幕正式拉开。

技术底牌:从低谷到SOTA的逆袭之路

杨植麟的“偏执”最终体现在Kimi-K2系列模型的横空出世。这个“超大架构”模型参数高达1T,在全球范围内,能达到万亿参数的大模型公司屈指可数,除了海外的OpenAI、谷歌,国内仅有阿里的Qwen3-Max、蚂蚁集团的百灵大模型Ling-1T能与之匹敌1。但K2的突破远不止于参数量。

在2025年9月至11月间,月之暗面连续发布了Agent模式“OK Computer”、混合线性注意力架构Kimi Linear,以及首个推理模型K2 Thinking。这些产品以其独特的技术原创性,赢得了业内外的一致好评。硅谷投资人查马斯甚至公开表示,已将大量工作从Grok迁移到Kimi K2;《自然》杂志则用“又一个DeepSeek时刻”来形容K2的表现1

特别值得一提的是Kimi Linear和K2 Thinking背后的技术巧思。Kimi Linear依靠混合线性注意力上的突破,通过Kimi Delta Attention(KDA)的设计,大幅降低了算力成本,同时在各类场景中超越了同梯队的全注意力机制模型1。而在K2 Thinking上,杨植麟和团队更是实现了“原生INT4量化”的重大创新。这意味着模型在训练阶段就适应低精度环境,不仅大幅提升了推理速度,还对英伟达低端GPU和国产加速计算芯片更加友好,让用户“花小钱,办大事”12

关于K2 Thinking的训练成本,外界曾盛传仅为460万美元,远低于动辄上亿美元的巨头投入。尽管杨植麟和联合创始人们澄清“训练成本很难量化,其中很大一部分用于研究和实验”34,但INT4带来的成本优化是显而易见的。这无疑是对“砸钱堆料”模式的一次有力挑战,正如Google搜索结果所说,它让硅谷陷入一阵反思:“当免费或极低成本的开源模型能提供同等甚至更优的性能时,闭源巨头的高估值,还合理吗?”32

月之暗面在技术路径选择上的独立思考,也可见一斑。在Reddit的AMA活动上,联合创始人吴育昕曾对DeepSeek采用的OCR路线研究不以为然,认为其“有点太刻意了”,更倾向于在特征空间中寻找更通用、与具体模态无关的方法1。这种对技术纯粹性的追求,正是杨植麟技术理想主义的缩影。

独特的人才磁场与文化底色

月之暗面的“绝地反攻”并非偶然,其核心在于独特的人才策略和组织文化。在大模型这个高精尖领域,“堆人是没有用的。没有一个天才带队,来多少高级人才都没用”1。杨植麟,这位清华大学计算机系毕业生、卡内基梅隆大学计算机博士,师从苹果AI负责人Ruslan Salakhutdinov,无疑是那个能吸引天才的“带头人”。

他在清华求学期间便是一位学术风云人物,“拿遍了国内外各类奖项”,后来在清华任职讲师的《自然语言处理(NLP)》课程也“在学生中很有名”1。这种深厚的学术背景和对AGI的坚定追求,成为月之暗面最强大的“人才磁场”。前员工宋凯透露,杨植麟“非常有号召力”,甚至会把“清华某个实验室‘连锅端’到月暗”1

天才的聚集,也塑造了月之暗面“和谐的暴躁”文化。这里沟通直率,充满压力,员工们“坦白、激烈、高效”,会当面批评,甚至会冒出“你这个傻X”的直言,但十几分钟后又一切如常1。这种极致的效率和纯粹的技术导向,让月之暗面保持着精简的组织架构,人效比极高,“大厂里三五十人团队干的事,在Kimi可能就两个人做”1

更令人印象深刻的是,月之暗面对于技术“大神”有着相当的容忍度。例如,提出RoPE(旋转位置编码)的“苏神”苏剑林,因其核心贡献,是公司里唯一可以居家办公的员工1。这种对顶尖人才的尊重,体现了公司以技术为本的核心价值观。

月之暗面也自称是“i人公司、i人模型”,这与杨植麟本人的趣味不无关系。他并非传统意义上的“书呆子”,在清华时就和联合创始人周昕宇组过摇滚乐队,如今公司的会议室也以知名乐队命名1。这种极客与文艺的融合,投射到产品中,让Kimi多了一份独特的“风味”。K2的产品页面设计极简,拒绝了市场普遍的“添加推荐产品”做法1。K2在输出答案时“绝不谄媚”的特点也让用户觉得有趣,“问K2 Thinking我帅还是吴彦祖帅?”,它会条理清晰地展示“为何吴彦祖帅”的推理过程1。这种“人格”是团队刻意设计的,在预训练阶段编码了先验知识,又在后训练阶段增添了独特的“风味”3。为了确保智能“上限”,K2 Thinking甚至“故意保留了更长的思考路径,牺牲了些速度”,这种为了性能而牺牲效率的决断,再次印证了月之暗面对技术极致的追求1

商业化迷雾:理想主义者的现实考量

攀登技术高峰的路上,商业化始终是摆在所有大模型公司面前的残酷命题。杨植麟并非不懂商业,2024年那场浩大的投流风波便是明证1。那时的月之暗面试图通过巨量投入,快速占领市场。然而,经验不足和行业乱象,让其付出了惨痛的代价。

DeepSeek-R1的崛起,更让杨植麟警醒:纯粹的技术突破也能带来用户青睐,无需过度依赖营销。他果断叫停了大规模投流,转而聚焦在极客群体中的影响力,让技术研发团队在即刻、知乎、小红书等社区分享观点1。他甚至从腾讯挖来了付强任技术副总裁,负责增长开发,试图用“系统、体系化方法做增长”1

然而,商业化难题并未完全破解。Kimi模型庞大,即便架构创新降低了部署成本,客户的存储、传输成本依然不低。放弃投流后,Kimi的C端月活与大厂的差距仍在拉大1。2025年9月,Kimi推出的会员付费订阅服务(49元/月、99元/月、199元/月),按照请求次数计费的方式,被外界认为“性价比不高”,尽管月之暗面解释这符合后端成本结构,并表示会考虑改进1

与大厂的缠斗,对于创业公司而言,注定是一场非对称战争。智谱AI估值高达400亿元,MiniMax也完成3亿美元融资,估值300亿元1。月之暗面在新一轮融资后,是否会发起IPO计划,杨植麟还有时间思考。

当下,杨植麟的策略是,先用技术突破获得资本市场认可,同时继续向AGI行进。公司已在思考用“模型训模型”的可行性,并已在研究K2的VL(视觉-语言)版本,预示着K3或将突破语言大模型进入多模态领域1

杨植麟,这位在技术理想主义的潮汐中砥砺前行的创始人,他的故事远未结束。他既是那个敢于在技术孤岛上偏执探索的先锋,也是那个在商业现实中寻求出路的领导者。月之暗面和Kimi,正成为他理念的具象化,在人工智能的宏大叙事中,成为指引未来方向的一座独特灯塔。

引用