智谱GLM-4.7:代码强到Claude“流汗”,还要抢下大模型上市“全球首杀”?

温故智新AIGC实验室

TL;DR:

智谱AI不仅要当“全球大模型第一股”,还连夜更新了GLM-4.7。这波更新主打“能干活”,编程和Agent能力直接刷新SOTA,甚至在审美上也从“钢铁直男”进化成了“设计大拿”。这就是典型的比你估值高,还比你更新勤。

如果大模型界有“卷王”评选,智谱AI绝对是年年拿小红花的那位。就在大家还在纠结大模型到底是会“答题”重要,还是会“聊天”重要的时候,智谱已经带着新一代GLM-4.7,直接把赛道拉到了“能干活”的新高度。1

更劲爆的是,智谱现在不只是在GitHub上刷榜,它还要去港交所敲钟了。就在12月19日,港交所披露智谱已通过聆讯。这意味着,大家期待已久的“全球大模型第一股”,可能真的要诞生了。23

编程界的“扫地僧”:代码修复刷新SOTA

现在的AI圈,光靠PPT吹牛已经混不下去了,大家看重的是实战。GLM-4.7这次主打的就是编程与代理式任务(Coding + Agentic tasks)。1

在17项基准测试的“大混战”中,GLM-4.7的表现简直像是开了挂。它在AIME 2025高级数学推理中的正确率达到了惊人的95.7%,在BrowseComp-ZH(中文浏览器操作)中也拿下了66.6的高分。1

最让同行压力山大的是,它在SWE-bench-Verified(真实代码修复)测试中得分为73.8%,在LiveCodeBench V6中得分84.9%,这两个成绩直接超过了传闻中的Claude 4.5/Sonnet水平,刷新了开源界的新纪录。14 以前开发者们遇到解决不了的Bug总想去问问Claude,现在看来,国产开源大模型也要让大家直呼“真香”了。

审美升级:从“凑合能看”到“直接拿走”

很多大模型写出的代码虽然能跑,但生成的UI界面往往透着一股浓浓的“程序员审美”。但GLM-4.7显然是去进修了艺术课。

根据官方展示的Case,GLM-4.7生成的HTML网页布局更清晰,配色也不再打架。1

  • 交互网页:比起前代,4.7生成的UI具有明显的3D交互感和动态效果,质感拉满。
  • 3D空间感:在生成复杂的3D花园场景时,它能处理清楚透视关系和景深,不再是扁平的一团。15
  • 职场救星:PPT的16:9适配率从52%直接飙升到91%。1 以前AI生成的PPT还得手动调半天格式,现在基本能做到“一键出片,直接汇报”。

深度解析:三层思考模式到底是什么“黑科技”?

智谱这次能实现技术飞跃,核心在于对模型思维流程的重构。他们搞出了一套“思考组合拳”:1

  1. 交织式思考(Interleaved Thinking):简单说,就是在行动之前先“过脑子”。每一次调用工具前,模型都会进行内部推理,防止它“想一出是一出”。
  2. 保留式思考(Preserved Thinking):针对长链路任务。它能记住之前是怎么想的,重用推理过程,而不是像个金鱼一样每轮对话都从头推导。
  3. 轮级思考(Turn-level Thinking):这属于“按需思考”。简单的请求(比如问天气)就关掉推理省算力,复杂的决策再开启“全力模式”。14

这种灵活的推理机制,让GLM-4.7在执行长周期任务时表现得像个情绪稳定的老员工,而不是动不动就罢工的实习生。

商业版图:亏损背后是22亿的“暴力”研发

财报数据往往比模型参数更真实。招股书显示,智谱的收入确实在狂飙,2025年上半年收入1.9亿元,同比增幅超300%。1 但另一面,亏损也在扩张。

“挣得虽然多,但花得更狠。”

2024年和2025年上半年,智谱的研发费用飙升到了22亿元,其中算力支出占了大头(超过70%)。1 这种“暴力投入”虽然让账面看起来有点红,但也正是这些真金白银堆出了GLM系列每3-6个月就迭代一次的惊人速度。2

目前,智谱已经服务了超过1.2万家机构客户,API付费用户超过270万。23 这一波带着GLM-4.7冲击上市,显然是想趁着技术红利期,完成从“技术独角兽”到“资本巨头”的华丽转身。

引用


  1. “大模型第一股”打响上市前哨战!智谱刷新开源编程SOTA,在修复代码、终端操作表现超Claude 4.5 · InfoQ · (2024/12/19) · 检索日期2025/12/23 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 智谱递表,“全球大模型第一股”来了! · 中国经济网 · (2025/12/20) · 检索日期2025/12/23 ↩︎ ↩︎ ↩︎

  3. “大模型第一股”要来? · 证券时报 · 王军 (2025/12/18) · 检索日期2025/12/23 ↩︎ ↩︎

  4. 新品发布 - 智谱AI开放文档 · 智谱AI · (2025/12/20) · 检索日期2025/12/23 ↩︎ ↩︎

  5. 智谱的GLM-4.7:更强的代码,更强的美学 · 网易 · (2025/12/20) · 检索日期2025/12/23 ↩︎