加勒比海盗漫画 GLM-5.2初体验来了：像Claude，但还没那么听话

发布日期：2026-06-17 13:56 点击次数：165

出品 | 网易智能加勒比海盗漫画

作家 | 小爪

裁剪 | 王凤枝

GLM-5.2发布后，外网缔造者的第一响应不是问价钱。

低廉、能用、省钱，这些词贴在许多国产模子身上太深远。但此次征询的口吻变了极少点：它约略的确颖悟活了。

有东谈主拿它和GLM-5.1作念并吞份1700行Python代码审查，后果不是准确率碾压，是同等准确率下，时间从124.8秒降到47.7秒，输出从3436个token收窄到1415个。也有东谈主把它和Kimi K2.7放在并吞个教导词下写Minecraft游戏页面，GLM-5.2慢了几分钟，却少了一轮修问题的教导。

外网用户不是在夸它写得更多。他们在说，它少妄言、少返工，能把事情往前推。

也难怪Claude这个名字一直在征询里反复出现。缔造者太熟识Claude那种嗅觉了：不笃定时会问，看到风险会提醒，代码审查时能收拢问题。GLM-5.2让一部分用户第一次在国产模子上看到相同的影子。

但另一些用户随即踩到了反面：慢、拥挤、额度耗尽快，以致会用我方的默许设定散失用户指示。

它运转像Claude，也随机候像一个不太听话的版块。

先看此次发布了什么

6月13日，智谱把GLM-5.2先放进了GLM Coding Plan，莫得先开API，也莫得先放权重。

这个章程自己等于信号。它默许缔造者会先在编码器具里用，而不是先在聊天框里试。

几个细节能看出智谱的定位。Claude Code的设置示例里，glm-5.2被平直放进了Sonnet和Opus的位置；套餐里它被列为高阶档，对标Opus，额度也按这个档算。换句话说，智谱没把它当\"低廉替代\"，而是当Claude的同位竞品在卖。

参数里最显眼的是100万高下文。在代码任务里，它对应的其实是一件具体的事：模子能不行吃下一个稍大的景色，能不行跟住一条长的修改链，能不行在第二十轮对话里还铭记第三轮定下的敛迹。

加上订阅、编码器具接入、开源时间表一次给王人，此次发布不像在发一个模子，更像在发一个产物。

缔造者拿它作念了什么

此次反馈里，跑分不伏击。要看的是缔造者拿它作念了什么。

有东谈主测严格JSON输出、编程、推理、长高下文检索，也有东谈主把它放进OpenCode和Coding Plan里跑最高级。前边那组Python代码审查数据仅仅单个缔造者样本，不是矜重基准测试，但主义很清楚：代码审查不需要模子把每件事阐发得很满，更需要它短、快、持要点。

另一个被反复提到的细节，是模子在职务不清楚时会先反问，而不是平直动手。这极少让东谈主思到Claude。长高下文不罕有。Gemini、Codex、Kimi都能作念长任务。罕有的是在长任务里知谈什么时候该问一句，什么时候该陆续。

还有一条更像委果的代码审查。灵验户让GLM-5.2去审Fable 5之前作念的一个大功能，再把GLM挑出的问题交给GPT-5.5复核，15个问题里，12个GPT-5.5认为站得住。

这条互动量不高，时间点也得小心：测试作念的时候Fable 5还能用，当今Fable 5对番邦缔造者还是停了，这条旅途自己复现不了。但它至少确认，GLM-5.2还是颖悟\"找问题\"这种活，不仅仅写个能跑的demo。

和Kimi K2.7的对比也确认并吞件事。那组Minecraft页面测试不是严格评测，不行推出\"GLM-5.2全面赢Kimi\"。但它把一个缔造者委果顺心的问题摆出来了：快几分钟不一定伏击，少修一轮问题更伏击。

三个不同的问题

对用户来说，慢和贵时常是并吞种感受：等得久，额度还掉得快。但问题自己不在并吞层。

第一层是办事体验。有东谈主说，用OpenCode加GLM-5.2最高级时，亚洲日韩中文在线精品第一实践感受梗概接近Claude Opus 4.6，但可能因为流量拥挤，速率相配慢。还灵验户平直说它\"慢得离谱\"。这类问题更像基础法子和流量问题，扩容之后会缓解。

第二层是额度盘算。前边那位给出正面评价的缔造者也提到，几个复杂任务就耗尽了50%的5小时额度和10%周额度。模子越能作念复杂任务，越容易把用户带进高耗尽场景。如若用户的感受是\"强但不敢多用\"，套餐盘算就会酿成问题。

第三层更谨慎，是模子行径。

灵验户说，GLM-5.2在Coding Plan里仍然很慢，不如预期，况兼会污染指示。他举的场景是设置 *.anyrouter.dev，认为我方还是阐发清楚，但模子仍然莫得惩办好。还灵验户说，GLM-5.1是\"你让它作念什么它就作念什么\"，但GLM-5.2会用我方的默许设定散失用户指示，需要反复把它拉回正轨。

这就无语了。

Claude的主动性之是以受接待，是因为它多半时候主动得对。该问时问，该提醒时提醒。但如若一个模子的主动性酿成散失用户指示、替用户改默许设定，那就不再是\"像Claude\"，而是像一个不太听话的Claude。

这不太像一个单纯靠教导词就能补王人的问题。它更像工程场景里的指示对王人：什么时候该追问，什么时候该照作念；什么时候该提醒风险，什么时候不该替用户改概念。Claude花了很长时间才让缔造者信任这种判断，GLM-5.2当今刚运转承袭这类进修。

中语社区的响应

中语社区的反馈更平直。

小红书和B站这两天冒出来一堆标题：\"实测GLM-5.2和Opus 4.8：差距比我思像的小\"、\"GLM-5.2实测：比跑分推崇得更像前沿模子\"、\"智谱GLM-5.2强到不错冒充Claude Opus？\"、\"在Claude Code中设置GLM-5.2满血版的步调\"。

标题归标题，正文有莫得这样神是另一趟事。但这些标题确认一件事：中语用户的第一响应是问它能不行冒充Opus、能不行接进Claude Code、能不行在我方的景色里顶上来。

B站也有泼凉水的。有视频标题平直写\"速率快、幻觉低、不扯淡，但编程材干不敌顶模\"，还有东谈主提醒\"先别全量切\"，说要先看100万高下文若何样、额度扛不扛得住、Claude Code切昔时顺不顺。

一边在喊差距比思象小，一边在问能不行真当主力用。这和外网的反馈其实是一趟事：景色认真测了，但还没到不错闭眼换的进度。

开源之后才是第二轮

发布时，智谱称GLM-5.2已面向GLM Coding Plan用户洞开，API和聊天机器东谈主办事随后上线，模子也将以MIT契约开源。

这个时间点也让GLM-5.2取得迥殊关注。Fable 5和Mythos 5因好意思国出口经管指示霎时对番邦国民暂停探访，让缔造者社区重新清楚到，前沿闭源模子的可用性并乌有足由缔造者我方掌控。 GLM-5.2的MIT权重承诺，不仅仅\"开源社区会不会甘愿\"的问题，也关联到缔造者是否笃信这是一条能弥远依赖的替代道路。