
出品 | 网易智能加勒比海盗漫画
作家 | 小爪
裁剪 | 王凤枝
GLM-5.2发布后,外网缔造者的第一响应不是问价钱。
低廉、能用、省钱,这些词贴在许多国产模子身上太深远。但此次征询的口吻变了极少点:它约略的确颖悟活了。
有东谈主拿它和GLM-5.1作念并吞份1700行Python代码审查,后果不是准确率碾压,是同等准确率下,时间从124.8秒降到47.7秒,输出从3436个token收窄到1415个。也有东谈主把它和Kimi K2.7放在并吞个教导词下写Minecraft游戏页面,GLM-5.2慢了几分钟,却少了一轮修问题的教导。

外网用户不是在夸它写得更多。他们在说,它少妄言、少返工,能把事情往前推。
也难怪Claude这个名字一直在征询里反复出现。缔造者太熟识Claude那种嗅觉了:不笃定时会问,看到风险会提醒,代码审查时能收拢问题。GLM-5.2让一部分用户第一次在国产模子上看到相同的影子。
但另一些用户随即踩到了反面:慢、拥挤、额度耗尽快,以致会用我方的默许设定散失用户指示。
它运转像Claude,也随机候像一个不太听话的版块。
先看此次发布了什么
6月13日,智谱把GLM-5.2先放进了GLM Coding Plan,莫得先开API,也莫得先放权重。

这个章程自己等于信号。它默许缔造者会先在编码器具里用,而不是先在聊天框里试。
几个细节能看出智谱的定位。Claude Code的设置示例里,glm-5.2被平直放进了Sonnet和Opus的位置;套餐里它被列为高阶档,对标Opus,额度也按这个档算。换句话说,智谱没把它当\"低廉替代\",而是当Claude的同位竞品在卖。

参数里最显眼的是100万高下文。在代码任务里,它对应的其实是一件具体的事:模子能不行吃下一个稍大的景色,能不行跟住一条长的修改链,能不行在第二十轮对话里还铭记第三轮定下的敛迹。
加上订阅、编码器具接入、开源时间表一次给王人,此次发布不像在发一个模子,更像在发一个产物。
缔造者拿它作念了什么
此次反馈里,跑分不伏击。要看的是缔造者拿它作念了什么。
有东谈主测严格JSON输出、编程、推理、长高下文检索,也有东谈主把它放进OpenCode和Coding Plan里跑最高级。前边那组Python代码审查数据仅仅单个缔造者样本,不是矜重基准测试,但主义很清楚:代码审查不需要模子把每件事阐发得很满,更需要它短、快、持要点。
另一个被反复提到的细节,是模子在职务不清楚时会先反问,而不是平直动手。这极少让东谈主思到Claude。长高下文不罕有。Gemini、Codex、Kimi都能作念长任务。罕有的是在长任务里知谈什么时候该问一句,什么时候该陆续。
还有一条更像委果的代码审查。灵验户让GLM-5.2去审Fable 5之前作念的一个大功能,再把GLM挑出的问题交给GPT-5.5复核,15个问题里,12个GPT-5.5认为站得住。
这条互动量不高,时间点也得小心:测试作念的时候Fable 5还能用,当今Fable 5对番邦缔造者还是停了,这条旅途自己复现不了。但它至少确认,GLM-5.2还是颖悟\"找问题\"这种活,不仅仅写个能跑的demo。
和Kimi K2.7的对比也确认并吞件事。那组Minecraft页面测试不是严格评测,不行推出\"GLM-5.2全面赢Kimi\"。但它把一个缔造者委果顺心的问题摆出来了:快几分钟不一定伏击,少修一轮问题更伏击。

三个不同的问题
对用户来说,慢和贵时常是并吞种感受:等得久,额度还掉得快。但问题自己不在并吞层。
第一层是办事体验。 有东谈主说,用OpenCode加GLM-5.2最高级时,亚洲日韩中文在线精品第一实践感受梗概接近Claude Opus 4.6,但可能因为流量拥挤,速率相配慢。还灵验户平直说它\"慢得离谱\"。这类问题更像基础法子和流量问题,扩容之后会缓解。
第二层是额度盘算。 前边那位给出正面评价的缔造者也提到,几个复杂任务就耗尽了50%的5小时额度和10%周额度。模子越能作念复杂任务,越容易把用户带进高耗尽场景。如若用户的感受是\"强但不敢多用\",套餐盘算就会酿成问题。
第三层更谨慎,是模子行径。
灵验户说,GLM-5.2在Coding Plan里仍然很慢,不如预期,况兼会污染指示。他举的场景是设置 *.anyrouter.dev,认为我方还是阐发清楚,但模子仍然莫得惩办好。还灵验户说,GLM-5.1是\"你让它作念什么它就作念什么\",但GLM-5.2会用我方的默许设定散失用户指示,需要反复把它拉回正轨。

这就无语了。
Claude的主动性之是以受接待,是因为它多半时候主动得对。该问时问,该提醒时提醒。但如若一个模子的主动性酿成散失用户指示、替用户改默许设定,那就不再是\"像Claude\",而是像一个不太听话的Claude。
这不太像一个单纯靠教导词就能补王人的问题。它更像工程场景里的指示对王人:什么时候该追问,什么时候该照作念;什么时候该提醒风险,什么时候不该替用户改概念。Claude花了很长时间才让缔造者信任这种判断,GLM-5.2当今刚运转承袭这类进修。
中语社区的响应
中语社区的反馈更平直。
小红书和B站这两天冒出来一堆标题:\"实测GLM-5.2和Opus 4.8:差距比我思像的小\"、\"GLM-5.2实测:比跑分推崇得更像前沿模子\"、\"智谱GLM-5.2强到不错冒充Claude Opus?\"、\"在Claude Code中设置GLM-5.2满血版的步调\"。
标题归标题,正文有莫得这样神是另一趟事。但这些标题确认一件事:中语用户的第一响应是问它能不行冒充Opus、能不行接进Claude Code、能不行在我方的景色里顶上来。
B站也有泼凉水的。有视频标题平直写\"速率快、幻觉低、不扯淡,但编程材干不敌顶模\",还有东谈主提醒\"先别全量切\",说要先看100万高下文若何样、额度扛不扛得住、Claude Code切昔时顺不顺。
一边在喊差距比思象小,一边在问能不行真当主力用。 这和外网的反馈其实是一趟事:景色认真测了,但还没到不错闭眼换的进度。
开源之后才是第二轮
发布时,智谱称GLM-5.2已面向GLM Coding Plan用户洞开,API和聊天机器东谈主办事随后上线,模子也将以MIT契约开源。
这个时间点也让GLM-5.2取得迥殊关注。Fable 5和Mythos 5因好意思国出口经管指示霎时对番邦国民暂停探访,让缔造者社区重新清楚到,前沿闭源模子的可用性并乌有足由缔造者我方掌控。 GLM-5.2的MIT权重承诺,不仅仅\"开源社区会不会甘愿\"的问题,也关联到缔造者是否笃信这是一条能弥远依赖的替代道路。

Reddit r/LocalLLaMA的征询里,社区气派不是浅陋的\"催更\",更像一种有条目的耐性:不错交融公司先把模子放进Coding Plan,通过订阅回收一部分本钱,但前提是权重的确依期达成。如若宽限,交融就会酿成质疑。
如若权重这周依期放出,GLM-5.2的征询会从办事体验参加更硬的阶段:量化、部署、推理本钱、长高下文显存、vLLM/SGLang适配、真实SWE-bench和智能体基准测试。
到其时候,相同\"47.7秒、1415个token\"这样的单点测试,才会被更多东谈主复现或推翻。 GLM-5.2的第二轮评价,也会比这两天更阴毒。
真门槛不是速率,是该不该听话
GLM-5.2莫得干掉Claude。
但它第一次让一部分国外缔造者认真商酌,是不是不错把国产模子放进真实责任流。
昔时国产模子在国外的好感度停在榜单、价钱和开源标签上。
GLM-5.2此次还是让一些东谈主景色更深入尝试。速率、额度、开源都还能靠工程手艺补,扩容、改套餐、依期放权重。
最难的是那条线:什么时候该主动,什么时候该听话。
这会决定GLM-5.2是一次令东谈主惊喜的尝鲜,如故一个缔造者景色弥远依赖的主力器具。
本周开源之后,第二轮测试才委果运转。
