目录

高强度使用 Claude 编程随感

这是关于过去几周我高强度使用 Claude 写代码的一些随感笔记。

编程工作流 (Coding workflow)

随着大语言模型 (LLM) 编程能力的最新飞跃,我的工作流发生了剧变。像许多人一样,11 月时我还是"80% 手写 + 自动补全,20% 靠 AI 智能体 (Agent)";到了 12 月,直接反转成了"80% 靠 Agent 编写,20% 靠我修修补补"。说白了,我现在主要是在用英语编程,略带羞涩地用自然语言指挥 LLM 该写什么代码。虽然这有点打击作为程序员的自尊心,但这种通过大型"代码动作 (code actions)“来操控软件的能力实在太香了——特别是当你适应了它、配置好它,学会使用它,并真正弄懂它的能力边界之后。这无疑是我编程生涯近 20 年来最大的工作流变革,而这一切仅仅发生在几周之内。我敢说,现在可能有相当大比例(两位数百分比)的工程师正在经历同样的转变,而普通大众对这件事的感知度可能还停留在很低的个位数水平。

IDE / 智能体集群 / 易错性 (IDEs/agent swarms/fallability)

在我看来,目前关于"不再需要 IDE(集成开发环境)“或者"智能体集群 (agent swarm)“的炒作有点过头了。模型绝对还是会犯错的。如果你真的在乎你的代码,建议你在旁边开一个大大的 IDE,像老鹰捉小鸡一样死死盯着它们。现在的错误类型变了——不再是简单的语法报错,而是那种稍微有点邋遢、急躁的初级开发者会犯的微妙概念错误。

最常见的问题是模型擅自替你做假设,然后不加核实地闷头蛮干。它们不懂得管理自己的"困惑”,不懂得寻求澄清,不会指出逻辑矛盾,不会摆出权衡方案,该反驳的时候不反驳还是有些过于"阿谀奉承”。虽然"计划模式 (plan mode)“让情况有所好转,但我们需要一种更轻量的行内计划模式。

它们还特别喜欢把代码和 API 搞得过于复杂,堆砌抽象层,完事了还不清理死代码。它们可能会洋洋洒洒写出 1000 行低效、臃肿且脆弱的代码,还得靠你问一句:“呃,能不能换种简单的写法?“它才会恍然大悟:“当然可以!“然后瞬间把代码削减到 100 行。有时它们还会作为"副作用”,顺手改掉或删掉它们不喜欢或没看懂的注释和代码,哪怕这些部分跟当前任务八竿子打不着。

尽管我在 CLAUDE.md 文件里写了一些指令试图修正这些毛病,但问题依旧存在。不过,瑕不掩瑜,这依然是一个巨大的净提升,很难想象再回退到纯手工编码的时代了。长话短说,每个人都有自己的流派,我目前的配置是:左边开几个 Ghostty 窗口/标签页跑 AI 会话 (CC sessions),右边开 IDE 用来审视代码和手动微调。

毅力 (Tenacity)

看着一个智能体不折不挠地解决问题非常有趣。它们从不疲倦,从不气馁,只会不断尝试——换作人类,可能早就放弃或者改天再战了。当你看着它为一个问题纠结良久,然后在 30 分钟后大获全胜时,你真的会有一种"这就是通用人工智能 (AGI)“的实感。你会意识到,耐力是工作的核心瓶颈,而有了 LLM 在手,这个瓶颈被极大地拓宽了。

提速 (Speedups)

很难量化 LLM 到底带来了多大的"提速”。我也确实感觉做原本要做的事更快了,但主要的影响其实是我做的比原本计划的 更多 了。原因有二:1) 我可以编写各种以前觉得"不值得花时间写"的东西;2) 我可以涉足以前因为知识或技能盲区而无法触碰的代码领域。所以,这不仅仅是加速,更多的是一种能力的"扩张”。

杠杆 (Leverage)

LLM 极其擅长不断循环尝试,直到达成特定目标,这正是大部分"AGI 魔法"的所在。不要告诉它具体 做什么,而是给它 成功的标准,然后看着它发挥。让它先写测试,然后通过测试。把它和一个浏览器 MCP(模型上下文协议)工具结合起来。让它先写一个很可能正确但笨拙的算法,然后让它在保持正确性的前提下进行优化。将你的思维方式从"命令式"转变为"声明式”,让智能体多跑几轮循环,你就能获得巨大的杠杆效应。

乐趣 (Fun)

我没预料到,有了智能体之后,编程反而变得 有趣了。因为大量"填空式"的苦差事被移除了,剩下的都是创造性的部分。我也很少感到卡壳或受阻(那很不好玩),反而勇气倍增,因为几乎总能通过与它协作找到推进的方法。不过我也看到了相反的观点;LLM 编程将把工程师分化为两类:一类是本质上喜欢"敲代码"过程的人,另一类是本质上喜欢"构建产品"的人。

退化 (Atrophy)

我已经注意到,我手动写代码的能力正在慢慢退化。大脑中的"生成能力”(写代码)和"鉴别能力”(读代码)是两种不同的功能。很大程度上,因为编程涉及大量琐碎的语法细节,即使你现在提笔忘字(很难手写),你依然可以毫无障碍地审查代码。

垃圾洪流 (Slopacolypse)

我已经做好准备迎接 2026 年了,这恐怕会是"垃圾内容洪流"席卷 GitHub、Substack、Arxiv、X/Instagram 以及几乎所有数字媒体的一年。除了实打实的进步,我们还将看到大量 AI 炒作出来的"生产力剧场”(这词成立吗?)。

疑问 (Questions)

萦绕在我脑海中的几个问题:

  • 所谓的"10倍工程师"——即顶尖工程师与平均水平的生产力比率——会发生什么变化?这个差距很可能会 大幅 拉大。
  • 有了 LLM 加持,通才 (Generalists) 会越来越胜过专才 (Specialists) 吗?LLM 非常擅长填空(微观层面),但在宏观战略(宏观层面)上还比较弱。
  • 未来的 LLM 编程感觉会像什么?像玩《星际争霸》?玩《异星工厂》?还是演奏音乐?
  • 社会的发展有多少是被数字化知识工作所卡脖子的?

总结:我们将何去何从? (TLDR Where does this leave us?)

LLM 智能体 (Agent) 的能力(尤其是 Claude 和 Codex)在 2025 年 12 月左右跨越了某种连贯性的阈值,引发了软件工程及相关领域的相变 (phase shift)。“智能"这一部分突然感觉大大领先于其他部分——比如集成(工具、知识)、组织工作流的变革需求、流程以及更广泛的普及。2026 年将是充满高能量的一年,整个行业都将忙于"消化"这种新能力。