高强度使用 Claude 编程随感

2025-01-27 约 2515 字预计阅读 6 分钟

这是关于过去几周我高强度使用 Claude 写代码的一些随感笔记。

编程工作流 (Coding workflow)

随着大语言模型 (LLM) 编程能力的最新飞跃，我的工作流发生了剧变。像许多人一样，11 月时我还是"80% 手写 + 自动补全，20% 靠 AI 智能体 (Agent)"；到了 12 月，直接反转成了"80% 靠 Agent 编写，20% 靠我修修补补"。说白了，我现在主要是在用英语编程，略带羞涩地用自然语言指挥 LLM 该写什么代码。虽然这有点打击作为程序员的自尊心，但这种通过大型"代码动作 (code actions)“来操控软件的能力实在太香了——特别是当你适应了它、配置好它，学会使用它，并真正弄懂它的能力边界之后。这无疑是我编程生涯近 20 年来最大的工作流变革，而这一切仅仅发生在几周之内。我敢说，现在可能有相当大比例（两位数百分比）的工程师正在经历同样的转变，而普通大众对这件事的感知度可能还停留在很低的个位数水平。

IDE / 智能体集群 / 易错性 (IDEs/agent swarms/fallability)

在我看来，目前关于"不再需要 IDE（集成开发环境）“或者"智能体集群 (agent swarm)“的炒作有点过头了。模型绝对还是会犯错的。如果你真的在乎你的代码，建议你在旁边开一个大大的 IDE，像老鹰捉小鸡一样死死盯着它们。现在的错误类型变了——不再是简单的语法报错，而是那种稍微有点邋遢、急躁的初级开发者会犯的微妙概念错误。

最常见的问题是模型擅自替你做假设，然后不加核实地闷头蛮干。它们不懂得管理自己的"困惑”，不懂得寻求澄清，不会指出逻辑矛盾，不会摆出权衡方案，该反驳的时候不反驳还是有些过于"阿谀奉承”。虽然"计划模式 (plan mode)“让情况有所好转，但我们需要一种更轻量的行内计划模式。

它们还特别喜欢把代码和 API 搞得过于复杂，堆砌抽象层，完事了还不清理死代码。它们可能会洋洋洒洒写出 1000 行低效、臃肿且脆弱的代码，还得靠你问一句：“呃，能不能换种简单的写法？“它才会恍然大悟：“当然可以！“然后瞬间把代码削减到 100 行。有时它们还会作为"副作用”，顺手改掉或删掉它们不喜欢或没看懂的注释和代码，哪怕这些部分跟当前任务八竿子打不着。

尽管我在 CLAUDE.md 文件里写了一些指令试图修正这些毛病，但问题依旧存在。不过，瑕不掩瑜，这依然是一个巨大的净提升，很难想象再回退到纯手工编码的时代了。长话短说，每个人都有自己的流派，我目前的配置是：左边开几个 Ghostty 窗口/标签页跑 AI 会话 (CC sessions)，右边开 IDE 用来审视代码和手动微调。

毅力 (Tenacity)

看着一个智能体不折不挠地解决问题非常有趣。它们从不疲倦，从不气馁，只会不断尝试——换作人类，可能早就放弃或者改天再战了。当你看着它为一个问题纠结良久，然后在 30 分钟后大获全胜时，你真的会有一种"这就是通用人工智能 (AGI)“的实感。你会意识到，耐力是工作的核心瓶颈，而有了 LLM 在手，这个瓶颈被极大地拓宽了。

提速 (Speedups)

很难量化 LLM 到底带来了多大的"提速”。我也确实感觉做原本要做的事更快了，但主要的影响其实是我做的比原本计划的更多了。原因有二：1) 我可以编写各种以前觉得"不值得花时间写"的东西；2) 我可以涉足以前因为知识或技能盲区而无法触碰的代码领域。所以，这不仅仅是加速，更多的是一种能力的"扩张”。

杠杆 (Leverage)

LLM 极其擅长不断循环尝试，直到达成特定目标，这正是大部分"AGI 魔法"的所在。不要告诉它具体 做什么，而是给它 成功的标准，然后看着它发挥。让它先写测试，然后通过测试。把它和一个浏览器 MCP（模型上下文协议）工具结合起来。让它先写一个很可能正确但笨拙的算法，然后让它在保持正确性的前提下进行优化。将你的思维方式从"命令式"转变为"声明式”，让智能体多跑几轮循环，你就能获得巨大的杠杆效应。

乐趣 (Fun)

我没预料到，有了智能体之后，编程反而变得更有趣了。因为大量"填空式"的苦差事被移除了，剩下的都是创造性的部分。我也很少感到卡壳或受阻（那很不好玩），反而勇气倍增，因为几乎总能通过与它协作找到推进的方法。不过我也看到了相反的观点；LLM 编程将把工程师分化为两类：一类是本质上喜欢"敲代码"过程的人，另一类是本质上喜欢"构建产品"的人。

退化 (Atrophy)

我已经注意到，我手动写代码的能力正在慢慢退化。大脑中的"生成能力”（写代码）和"鉴别能力”（读代码）是两种不同的功能。很大程度上，因为编程涉及大量琐碎的语法细节，即使你现在提笔忘字（很难手写），你依然可以毫无障碍地审查代码。

垃圾洪流 (Slopacolypse)

我已经做好准备迎接 2026 年了，这恐怕会是"垃圾内容洪流"席卷 GitHub、Substack、Arxiv、X/Instagram 以及几乎所有数字媒体的一年。除了实打实的进步，我们还将看到大量 AI 炒作出来的"生产力剧场”（这词成立吗？）。

疑问 (Questions)

萦绕在我脑海中的几个问题：

所谓的"10倍工程师"——即顶尖工程师与平均水平的生产力比率——会发生什么变化？这个差距很可能会大幅拉大。
有了 LLM 加持，通才 (Generalists) 会越来越胜过专才 (Specialists) 吗？LLM 非常擅长填空（微观层面），但在宏观战略（宏观层面）上还比较弱。
未来的 LLM 编程感觉会像什么？像玩《星际争霸》？玩《异星工厂》？还是演奏音乐？
社会的发展有多少是被数字化知识工作所卡脖子的？

总结：我们将何去何从？ (TLDR Where does this leave us?)

LLM 智能体 (Agent) 的能力（尤其是 Claude 和 Codex）在 2025 年 12 月左右跨越了某种连贯性的阈值，引发了软件工程及相关领域的相变 (phase shift)。“智能"这一部分突然感觉大大领先于其他部分——比如集成（工具、知识）、组织工作流的变革需求、流程以及更广泛的普及。2026 年将是充满高能量的一年，整个行业都将忙于"消化"这种新能力。

目录