摘要: 模型会思考了,也有手脚了,但谁来决定它能走多远?Harness 是闭环控制系统,Agentic Engineering 是关于信任边界的设计哲学。
cover 一次意外的失控 前两篇分别讲了 AI 怎么"看"(Prompt 与 Context Engineering)和怎么"动"(MCP 与 Skill)。写到这里,拼图看起来已经差不多完整了:你把信息喂给模型,模型想好了,通过工具去执行。但我最近碰到的一件事,让我意识到中间缺了一块很关键的东西。 我用 Claude Code 帮一个项目做重构。任务不复杂:把一批旧的 API 接口迁移到新的路由结构。我给了它清楚的 Context,配好了相关的 Skill,MCP 也接上了代...
摘要: MCP 让 AI 连上外部世界,Skill 让 AI 把事做对。一个解决"能不能做",一个解决"怎么做对"。
cover 一个很具体的挫败 上一篇讲了 Prompt 和 Context Engineering,核心是一个问题:怎么让 AI 看到正确的信息。但看到归看到,能做事是另一回事。 我最近的一个体验很说明问题。我让 AI 帮我查下周的日程安排,看看有没有冲突,然后把结果发给同事。这三件事任何一件单独拿出来都不复杂,但 AI 做不了。它不能访问我的 Google Calendar,不能查实时数据,也没办法发邮件。它就像一个被锁在隔音玻璃房里的顾问:听力极好,分析能力极强,但既没有手,...
摘要: Prompt 是你对 AI 说的话,Context 是 AI 走进的房间。理解这两个概念的区别,是理解整个 AI 工程实践的起点。
cover 起因:一个被反复问到的问题 过去半年,我在各种场合被问过同一类问题:"Prompt 到底怎么写才好?" 提问的人包括产品经理、创业者、写公众号的朋友,甚至我妈。每次我都试图认真回答,但总觉得哪里不对。后来想明白了:这个问题本身就问窄了。好比有人问"怎么跟服务员说话才能吃好",你可以教他话术,但真正决定这顿饭质量的,是他走进了哪家餐厅。 这是一个系列的第一篇。我想把过去一年在 AI 工程实践中反复碰到的几个新概念拆开讲清楚。不是词典式的定义罗列,而是顺着实际使用的场景,...
摘要: 当 AI 把软件生产成本压到趋近于零,行业没有萎缩反而在膨胀。从杰文斯悖论出发,探讨软件形态从 SaaS 到需求即服务的四阶段演进,以及 ARR 模型面临的根本性挑战。
上个月我帮一个做外贸的朋友搭了一个客户管理系统。从需求沟通到上线,总共花了四个小时。他之前问过几家外包公司,报价在 8 万到 15 万之间,周期两到三个月。 四个小时。我甚至没觉得自己在"开发"。更像是跟 Agent 聊了一下午,中间审了几次它生成的东西,改了两个业务逻辑上的判断,就完事了。 这件事让我开始认真想一个问题:当软件的生产成本被压到这个程度,整个行业会变成什么样?直觉告诉你应该是"需要的人更少了"。但数据说的是另一回事。 蒸汽机烧了更多的煤 1865 年,英国经济学家杰文斯发现了一件反常识的事:瓦特改良蒸汽机,让每单位功率消耗的煤大幅减少。按理说英国的煤消耗量应该下降...
摘要: 当 Agent 接管了写代码的工作,工程师的价值从执行力迁移到判断力。本文从竞态条件排查、Harness Engineering、Context Engineering 等实战经验出发,探讨工程师能力迁移的四个阶段。
上一篇文章发出去之后,有读者问我:你说工程师的价值在迁移,到底迁到哪去了? 这个问题我想了很久。过去半年我的日常工作发生了一个很具体的变化:以前每天打开 IDE 写代码,现在每天打开的是一堆 Spec 文件和 Agent 的执行日志。听起来像是从厨师变成了餐厅经理,但实际体感比这复杂得多。 你以为消失的能力,换了个地方活着 去年有一阵我很焦虑。Redis 集群怎么搭、Kafka 消费组怎么调优、数据库索引怎么设计,这些我花了好几年才摸透的东西,Agent 现在做得比我好。那些曾经让我在团队里有话语权的技术细节,突然变得不值钱了。 但做了几个月 Agent 编排之后,我发现事情没那...
我最近一直在想一个问题:Agent 到底在改变什么? 不是技术层面的。API 调用、框架选型、架构设计,这些 Agent 已经做得比大多数人好了。我说的是更大的东西。当一个技术的出现让智力劳动的成本趋近于零,它改变的就不只是某个行业,而是整个社会运转的底层逻辑。 这个问题太大了,一个人想不清楚。所以我找了几个不同背景的朋友坐下来聊。经济学的、做投资的、写了二十年代码的、研究社会制度的。我们没有预设结论,就是把问题摊开,吵一吵,看看能碰出什么。 这篇文章是那场讨论的整理。不是答案,是一张问题地图。 起点:一个工程师的体感 先说我自己的感受。 我做了九年工程师,从 Cursor...
一份工作月薪 3000,但要月底才发钱;另一份日结 80,当天拿现金。你选哪个?如果你口袋里还有余粮,答案很明显。但如果你今晚就需要钱买饭呢?这个选择背后藏着一个残酷的规律,而它正在 AI 时代重演。 为什么读这本书 最近在读《贫穷的本质》。 并不是因为自身的贫穷,也不是因为多么富有。起因是 AI。 过去一年多,我每天都在用 AI,参与各种工具、试各种 workflow,脑子里很清楚:这是未来的大方向。不是三五年的风口,是像互联网一样至少 20 年的潮流。它会替代大量工作,就像当年珍妮纺纱机替代手工织布工一样。AI 拥有近乎无限的、不停歇的、几乎免费的智能。虽然现在 token...
从打字到说话 最近从基建组转到业务组,开始用 Agentic Engineering 做真实的业务开发。通过纯 Vibe Coding 的方式,我上线了三个项目,其中两个已经落地,包括一个 AI Chat 页面和对应的客户端。 在这个过程里有很多事情颠覆了我原来的认知。但在聊那些"大"的发现之前,先说一个小的——关于怎么跟 AI 说话。 我以前不喜欢语音输入。觉得文字是思想的载体,应该自己组织、自己敲出来。但开始纯 AI 开发之后,我发现一个事实:脑子里的想法本来就是一句话的事,把它变成文字的过程其实是在"降噪"。降噪这件事本身没问题,**问题是降噪消耗的精力远大于它带来的精确度提...
中美 AI 竞赛里,所有人都盯着模型层——谁的参数多,谁的跑分高,谁又发了新论文。但模型正在商品化,Token 价格两年跌了 99%。真正决定这场竞赛走向的,可能是离用户最近的那一层:应用。 这一层的中美差异不是谁强谁弱,而是结构性的不同。美国是几百个独立 AI 工具各自生长的热带雨林,中国是微信和抖音这样的超级 APP 把 AI 悄悄塞进十几亿人的日常。两种生态各有各的力量,也各有各的盲区。更有意思的是,这一层会反哺下面的所有层——抖音的数据喂出了视频生成领域超过 Sora 2 的 Seedance 2.0,这不是巧合。 但在展开这些之前,我想先讲一个十年前的故事。因为它让我意识到,对应...
2026 年 2 月,7 个重大 AI 模型同月发布。所有人都在这一层拼命。但写了三层物理基础设施之后,我开始怀疑:最热闹的这一层,可能不是决定胜负的那一层。 所有人都在这里拼命 2 月 5 日,Anthropic 发布 Claude Opus 4.6。ARC-AGI-2 抽象推理得分 68.8%——比上一代翻了将近一倍。SWE-bench 真实世界编程 80.8%。GDPval-AA 知识工作排行榜登顶,领先 GPT-5.2 整整 144 个 Elo。发布二十分钟后,OpenAI 扔出 GPT-5.3 Codex——Terminal-Bench 2.0 得分 77.3%,反超...