我花了两年才想通一件事——中国最便宜的出口商品不是衣服、光伏板或电解铝,而是一种大多数人还没意识到的东西。它不需要集装箱,不走海关,通过海底光缆就能完成交付。它叫 Token。 一个没想通的问题 2023 年,可控核聚变的新闻满天飞,新能源板块被炒得火热。我当时注意到一条不太起眼的消息:Sam Altman 投了一家叫 OKLO 的小型核反应堆公司。 那时候 ChatGPT 刚出来不久,所有人都在聊大模型的智能涌现,很少有人把 AI 和能源放在一起讨论。Altman 投 OKLO 这件事我记住了,但没想明白。 同一时期,我在和 AI 讨论一个异想天开的问题:**如果电能像石油...
After Closing the Laptop A week before Chinese New Year, I was deep in high-intensity collaboration with AI. The workflow is hard to explain to people outside this field — I had five to ten Agents running simultaneously, each handling a different task. I was the dispatcher: breaking down require...
合上电脑之后 春节前一周,我还在高强度地和 AI 协作。那段时间的工作状态很难跟不在这个行业里的人解释——我同时开着 5 到 10 个 Agent,每个处理不同的任务,我像一个调度中心,把需求拆解、分发、验收。代码在几分钟内成型,文档自动生成,方案迭代的速度快到我自己都觉得不真实。 那种感觉不是"效率提高了 10 倍"这种干巴巴的描述能概括的。更准确地说,是一种智力被并行展开的错觉——好像我突然拥有了十个脑子,每个都在替我思考不同的问题。 ![并行世界的撕裂](https://img.dhpie.com/illustrations/he-shang-diannao/01-a...
Sonnet 正在吃掉 Opus 的午餐 2025 年 2 月 17 日,Anthropic 发布了 Claude Sonnet 4.6。官方的定位很克制:"最强的 Sonnet 模型"。但从实际数据看,这个版本的意义远不止 Sonnet 产品线的一次迭代——它正在系统性地侵蚀 Opus 的领地。 Claude Code 的早期测试给出了一个让人意外的数字:用户在 59% 的情况下更偏好 Sonnet 4.6,而不是 2025 年 11 月发布的旗舰模型 Opus 4.5。理由也不是"差不多就行"的妥协,而是 Sonnet 4.6 在具体维度上做得更好——更少的过度工程、更少的虚假成...
In February 2025, Andrej Karpathy coined the term "vibe coding" — describing a mode of development where you "fully give in to the vibes, embrace exponentials, and forget that the code even exists." By the end of the year, the term had been named Collins Dictionary's Word of the Year. But most disco...
2025 年初,Andrej Karpathy 在 X 上随手发了一条帖子,造了个词叫 Vibe Coding—— "完全跟着感觉走,拥抱指数级变化,忘掉代码本身的存在"。大半年过去,这个词已经进了 Collins 词典,成了 2025 年度词汇。但多数讨论还停留在 "AI 能不能写代码" 这个层面,很少有人认真拆解过:一个有九年经验的工程师,从半手动的 AI 辅助到几乎不碰编程语言,中间到底经历了什么,又因此改变了哪些判断。 这篇文章试图回答这个问题。不是布道,不是教程,只是一份来自生产环境的演进记录。 ![AI 编程演进四阶段时间线概览](https://img.dhpie.com/i...
Web 为谁而建 2026 年 2 月,Cloudflare 宣布了一个看似不起眼的功能:Markdown for Agents。当 AI Agent 在请求头中带上 Accept: text/markdown,Cloudflare 的边缘网络会自动把 HTML 页面转换成 Markdown 返回。一篇博客文章的 token 数从 16,180 降到 3,150,减少了 80%。 这个功能本身并不复杂。但它背后的信号值得琢磨:Web 的消费者正在发生结构性变化,而基础设施已经开始为此调整。 要理解这件事的意义,得先回到一个更基本的问题——HTML 和 CSS 到底是为了解决什么...
去年11月的某个周末下午,我刚 push 完一个 feature 的最后一次 commit ,习惯性地打开公司的GitLab看提交记录。从2015年到现在,九年的代码历史,密密麻麻的绿色方块,代表着几千次提交、几十万行代码。 突然意识到一件事:这些全都不是我的。 离职后,这个账号会被注销,代码仓库会被回收访问权限,就好像我从来没存在过一样。九年的技术积累、踩过的坑、做过的架构决策,全都锁在那些私有仓库里。下一份工作,又是一个新的GitLab账号,重新开始。 这种感觉很难形容,就像一颗种子被埋进土里。你知道它在那里,但你看不见,摸不着,甚至不确定它还会不会发芽。 第一次尝试...
Yesterday I thought I had a genius idea. Wrap an Agent inside Docker, turn CLI interactions into Web APIs. Dynamically render those y/N prompts and multi-select menus, then pass commands back to the Agent in the container. The benefits seemed obvious: isolated environment solves permission issues,...
昨天我觉得自己想到了个天才点子。 把 Agent 封装进 Docker,让命令行交互变成 Web API。那些 y/N 的选择、多选菜单,全都动态渲染,再把指令丢回给容器里的 Agent。好处很明显:隔离环境解决权限问题,自定义 base 镜像内置 skills,横向扩展,随时 docker commit 快照。 然后 Claude 泼了盆冷水。ANSI 转结构化 API 会各种挂,而且已经有开源实现了。 我点开链接。OpenHands,6.5 万 star。 被验证的不只是技术可行性 Docker 沙箱、WebSocket 实时交互、PTY 处理、可配置 runtime、企业...