一份工作月薪 3000,但要月底才发钱;另一份日结 80,当天拿现金。你选哪个?如果你口袋里还有余粮,答案很明显。但如果你今晚就需要钱买饭呢?这个选择背后藏着一个残酷的规律,而它正在 AI 时代重演。 为什么读这本书 最近在读《贫穷的本质》。 并不是因为自身的贫穷,也不是因为多么富有。起因是 AI。 过去一年多,我每天都在用 AI,参与各种工具、试各种 workflow,脑子里很清楚:这是未来的大方向。不是三五年的风口,是像互联网一样至少 20 年的潮流。它会替代大量工作,就像当年珍妮纺纱机替代手工织布工一样。AI 拥有近乎无限的、不停歇的、几乎免费的智能。虽然现在 token...
从打字到说话 最近从基建组转到业务组,开始用 Agentic Engineering 做真实的业务开发。通过纯 Vibe Coding 的方式,我上线了三个项目,其中两个已经落地,包括一个 AI Chat 页面和对应的客户端。 在这个过程里有很多事情颠覆了我原来的认知。但在聊那些"大"的发现之前,先说一个小的——关于怎么跟 AI 说话。 我以前不喜欢语音输入。觉得文字是思想的载体,应该自己组织、自己敲出来。但开始纯 AI 开发之后,我发现一个事实:脑子里的想法本来就是一句话的事,把它变成文字的过程其实是在"降噪"。降噪这件事本身没问题,**问题是降噪消耗的精力远大于它带来的精确度提...
中美 AI 竞赛里,所有人都盯着模型层——谁的参数多,谁的跑分高,谁又发了新论文。但模型正在商品化,Token 价格两年跌了 99%。真正决定这场竞赛走向的,可能是离用户最近的那一层:应用。 这一层的中美差异不是谁强谁弱,而是结构性的不同。美国是几百个独立 AI 工具各自生长的热带雨林,中国是微信和抖音这样的超级 APP 把 AI 悄悄塞进十几亿人的日常。两种生态各有各的力量,也各有各的盲区。更有意思的是,这一层会反哺下面的所有层——抖音的数据喂出了视频生成领域超过 Sora 2 的 Seedance 2.0,这不是巧合。 但在展开这些之前,我想先讲一个十年前的故事。因为它让我意识到,对应...
2026 年 2 月,7 个重大 AI 模型同月发布。所有人都在这一层拼命。但写了三层物理基础设施之后,我开始怀疑:最热闹的这一层,可能不是决定胜负的那一层。 所有人都在这里拼命 2 月 5 日,Anthropic 发布 Claude Opus 4.6。ARC-AGI-2 抽象推理得分 68.8%——比上一代翻了将近一倍。SWE-bench 真实世界编程 80.8%。GDPval-AA 知识工作排行榜登顶,领先 GPT-5.2 整整 144 个 Elo。发布二十分钟后,OpenAI 扔出 GPT-5.3 Codex——Terminal-Bench 2.0 得分 77.3%,反超...
7000 亿美元砸向云端,但中国在建另一种东西 7000 亿美元砸向云端,但中国在建另一种东西 2026 年,美国科技巨头们的资本开支加起来逼近 7000 亿美元,大部分砸向数据中心。这比很多国家的 GDP 还大。但在太平洋对岸,中国在用一种完全不同的方式建同样的东西。 7000 亿 vs 1250 亿:差距为什么这么大 Amazon 今年的资本开支预计 2000 亿美元。Alphabet 1750-1850...
大规模监控、自主武器、AI 辅助的国家级黑客攻击——这些词在 AI 伦理课件里躺了十年,从来没人当真。不是因为没人关心,是因为以前的 AI 做不到。这周发生的三件事,把课件变成了新闻。 三件事 2026年2月最后一周同时爆发的三件大事 2026 年 2 月的最后一周,AI 世界同时发生了三件事。 第一件:美国国防部长赫格塞斯在五角大楼当面给 Anthropic CEO Dario A...
被卡脖子的 AI 芯片层,正在发生三件没人说的事 三面墙、三条绕路、一个所有人忽略的新变量。芯片层的故事,"卡脖子"三个字装不下。 一笔让我重新审视芯片层的交易 昨天 AMD 宣布了一笔交易:和 Meta 签了一份多年期协议,部署定制版 AMD GPU 和 CPU,为 Meta 下一代 AI 数据中心供电。 规模是 6 个吉瓦的电力容量——大约相当于 600 万户家庭的用电量——全部用于 AMD 芯片。路透社估算合同价值约 600 亿美元。 这是 Meta 在 NVIDIA 之外押注第二个芯片供应商。就在一周前,Meta 刚和 NVIDIA 签了部署数百万颗 GPU 的...
在上海你是 Jessica,同事喊你 J,你的身份是你自己选的。下了高铁你妈喊你"丫头",二姨喊你"小芳",你还没进家门,就已经被塞回了一个你十八岁之前的坐标系。然后你会在接下来三天的饭局里慢慢发现:不是你变了,是这个地方根本没变,而且它有充分的理由不变。 你的名字 你在上海叫 Jessica。 同事喊你 J,合作方喊你 Jessica,你的企业微信头像是一张修过的侧脸照。你用了三年时间,从一个不会做 PPT 的应届生变成了一个能独立带项目的产品经理。你有自己的审美,自己的消费习惯,自己选的名字。 然后你坐了六个小时高铁回家过年。 ![Jessica 与小芳——同一人,两...
DeepSeek 们蒸馏了 Claude,然后呢? Anthropic 今天指控三家中国公司蒸馏了 Claude。但我看完博客后想的不是"谁对谁错",而是一个更大的问题。 今天发生了什么 2 月 24 日,Anthropic 发了一篇博客,指控三家中国 AI 公司——DeepSeek、Moonshot(Kimi)和 MiniMax——通过大规模蒸馏行为提取 Claude 的能力。 蒸馏本身是一种正常的技术手段,前沿实验室自己也在用——把大模型的能力"蒸"到小模型里,降低成本。但 Anthropic 说的不是这种。他们描述的是一种工业级别的、有组织的能力提取行动。 数字很...
当大模型被刻进晶体管 上一篇我写 Token 是电力的出口形态,有人问:如果算力成本也能降到接近零呢?这周 Taalas 把 Llama 刻进了芯片,我觉得那个"如果"正在变成现实。 一条让我停下来的新闻 上周刷到一条消息:一家叫 Taalas 的加拿大公司,把 Meta 的 Llama 3.1 8B 模型直接蚀刻进了芯片的晶体管里。 不是"把模型加载到芯片上运行"。是把模型的权重变成了物理晶体管本身。32 层 Transformer,每一层都是硅片上的物理电路。用户输入进来,电信号从第 1 层的晶体管流到第 32 层,中间不经过任何外部存储器,直接在导线上完成推理。 ...