中美 AI 竞赛里,所有人都盯着模型层——谁的参数多,谁的跑分高,谁又发了新论文。但模型正在商品化,Token 价格两年跌了 99%。真正决定这场竞赛走向的,可能是离用户最近的那一层:应用。 这一层的中美差异不是谁强谁弱,而是结构性的不同。美国是几百个独立 AI 工具各自生长的热带雨林,中国是微信和抖音这样的超级 APP 把 AI 悄悄塞进十几亿人的日常。两种生态各有各的力量,也各有各的盲区。更有意思的是,这一层会反哺下面的所有层——抖音的数据喂出了视频生成领域超过 Sora 2 的 Seedance 2.0,这不是巧合。 但在展开这些之前,我想先讲一个十年前的故事。因为它让我意识到,对应...
2026 年 2 月,7 个重大 AI 模型同月发布。所有人都在这一层拼命。但写了三层物理基础设施之后,我开始怀疑:最热闹的这一层,可能不是决定胜负的那一层。 所有人都在这里拼命 2 月 5 日,Anthropic 发布 Claude Opus 4.6。ARC-AGI-2 抽象推理得分 68.8%——比上一代翻了将近一倍。SWE-bench 真实世界编程 80.8%。GDPval-AA 知识工作排行榜登顶,领先 GPT-5.2 整整 144 个 Elo。发布二十分钟后,OpenAI 扔出 GPT-5.3 Codex——Terminal-Bench 2.0 得分 77.3%,反超...
7000 亿美元砸向云端,但中国在建另一种东西 7000 亿美元砸向云端,但中国在建另一种东西 2026 年,美国科技巨头们的资本开支加起来逼近 7000 亿美元,大部分砸向数据中心。这比很多国家的 GDP 还大。但在太平洋对岸,中国在用一种完全不同的方式建同样的东西。 7000 亿 vs 1250 亿:差距为什么这么大 Amazon 今年的资本开支预计 2000 亿美元。Alphabet 1750-1850...
大规模监控、自主武器、AI 辅助的国家级黑客攻击——这些词在 AI 伦理课件里躺了十年,从来没人当真。不是因为没人关心,是因为以前的 AI 做不到。这周发生的三件事,把课件变成了新闻。 三件事 2026年2月最后一周同时爆发的三件大事 2026 年 2 月的最后一周,AI 世界同时发生了三件事。 第一件:美国国防部长赫格塞斯在五角大楼当面给 Anthropic CEO Dario A...
被卡脖子的 AI 芯片层,正在发生三件没人说的事 三面墙、三条绕路、一个所有人忽略的新变量。芯片层的故事,"卡脖子"三个字装不下。 一笔让我重新审视芯片层的交易 昨天 AMD 宣布了一笔交易:和 Meta 签了一份多年期协议,部署定制版 AMD GPU 和 CPU,为 Meta 下一代 AI 数据中心供电。 规模是 6 个吉瓦的电力容量——大约相当于 600 万户家庭的用电量——全部用于 AMD 芯片。路透社估算合同价值约 600 亿美元。 这是 Meta 在 NVIDIA 之外押注第二个芯片供应商。就在一周前,Meta 刚和 NVIDIA 签了部署数百万颗 GPU 的...
在上海你是 Jessica,同事喊你 J,你的身份是你自己选的。下了高铁你妈喊你"丫头",二姨喊你"小芳",你还没进家门,就已经被塞回了一个你十八岁之前的坐标系。然后你会在接下来三天的饭局里慢慢发现:不是你变了,是这个地方根本没变,而且它有充分的理由不变。 你的名字 你在上海叫 Jessica。 同事喊你 J,合作方喊你 Jessica,你的企业微信头像是一张修过的侧脸照。你用了三年时间,从一个不会做 PPT 的应届生变成了一个能独立带项目的产品经理。你有自己的审美,自己的消费习惯,自己选的名字。 然后你坐了六个小时高铁回家过年。 ![Jessica 与小芳——同一人,两...
DeepSeek 们蒸馏了 Claude,然后呢? Anthropic 今天指控三家中国公司蒸馏了 Claude。但我看完博客后想的不是"谁对谁错",而是一个更大的问题。 今天发生了什么 2 月 24 日,Anthropic 发了一篇博客,指控三家中国 AI 公司——DeepSeek、Moonshot(Kimi)和 MiniMax——通过大规模蒸馏行为提取 Claude 的能力。 蒸馏本身是一种正常的技术手段,前沿实验室自己也在用——把大模型的能力"蒸"到小模型里,降低成本。但 Anthropic 说的不是这种。他们描述的是一种工业级别的、有组织的能力提取行动。 数字很...
当大模型被刻进晶体管 上一篇我写 Token 是电力的出口形态,有人问:如果算力成本也能降到接近零呢?这周 Taalas 把 Llama 刻进了芯片,我觉得那个"如果"正在变成现实。 一条让我停下来的新闻 上周刷到一条消息:一家叫 Taalas 的加拿大公司,把 Meta 的 Llama 3.1 8B 模型直接蚀刻进了芯片的晶体管里。 不是"把模型加载到芯片上运行"。是把模型的权重变成了物理晶体管本身。32 层 Transformer,每一层都是硅片上的物理电路。用户输入进来,电信号从第 1 层的晶体管流到第 32 层,中间不经过任何外部存储器,直接在导线上完成推理。 ...
推荐算法最大的成就,是让每个创作者都学会了把自己剁成碎片——财经号只聊钱,技术号只写代码,美食号绝不提人生。然后有一天大家突然发现,碎片看腻了,想看个活人。 你关注的不是账号,是人 去年有一天晚上,我躺在床上刷手机,右手举着屏幕,左手搭在旁边熟睡的娃身上。那天工作很累,脑子不想处理任何有信息密度的东西,只想看点轻松的。 我刷到一个科技博主在讲他给家里老人装智能家居的过程。不是那种"智能家居全屋方案 10 万搞定"的标题党,就是他自己在那折腾,一边接线一边跟他妈吵架——他妈嫌他把好好的墙凿了个洞,他说这是为了走线。评论区全在笑。 我也笑了。然后我翻了一下这个人的主页,发现他平时...
我花了两年才想通一件事——中国最便宜的出口商品不是衣服、光伏板或电解铝,而是一种大多数人还没意识到的东西。它不需要集装箱,不走海关,通过海底光缆就能完成交付。它叫 Token。 电力出口的物理困境 中国的电力成本在全球范围内有明显优势。风电光伏装机量世界第一,煤电虽然不够清洁但胜在稳定供给,综合度电成本长期低于欧美主要经济体。一个自然的问题是:这种成本优势能不能通过出口变现? 直觉上有两条路径,但都走不通。 电网直连的问题在于基础设施成本和地缘风险。超高压输电线路的铺设价格惊人,途经的每个国家都是一个独立的谈判节点。中国到东南亚的局部互联有一定可行性,但要实现...