Open Table of contents

Part 1：加息还是降息，这是一个问题？
Part 2：AI 的 Capex 悬崖——钱烧到哪了？
- 从现金牛到借钱印股
- 但钱烧出回报了吗？
Part 3：从训练到推理——AI 投资的范式切换

Part 1：加息还是降息，这是一个问题？

昨晚美股的巨幅回调，市场将其归因于 5 月非农数据带来的降息预期破灭。但剥离表象数据，背后的宏观现实和政策博弈需要重新审视。

非农数据

17.2 万新增非农，大幅超预期，看着挺猛，拆开看就不是那么回事了。

这次增长主要就两块：休闲与招待业（+7 万）、政府部门（+5.2 万）。休闲招待平时月均也就新增 1.4 万左右，五月直接翻了五倍。政府部门这块，5.2 万里 4.4 万是非教育岗——不是招老师，是市政服务、安保、应急保障在集中招人。

美国 11 个主办城市——亚特兰大、达拉斯、迈阿密、洛杉矶、纽约——全是大都市区。六月开赛在即，酒店、餐厅、场馆、市政保障全线招人。这两块加起来占了总新增的七成以上。世界杯效应，白纸黑字写在就业数据里。

更有意思的是对比四月。四月非农修正后是 +17.9 万，总量跟五月差不多，但结构完全不是一回事。四月扛大旗的是零售（+2.2 万）和运输仓储（+3 万，大头是快递暴增 3.8 万）。到了五月，零售变成 -1000；运输仓储从 +3 万掉到 +1.3 万，快递回落是主因，叠加 Spirit Airlines 倒闭拖掉 9000 个岗位。再加上金融活动板块持续失血（五月 -2.2 万，过去一年累计掉了 10.7 万），真正反映经济体温的部门都在退潮。

说白了，五月的非农就是一个”换仓”——真经济部门在缩，世界杯临时需求在填，总量看起来稳住了，内核已经换了。

联储现状

沃什短期内必定没有动作。 新官上任，首要任务是先稳住局面，逐步削弱退而不休的鲍威尔的影响力，之后才能真正施展自己的意志。

更何况，剥开非农的数字外衣，经济面临的很可能是衰退而非过热。而衰退绝无可能加息。

退一步讲，就算不看衰退风险，纯算数学账，加息也算不过去。

当下美国公共债务体量已达 39.2 万亿美元，其中约三分之一是 1 年内到期的短债。2026 年到期需续作的国债近 10 万亿——更麻烦的是，2021-23 年低利率时期发行的大量长债（票息仅 ~1%）正陆续到期，续作利率直接跳到 4%+，利息成本本身就面临巨大的跃升压力。

净利息已是联邦政府增长最快的支出项。FY2025 净利息 9700 亿美元，已经超过了国防预算（9170 亿），吃掉联邦收入的 19%。FY2026 预计突破 1 万亿，每月光利息就烧掉近 880 亿。

在这个体量下，加息 25bp 意味着什么？短债利率即时传导，存量短债池子每年多出大几百亿利息。这钱只能靠多发债来填——而多发债又推高利息——纯死循环。

所以美联储真正面临的问题不是加不加息，而是加息的话财政和经济哪个先崩。 在这个债务体量下，加息根本不是可选项。因此，现在预期美联储的任何政策方向，都不符合现实。

至于鲍威尔时代留下的惯性——沃什站稳之前，联储内部会一直处于”理事各说各话”的状态。沃什上任前就打过预防针，说以后联储不会死盯着非农这类后验数据做决策。这话看着是对市场释放信号，实际上是在拆鲍威尔的台：非农是鲍威尔时代最核心的决策锚点，否定了它的优先级，等于否定了鲍威尔那一套决策框架。

真实白宫

市场现在最困惑的，是特朗普的两面：一边对通胀深恶痛绝、不断放话淡化美以伊冲突对油价的冲击，一边又在沃什上任后马不停蹄地施压降息。教科书逻辑下这属于典型的”既要又要”——降息释放流动性，怎么可能不推高通胀？

但跳出教科书来看，这两件事并不矛盾。

首先，特朗普害怕通胀，是真的。 他很清楚高通胀等于民怨，民怨等于中期选举的票房毒药。所以他用尽一切非货币手段来压能源成本——不断放话淡化战争对油价的冲击、放松对俄制裁让原油继续流通、松绑本土开采——能按住多少算多少。

其次，而且更关键：加息根本治不了这轮通胀。 病灶早就变了。 这不再是疫情初期直升机撒币引发的需求过热，而是彻头彻尾的供给侧危机。地缘冲突带动的供应链溢价，以及特朗普自己筑起的关税壁垒，才是物价高企的真凶。他最新的 301 关税本质上是谈判筹码，量级跟之前差不多，但对进口成本的推升是实打实的。

美联储利率加得再高，能让中东的油轮绕过导弹吗？
高利率能凭空抹掉关税带来的进口成本吗？

显然不能。

既然加息对供给侧通胀无效，那维持高利率就变成了纯粹的自残——不仅治不了胀，还会把美股和企业利润拖下水，最终反噬到特朗普最在意的东西：中期选举。

所以他的算盘其实很清晰：控通胀靠非货币手段（淡化战争溢价、放俄油通行、松绑本土开采），稳经济靠降息，两手各管各的。 用货币政策去扛供给侧的雷，药不对症，代价将是特朗普无法承受之重。

Part 2：AI 的 Capex 悬崖——钱烧到哪了？

市场对 AI 最大的担忧已经变了。不再是”有没有需求”，而是”钱还能撑多久”。

核心矛盾很简单：科技巨头的自由现金流，正在被 AI 资本开支吃干抹净。

四巨头（微软、Alphabet、亚马逊、Meta）2026 年 Capex 指引合计约 7000 亿美元，而它们 2025 年合计自由现金流仅剩 ~2000 亿。2025 全年已被砍掉近一半，2026 年差距将进一步扩大。

逐个看：

亚马逊：最危急。 2025 年自由现金流 112 亿，同比暴跌 66%，而 2026 年 Capex 指引高达 2000 亿。Capex 已大幅超过经营现金流承受上限，分析师普遍预计 FCF 将承压转负。亚马逊已在 SEC 文件中明示，可能通过发债或增资来填补缺口。

Alphabet：最激进。 Capex 从 2023 年的 323 亿翻到 2024 年的 525 亿，2025 年再跳到 914 亿（+74%），2026 年指引 1750-1850 亿——几乎再翻倍。分析师预计 FCF 将从 733 亿大幅收缩，Capex 基本吞掉全部经营现金流。这也是为什么 Alphabet 成了债市最活跃的科技借款人。

Meta：受伤最隐蔽。 2026 年 Capex 1250-1450 亿。营收增速看着很猛（+33%），但 FCF 只涨了 12%——“AI 基建税”把利润吃掉了。巴克莱预计 FCF 将大幅下降，2027-28 年存在转负风险。

微软：相对抗压。 2026 年 Capex 同样天文数字（预计超 1900 亿），Azure 的强劲增长提供了缓冲，FCF 利润率虽从 29% 压缩到 19%，但相比同行降幅最小，且未跟风发债。CFO 说得很直白：“我们已经缺算力缺了好几个季度了，我以为能追上——没有，需求在涨。”

说白了，四家 FCF 都在承受极大压力，区别只是微软尚有缓冲垫，剩下三家已逼近临界点。

从现金牛到借钱印股

这些公司历史上是靠自己的现金流支撑投资的。但现在撑不住了。

2025 年四季度起，科技巨头史无前例地涌入债市。Alphabet 连发多笔（$175 亿 + $200 亿，外加英镑、日元、欧元债），甚至发了一只 “百年债券”——Michael Burry 直接将其比作 1997 年摩托罗拉峰值时的百年债，称这是”摩托罗拉时刻”。亚马逊 3 月单笔发债 $500 亿（多币种），Meta 2025 年 10 月以 $300 亿创下当时非并购类 IG 债券的最大纪录。

2026 年科技公司 IG 债券发行预计达 3600-4000 亿美元，JP 摩根甚至推出了针对 AI 基建信用风险的 CDS 篮子——Wall Street 已经开始把”AI 烧钱”当成独立的信用风险类别来定价了。

唯独微软还在靠经营现金流硬撑，没有跟风发债。

但这还不是最极端的。本周 Alphabet 直接启动股权融资——$847.5 亿，史上最大规模。 含公开增发、强制可转债、$400 亿 ATM 计划，外加伯克希尔 $100 亿私募。这是 Alphabet 二十多年来首次增发。

紧接着，Meta 也在本周传出拟进行数百亿美元股权融资（Financial Times 报道），正在研究 Alphabet 的强制可转债结构。虽然 Meta 官方否认称”纯属猜测”，但同时也表态”将以最灵活的方式继续筹集资金支持 AI”——而 Meta 的回购计划去年底已经停了，上个月刚裁了 8000 人。

发债是加杠杆，增发是直接稀释股东。二十多年没融过资的巨头们，在 Capex 面前一个接一个被迫走到这一步——“借债度日”迅速升级成”印股换钱”。

但钱烧出回报了吗？

这是最核心的问题。目前来看——有，但远远不够。

亚马逊：AWS AI 收入年化跑到了 $150 亿，听着不少，但跟 2000 亿 Capex 比，7.5% 的回报率，算不过账。
Alphabet：Google Cloud 增速亮眼，但 1850 亿的 Capex 面前，收入增速完全跟不上烧钱速度。
Meta：广告 AI 精准度提升确实在贡献营收（Q1 增 33%），但 Reality Labs 每季烧 40 亿，整体 FCF 被”基建税”严重拖累。
微软：Azure 是唯一有说服力的故事——AI 服务收入增速在加速，但 CFO 自己也在喊”算力不够”。

不否认这个现实：AI 的收益是真的，但 Capex 的斜率远超收入的斜率。 如果四巨头一年烧 7000 亿、AI 收入却只能覆盖零头，这个缺口最终要么靠债填（利率还在 4%+），要么靠砍预算。无论哪条路，市场之前给 AI 故事的高估值都站不住脚。

而市场上相当一部分资金已经做出了选择。这些股票前期涨幅巨大，估值高高挂在天上，FCF 即将被 Capex 耗尽、收入又明显跟不上——聪明钱不会等到财报把账彻底算清的那一天，先获利了结，落袋为安。 这才是近期科技股暴跌的真正内核。

Part 3：从训练到推理——AI 投资的范式切换

如果 Part 2 的结论成立——Capex 不可持续，FCF 即将耗尽——那么 AI 板块的 Beta 时代已经结束。 未来不再是”闭眼买巨头”就能赚钱，投资逻辑必须从广度切换到深度，从训练侧转移到推理侧，从 Beta 寻找 Alpha。

算力越来越贵

英伟达的下一代 Vera Rubin（VR200）机架，ODM 采购价 $780 万，是当前 GB300（不到 $400 万）的近两倍。GPU 本身只涨了 57%（$3.5 万→$5.5 万），真正失控的是内存——HBM4+LPDDR5X 成本暴增 435%，每机架内存开销高达 $200 万，占了 BOM 的 25-30%，历史上第一次超过 GPU 本身。

这才是 AI 基建的真实斜率：不是需求在消失，是成本在失控。

产能全面跟不上

HBM4 量产进度严重低于预期。三星 1c DRAM 良率仅 ~60%（HBM4 端更低），美光仍在追赶资格认证，仅 SK 海力士达到成熟量产水平。英伟达对速率的要求远超 JEDEC 标准，迫使供应商反复修改设计。Vera Rubin 出货预期已被分析师大幅下调——HBM4 卡在哪里，出货就卡在哪里。

三家厂商都在拼命扩产，但典型的”远水解不了近渴”：

SK 海力士：M15X 新厂 2026 年 5 月才产出第一片晶圆，11 月进入量产，真正满产要等到 2027 年中。龙仁集群一期 2027 年 5 月封顶，完整产能放到 2030 年。总投资超 ₩120 万亿（约 $900 亿）。
三星：P4 二期 Q2 2026 量产，P3 2026 年底爬坡，真正的产能增量 P5 要等 2027 年底至 2028 年。HBM4 良率至今不到 60%。
美光：新加坡封装厂 2027 年产出，博伊西厂 2027 年，广岛厂 2027 年底。全部是 2027 以后的事。FY2026 Capex $200 亿已是史上最高。

三家 2026 年 HBM 产能全部售罄，真正的供应缓解最快也要到 2027-2028 年。

CoWoS 先进封装也在承压（台积电年产能约 65 万片晶圆，扩产中但同样远水难救近火）。黄仁勋自己也承认：“供给确实受限，使用必须更加明智。”

与此同时，美国 AI 数据中心的电力需求正以不可持续的速度膨胀——预计 2028 年数据中心将吃掉全美电力 6.7-12%（2023 年仅 4.4%）。而美国电网 70% 已接近寿命终点，互联请求排队积压高达 1.84 太瓦——超过全美现有总装机容量。2026 年规划的 12GW 数据中心已有一半推迟或取消。电力不是成本问题，是物理瓶颈。

从训练到推理：算力需求的结构性迁移

整个 AI 行业正在经历一个根本性的转折：训练占比下降，推理占比飙升。 根据 Gartner 数据，在云 GPU/ASIC 算力市场中：

2025 年：推理 $92 亿，训练 $91 亿
2026 年：推理 $206 亿（增速 +124%），训练 $169 亿（增速 +86%）

推理的增速和占比，均已超过训练。

这还只是云上的 IaaS 支出。如果把端侧和私有化部署算进来，推理的比例会更高——推理才是 AI 商业化真正的”走量”场景。

训练依然需要巨额投入，但 AI 的产业逻辑已经变了——未来 AI 应用爆发的基础不在训练侧，在推理侧。尤其是 Reasoning 模型的兴起（DeepSeek R1 引领），单次复杂查询消耗的计算量是传统推理的 150 倍，Token 生成量多 20 倍。Harness 和 Agentic 工作流会把推理需求进一步放大 10-100 倍——把单轮问答拆成了多步骤的自主执行闭环，每一步都在消耗算力。

但这里有一个致命的结构性差异——AI 不是互联网：没有边际成本优势

互联网经济最迷人的特征是什么？边际成本趋近于零。 多一个用户访问网站，服务器成本几乎忽略不计——这才是互联网公司能实现指数级规模效应的底层密码。

AI 没有这个优势。 每一个 Token 都要烧算力、烧电。用户用得越多，成本线就跟着往上走——不是固定成本摊薄，是可变成本的线性叠加。这从根本上决定了：AI IDC 未来的核心 KPI 不会是”峰值性能”，而是”每瓦特电力产出多少 Token”。

推理降本的方向：ARM + ASIC + LPDDR

这是逻辑的自然延伸——当成本成为核心矛盾，通用 GPU 的”英伟达税”就会面临商业压力。

Google TPU v7 的推理成本比同等 NVIDIA GPU 低 65-67%，功耗低 67%。亚马逊 Trainium3 成本低约 50%，且风冷设计可直接部署在存量数据中心。两家都是基于 ARM 架构 的定制 ASIC。Broadcom AI 半导体季度收入已飙至 $84 亿（同比 +106%，全年指引到 $1000 亿），说明整个行业正在用脚投票。

ARM 的胜出逻辑很简单：推理是极其垂直的负载，不需要 x86 那一整套复杂指令集。 一个模型部署上线后，跑的就是固定几类张量运算，x86 里大量通用逻辑、分支预测、乱序执行都是纯浪费功耗。ARM 砍掉这些多余的东西，刚好匹配推理的精简需求。

存储同理——推理的带宽需求仅 300-700 GB/s，训练则需 1-3 TB/s，差了 3-4 倍。通过 SOC 封装将存储与计算在片内直连，就能以远低于 HBM 的功耗满足推理带宽。LPDDR 成本只有 HBM 的四分之一，电压更低、省电更明显，是推理场景更合理的选择。

未来方向很清楚：ARM + ASIC + LPDDR = 从计算到存储全链路榨干每瓦特的 Token 产出。 这不是取代英伟达的故事，而是补位的故事——训练依然需要 GPU+HBM，但推理的大盘会越来越向这条低功耗路线倾斜。

可持续的推理格局：云端管高价值，端侧管日常

结合电力瓶颈和成本压力，一个可持续的 AI 推理架构必然分层：

云端：负责高价值任务——复杂推理、长文档分析、代码生成、训练。成本高但产出匹配。
端侧：负责日常高频任务——文本分类、语义搜索、实时翻译、自动补全。现代手机 NPU（Apple Neural Engine ~35 TOPS）可本地运行 4B-7B 参数模型，边际推理成本几乎为零——因为算力和电费是用户出的，不是厂商出的。

“云端+端侧”的混合架构已经在落地。高频低算力的任务本地解决，复杂任务才上云——这才是 AI 革命初期，在电力受限、成本失控的现实中能规模化铺开的唯一路径。

投资推论：Beta 消失，从推理侧找 Alpha

回到 Part 2 的结论——巨头的 FCF 即将被 Capex 耗尽，债市已经亮黄灯——这意味着：AI 板块的 Beta 溢价将逐渐消失。 过去两年”闭眼买七巨头”就能赚 Beta 的窗口，关闭了。

未来的 Alpha 在推理侧。推理是所有 AI 应用爆发的基础，而推理的竞争壁垒不在”谁的 GPU 更多”，在谁能在单位成本下产出更多有用的 Token。

最终推导出的投资标的标准，只有三条：

端侧——电力不受限、边际成本为零、随着模型小型化趋势直接受益
推理——受益于 Harness 和 Agentic 工作流带来的算力需求爆发
低估——当 Beta 消失，买贵的就是买风险

这次巨幅回调中，确实有符合上述标准的标的走了出来，在资金面上表现出了一些值得关注的偏好信号。但从第一性原理审视——端侧应用尚未真正爆发，AI 的特性决定了它必须先有基建（算力）才能有应用。保持警惕，同时保持乐观。 当然，泥沙俱下的时候，没有人能独善其身。