Table of contents
Open Table of contents
Part 1:加息还是降息,这是一个问题?
昨晚美股的巨幅回调,市场将其归因于 5 月非农数据带来的降息预期破灭。但剥离表象数据,背后的宏观现实和政策博弈需要重新审视。
非农数据
17.2 万新增非农,大幅超预期,看着挺猛,拆开看就不是那么回事了。
这次增长主要就两块:休闲与招待业(+7 万)、政府部门(+5.2 万)。休闲招待平时月均也就新增 1.4 万 左右,五月直接翻了 五倍。政府部门这块,5.2 万 里 4.4 万 是非教育岗——不是招老师,是市政服务、安保、应急保障在集中招人。
美国 11 个主办城市——亚特兰大、达拉斯、迈阿密、洛杉矶、纽约——全是大都市区。六月开赛在即,酒店、餐厅、场馆、市政保障全线招人。这两块加起来占了总新增的 七成 以上。世界杯效应,白纸黑字写在就业数据里。
更有意思的是对比四月。四月非农修正后是 +17.9 万,总量跟五月差不多,但结构完全不是一回事。四月扛大旗的是零售(+2.2 万)和运输仓储(+3 万,大头是快递暴增 3.8 万)。到了五月,零售变成 -1000;运输仓储从 +3 万 掉到 +1.3 万,快递回落是主因,叠加 Spirit Airlines 倒闭拖掉 9000 个岗位。再加上金融活动板块持续失血(五月 -2.2 万,过去一年累计掉了 10.7 万),真正反映经济体温的部门都在退潮。
说白了,五月的非农就是一个”换仓”——真经济部门在缩,世界杯临时需求在填,总量看起来稳住了,内核已经换了。
联储现状
沃什短期内必定没有动作。 新官上任,首要任务是先稳住局面,逐步削弱退而不休的鲍威尔的影响力,之后才能真正施展自己的意志。
更何况,剥开非农的数字外衣,经济面临的很可能是衰退而非过热。而衰退绝无可能加息。
退一步讲,就算不看衰退风险,纯算数学账,加息也算不过去。
当下美国公共债务体量已达 39.2 万亿 美元,其中约 三分之一 是 1 年内到期的短债。2026 年到期需续作的国债近 10 万亿——更麻烦的是,2021-23 年低利率时期发行的大量长债(票息仅 ~1%)正陆续到期,续作利率直接跳到 4%+,利息成本本身就面临巨大的跃升压力。
净利息已是联邦政府增长最快的支出项。FY2025 净利息 9700 亿 美元,已经超过了国防预算(9170 亿),吃掉联邦收入的 19%。FY2026 预计突破 1 万亿,每月光利息就烧掉近 880 亿。
在这个体量下,加息 25bp 意味着什么?短债利率即时传导,存量短债池子每年多出大几百亿利息。这钱只能靠多发债来填——而多发债又推高利息——纯死循环。
所以美联储真正面临的问题不是加不加息,而是加息的话财政和经济哪个先崩。 在这个债务体量下,加息根本不是可选项。因此,现在预期美联储的任何政策方向,都不符合现实。
至于鲍威尔时代留下的惯性——沃什站稳之前,联储内部会一直处于”理事各说各话”的状态。沃什上任前就打过预防针,说以后联储不会死盯着非农这类后验数据做决策。这话看着是对市场释放信号,实际上是在拆鲍威尔的台:非农是鲍威尔时代最核心的决策锚点,否定了它的优先级,等于否定了鲍威尔那一套决策框架。
真实白宫
市场现在最困惑的,是特朗普的两面:一边对通胀深恶痛绝、不断放话淡化美以伊冲突对油价的冲击,一边又在沃什上任后马不停蹄地施压降息。教科书逻辑下这属于典型的”既要又要”——降息释放流动性,怎么可能不推高通胀?
但跳出教科书来看,这两件事并不矛盾。
首先,特朗普害怕通胀,是真的。 他很清楚高通胀等于民怨,民怨等于中期选举的票房毒药。所以他用尽一切非货币手段来压能源成本——不断放话淡化战争对油价的冲击、放松对俄制裁让原油继续流通、松绑本土开采——能按住多少算多少。
其次,而且更关键:加息根本治不了这轮通胀。 病灶早就变了。 这不再是疫情初期直升机撒币引发的需求过热,而是彻头彻尾的供给侧危机。地缘冲突带动的供应链溢价,以及特朗普自己筑起的关税壁垒,才是物价高企的真凶。他最新的 301 关税本质上是谈判筹码,量级跟之前差不多,但对进口成本的推升是实打实的。
- 美联储利率加得再高,能让中东的油轮绕过导弹吗?
- 高利率能凭空抹掉关税带来的进口成本吗?
显然不能。
既然加息对供给侧通胀无效,那维持高利率就变成了纯粹的自残——不仅治不了胀,还会把美股和企业利润拖下水,最终反噬到特朗普最在意的东西:中期选举。
所以他的算盘其实很清晰:控通胀靠非货币手段(淡化战争溢价、放俄油通行、松绑本土开采),稳经济靠降息,两手各管各的。 用货币政策去扛供给侧的雷,药不对症,代价将是特朗普无法承受之重。
Part 2:AI 的 Capex 悬崖——钱烧到哪了?
市场对 AI 最大的担忧已经变了。不再是”有没有需求”,而是”钱还能撑多久”。
核心矛盾很简单:科技巨头的自由现金流,正在被 AI 资本开支吃干抹净。
四巨头(微软、Alphabet、亚马逊、Meta)2026 年 Capex 指引合计约 7000 亿 美元,而它们 2025 年合计自由现金流仅剩 ~2000 亿。2025 全年已被砍掉近一半,2026 年差距将进一步扩大。
逐个看:
亚马逊:最危急。 2025 年自由现金流 112 亿,同比暴跌 66%,而 2026 年 Capex 指引高达 2000 亿。Capex 已大幅超过经营现金流承受上限,分析师普遍预计 FCF 将承压转负。亚马逊已在 SEC 文件中明示,可能通过发债或增资来填补缺口。
Alphabet:最激进。 Capex 从 2023 年的 323 亿翻到 2024 年的 525 亿,2025 年再跳到 914 亿(+74%),2026 年指引 1750-1850 亿——几乎再翻倍。分析师预计 FCF 将从 733 亿大幅收缩,Capex 基本吞掉全部经营现金流。这也是为什么 Alphabet 成了债市最活跃的科技借款人。
Meta:受伤最隐蔽。 2026 年 Capex 1250-1450 亿。营收增速看着很猛(+33%),但 FCF 只涨了 12%——“AI 基建税”把利润吃掉了。巴克莱预计 FCF 将大幅下降,2027-28 年存在转负风险。
微软:相对抗压。 2026 年 Capex 同样天文数字(预计超 1900 亿),Azure 的强劲增长提供了缓冲,FCF 利润率虽从 29% 压缩到 19%,但相比同行降幅最小,且未跟风发债。CFO 说得很直白:“我们已经缺算力缺了好几个季度了,我以为能追上——没有,需求在涨。”
说白了,四家 FCF 都在承受极大压力,区别只是微软尚有缓冲垫,剩下三家已逼近临界点。
从现金牛到借钱印股
这些公司历史上是靠自己的现金流支撑投资的。但现在撑不住了。
2025 年四季度起,科技巨头史无前例地涌入债市。Alphabet 连发多笔($175 亿 + $200 亿,外加英镑、日元、欧元债),甚至发了一只 “百年债券”——Michael Burry 直接将其比作 1997 年摩托罗拉峰值时的百年债,称这是”摩托罗拉时刻”。亚马逊 3 月单笔发债 $500 亿(多币种),Meta 2025 年 10 月以 $300 亿 创下当时非并购类 IG 债券的最大纪录。
2026 年科技公司 IG 债券发行预计达 3600-4000 亿 美元,JP 摩根甚至推出了针对 AI 基建信用风险的 CDS 篮子——Wall Street 已经开始把”AI 烧钱”当成独立的信用风险类别来定价了。
唯独微软还在靠经营现金流硬撑,没有跟风发债。
但这还不是最极端的。本周 Alphabet 直接启动股权融资——$847.5 亿,史上最大规模。 含公开增发、强制可转债、$400 亿 ATM 计划,外加伯克希尔 $100 亿私募。这是 Alphabet 二十多年来首次增发。
紧接着,Meta 也在本周传出拟进行数百亿美元股权融资(Financial Times 报道),正在研究 Alphabet 的强制可转债结构。虽然 Meta 官方否认称”纯属猜测”,但同时也表态”将以最灵活的方式继续筹集资金支持 AI”——而 Meta 的回购计划去年底已经停了,上个月刚裁了 8000 人。
发债是加杠杆,增发是直接稀释股东。二十多年没融过资的巨头们,在 Capex 面前一个接一个被迫走到这一步——“借债度日”迅速升级成”印股换钱”。
但钱烧出回报了吗?
这是最核心的问题。目前来看——有,但远远不够。
- 亚马逊:AWS AI 收入年化跑到了 $150 亿,听着不少,但跟 2000 亿 Capex 比,7.5% 的回报率,算不过账。
- Alphabet:Google Cloud 增速亮眼,但 1850 亿的 Capex 面前,收入增速完全跟不上烧钱速度。
- Meta:广告 AI 精准度提升确实在贡献营收(Q1 增 33%),但 Reality Labs 每季烧 40 亿,整体 FCF 被”基建税”严重拖累。
- 微软:Azure 是唯一有说服力的故事——AI 服务收入增速在加速,但 CFO 自己也在喊”算力不够”。
不否认这个现实:AI 的收益是真的,但 Capex 的斜率远超收入的斜率。 如果四巨头一年烧 7000 亿、AI 收入却只能覆盖零头,这个缺口最终要么靠债填(利率还在 4%+),要么靠砍预算。无论哪条路,市场之前给 AI 故事的高估值都站不住脚。
而市场上相当一部分资金已经做出了选择。这些股票前期涨幅巨大,估值高高挂在天上,FCF 即将被 Capex 耗尽、收入又明显跟不上——聪明钱不会等到财报把账彻底算清的那一天,先获利了结,落袋为安。 这才是近期科技股暴跌的真正内核。
Part 3:从训练到推理——AI 投资的范式切换
如果 Part 2 的结论成立——Capex 不可持续,FCF 即将耗尽——那么 AI 板块的 Beta 时代已经结束。 未来不再是”闭眼买巨头”就能赚钱,投资逻辑必须从广度切换到深度,从训练侧转移到推理侧,从 Beta 寻找 Alpha。
算力越来越贵
英伟达的下一代 Vera Rubin(VR200)机架,ODM 采购价 $780 万,是当前 GB300(不到 $400 万)的 近两倍。GPU 本身只涨了 57%($3.5 万→$5.5 万),真正失控的是内存——HBM4+LPDDR5X 成本暴增 435%,每机架内存开销高达 $200 万,占了 BOM 的 25-30%,历史上第一次超过 GPU 本身。
这才是 AI 基建的真实斜率:不是需求在消失,是成本在失控。
产能全面跟不上
HBM4 量产进度严重低于预期。三星 1c DRAM 良率仅 ~60%(HBM4 端更低),美光仍在追赶资格认证,仅 SK 海力士达到成熟量产水平。英伟达对速率的要求远超 JEDEC 标准,迫使供应商反复修改设计。Vera Rubin 出货预期已被分析师大幅下调——HBM4 卡在哪里,出货就卡在哪里。
三家厂商都在拼命扩产,但典型的”远水解不了近渴”:
- SK 海力士:M15X 新厂 2026 年 5 月 才产出第一片晶圆,11 月进入量产,真正满产要等到 2027 年中。龙仁集群一期 2027 年 5 月 封顶,完整产能放到 2030 年。总投资超 ₩120 万亿(约 $900 亿)。
- 三星:P4 二期 Q2 2026 量产,P3 2026 年底 爬坡,真正的产能增量 P5 要等 2027 年底至 2028 年。HBM4 良率至今不到 60%。
- 美光:新加坡封装厂 2027 年 产出,博伊西厂 2027 年,广岛厂 2027 年底。全部是 2027 以后的事。FY2026 Capex $200 亿 已是史上最高。
三家 2026 年 HBM 产能全部售罄,真正的供应缓解最快也要到 2027-2028 年。
CoWoS 先进封装也在承压(台积电年产能约 65 万片晶圆,扩产中但同样远水难救近火)。黄仁勋自己也承认:“供给确实受限,使用必须更加明智。”
与此同时,美国 AI 数据中心的电力需求正以不可持续的速度膨胀——预计 2028 年数据中心将吃掉全美电力 6.7-12%(2023 年仅 4.4%)。而美国电网 70% 已接近寿命终点,互联请求排队积压高达 1.84 太瓦——超过全美现有总装机容量。2026 年规划的 12GW 数据中心已有 一半 推迟或取消。电力不是成本问题,是物理瓶颈。
从训练到推理:算力需求的结构性迁移
整个 AI 行业正在经历一个根本性的转折:训练占比下降,推理占比飙升。 根据 Gartner 数据,在云 GPU/ASIC 算力市场中:
- 2025 年:推理 $92 亿,训练 $91 亿
- 2026 年:推理 $206 亿(增速 +124%),训练 $169 亿(增速 +86%)
推理的增速和占比,均已超过训练。
这还只是云上的 IaaS 支出。如果把端侧和私有化部署算进来,推理的比例会更高——推理才是 AI 商业化真正的”走量”场景。
训练依然需要巨额投入,但 AI 的产业逻辑已经变了——未来 AI 应用爆发的基础不在训练侧,在推理侧。尤其是 Reasoning 模型的兴起(DeepSeek R1 引领),单次复杂查询消耗的计算量是传统推理的 150 倍,Token 生成量多 20 倍。Harness 和 Agentic 工作流会把推理需求进一步放大 10-100 倍——把单轮问答拆成了多步骤的自主执行闭环,每一步都在消耗算力。
但这里有一个致命的结构性差异——AI 不是互联网:没有边际成本优势
互联网经济最迷人的特征是什么?边际成本趋近于零。 多一个用户访问网站,服务器成本几乎忽略不计——这才是互联网公司能实现指数级规模效应的底层密码。
AI 没有这个优势。 每一个 Token 都要烧算力、烧电。用户用得越多,成本线就跟着往上走——不是固定成本摊薄,是可变成本的线性叠加。这从根本上决定了:AI IDC 未来的核心 KPI 不会是”峰值性能”,而是”每瓦特电力产出多少 Token”。
推理降本的方向:ARM + ASIC + LPDDR
这是逻辑的自然延伸——当成本成为核心矛盾,通用 GPU 的”英伟达税”就会面临商业压力。
Google TPU v7 的推理成本比同等 NVIDIA GPU 低 65-67%,功耗低 67%。亚马逊 Trainium3 成本低约 50%,且风冷设计可直接部署在存量数据中心。两家都是基于 ARM 架构 的定制 ASIC。Broadcom AI 半导体季度收入已飙至 $84 亿(同比 +106%,全年指引到 $1000 亿),说明整个行业正在用脚投票。
ARM 的胜出逻辑很简单:推理是极其垂直的负载,不需要 x86 那一整套复杂指令集。 一个模型部署上线后,跑的就是固定几类张量运算,x86 里大量通用逻辑、分支预测、乱序执行都是纯浪费功耗。ARM 砍掉这些多余的东西,刚好匹配推理的精简需求。
存储同理——推理的带宽需求仅 300-700 GB/s,训练则需 1-3 TB/s,差了 3-4 倍。通过 SOC 封装将存储与计算在片内直连,就能以远低于 HBM 的功耗满足推理带宽。LPDDR 成本只有 HBM 的 四分之一,电压更低、省电更明显,是推理场景更合理的选择。
未来方向很清楚:ARM + ASIC + LPDDR = 从计算到存储全链路榨干每瓦特的 Token 产出。 这不是取代英伟达的故事,而是补位的故事——训练依然需要 GPU+HBM,但推理的大盘会越来越向这条低功耗路线倾斜。
可持续的推理格局:云端管高价值,端侧管日常
结合电力瓶颈和成本压力,一个可持续的 AI 推理架构必然分层:
- 云端:负责高价值任务——复杂推理、长文档分析、代码生成、训练。成本高但产出匹配。
- 端侧:负责日常高频任务——文本分类、语义搜索、实时翻译、自动补全。现代手机 NPU(Apple Neural Engine ~35 TOPS)可本地运行 4B-7B 参数模型,边际推理成本几乎为零——因为算力和电费是用户出的,不是厂商出的。
“云端+端侧”的混合架构已经在落地。高频低算力的任务本地解决,复杂任务才上云——这才是 AI 革命初期,在电力受限、成本失控的现实中能规模化铺开的唯一路径。
投资推论:Beta 消失,从推理侧找 Alpha
回到 Part 2 的结论——巨头的 FCF 即将被 Capex 耗尽,债市已经亮黄灯——这意味着:AI 板块的 Beta 溢价将逐渐消失。 过去两年”闭眼买七巨头”就能赚 Beta 的窗口,关闭了。
未来的 Alpha 在推理侧。推理是所有 AI 应用爆发的基础,而推理的竞争壁垒不在”谁的 GPU 更多”,在谁能在单位成本下产出更多有用的 Token。
最终推导出的投资标的标准,只有三条:
- 端侧——电力不受限、边际成本为零、随着模型小型化趋势直接受益
- 推理——受益于 Harness 和 Agentic 工作流带来的算力需求爆发
- 低估——当 Beta 消失,买贵的就是买风险
这次巨幅回调中,确实有符合上述标准的标的走了出来,在资金面上表现出了一些值得关注的偏好信号。但从第一性原理审视——端侧应用尚未真正爆发,AI 的特性决定了它必须先有基建(算力)才能有应用。保持警惕,同时保持乐观。 当然,泥沙俱下的时候,没有人能独善其身。