投研报告 投研

美国已批准约10家中国公司购买英伟达H200芯片——全方位深度解读

5月14日(路透社)——美国已批准约10家中国公司购买英伟达第二强大的人工智能芯片H200,但三位知情人士表示,迄今尚未交付任何产品,导致一笔重大技术交易陷入悬而未决,首席执行官黄仁勋本周寻求在中国取得突破。

0 次阅读

原文:X @LMDFinance

来源声明:本文由 @LMDFinance 首发于 X,本站转载仅供学习交流,不构成投资建议。

封面

配图

5月14日(路透社)——美国已批准约10家中国公司购买英伟达第二强大的人工智能芯片H200,但三位知情人士表示,迄今尚未交付任何产品,导致一笔重大技术交易陷入悬而未决,首席执行官黄仁勋本周寻求在中国取得突破。

一名消息人士称,黄仁勋最初未被列入白宫访京代表团名单,但他是在特朗普总统的邀请下加入此次行程的。特朗普在前往与中国国家主席习近平峰会的途中,在阿拉斯加接了他,这让人们对此次访问最终能解开中国销售氢200芯片停滞的努力充满希望。(新闻全文附文末)

其实,这一定程度上已经成为旧闻,请看详细解读和分析。

一、美国政府以及川普对英伟达H200芯片对华出口的态度演变

特朗普(川普)对英伟达H200芯片对华出口的态度是务实商业化导向:他视之为美国获利、保持科技竞争力并作为中美贸易谈判筹码的机会,同时强调“强有力的国家安全保障”。与拜登政府“尽可能拉大AI领先差距”的严格封锁不同,特朗普政府更注重“有管理地开放”(managed access),通过收取费用、逐案审查和监控来平衡经济利益与安全风险。

1.政策变化时间线(关键转折)

拜登政府时期(2022-2025年初):H200(Hopper架构第二代AI芯片,仅次于Blackwell)被纳入先进计算芯片出口管制。2025年1月(拜登任期最后阶段)正式实施“AI Diffusion Rule”,对中国大陆和澳门采取**推定拒绝(presumption of denial)**政策,基本禁止出口,目的是防止中国用于军事/先进AI开发。

特朗普政府初期(2025年8-11月):政策开始松动。8月曾考虑以15%收入分成允许部分销售,但11月否决了削弱版Blackwell出口申请。特朗普政府内部(如白宫AI主管David Sacks)主张“让中国依赖美芯片,同时美国赚钱”,而非全面脱钩。

2025年12月8日重大转折:特朗普在Truth Social亲自宣布:美国允许英伟达H200(及其他公司类似芯片)出口至中国“批准客户”和其他国家,条件是“持续强有力的国家安全保障”。美国政府收取25%销售收入分成(高于此前15%提案)。他称已告知习近平,此举“对美国非常划算”。英伟达随后表态支持,认为这能保持其全球标准地位。Blackwell及更先进Rubin系列仍被严格限制。

2026年1月13-14日正式落地:美国商务部工业与安全局(BIS)发布规则,将H200对华出口从“推定拒绝”改为逐案审查(case-by-case review)。同时特朗普签署行政令,基于《1962年贸易扩展法》第232条加征25%费用。生效日期为1月15/16日左右。

2.当前政策核心条件(2026年5月最新状态)

批准客户:仅限经审核的企业(如阿里巴巴、腾讯、字节跳动、京东等约10家中国云巨头),每家可申请一定数量(报道提及单家最高7.5万颗)。

限制措施:

1)出口量不超过美国国内销量的50%。

2)必须在美国第三方实验室进行性能测试验证。

3)中国买家需证明“足够的安全程序”,禁止军用/敏感用途。

4)芯片需经美国中转(部分情况)。

政府收益:25%收入直接归美国财政(特朗普强调这是“美国份额”)。

实际出货情况:政策已批,但截至2026年5月14日尚未有大规模实际发货。中国企业因优先采购国产(如华为)+供应链安全考量,采购意愿低迷。英伟达CEO黄仁勋多次参与外交(如随特朗普代表团访华),但订单仍处“询价/等待许可”阶段。

3.特朗普态度的核心逻辑与争议

支持方(特朗普团队):这是“聪明交易”——美国企业拿订单、财政拿分成、中国依赖美技术,同时监控使用。能抑制华为等国产替代加速,还能作为稀土/贸易谈判筹码。

反对方(国会鹰派、两党批评):担心加速中国AI/军事进步,“给老虎喂肉”。部分议员称这削弱了美国科技领先优势。

整体:特朗普一贯的“交易艺术”风格,从第一任期就开始对华加征关税+科技限制,但第二任期更强调“美国优先+赚钱优先”,而非意识形态全面封锁。

总结:特朗普的政策从拜登的“硬封锁”转向“有偿有控开放”,H200成为中美AI博弈的“新平衡点”。但实际落地仍受中美双边动态影响(贸易谈判、供应链本土化)。未来Blackwell是否进一步放开仍是观察重点。

二、中国政府以及企业对进口英伟达H200芯片的态度

中国政府对进口英伟达H200芯片的态度是“有条件、有限度支持,同时坚定推动国产替代”,核心是自主可控和供应链安全。政府未公开正式表态(商务部多次回应“暂不了解具体情况”),但通过非正式指导、海关措施和审批条件清晰传达信号:优先采购国产芯片(如华为昇腾),仅在“确有必要”时允许有限进口,且往往附带捆绑国产芯片的比例要求。

1.政府态度的关键表现

早期限制:2026年1月美国放宽H200出口许可后,中国海关曾明确告知报关代理禁止H200入境,并召集科技企业开会,指示“除非绝对必要,否则不得采购”。此举被视为平衡AI算力需求与防范美国“长臂管辖”风险的策略。

后续条件性放行:1月底批准首批(字节跳动、阿里、腾讯等合计超40万颗),但需满足额外条件(如搭配一定比例国产芯片、特定用途限制)。3-4月商务部对相关提问保持低调回应。

最新立场(2026年4-5月):尽管美国已批准约10家企业采购(每家上限7.5万颗),但实际交付仍为零。美国商务部长公开“甩锅”称中方未允许企业购买,目的是推动本土产业。政府坚持“以市场换技术、最终实现替代”的长期战略,避免关键基础设施依赖随时可能被断供的美国芯片。

总体逻辑:中国视H200为“可利用但不可依赖”的工具,担心美国附加的25%收入分成、第三方安全审查、中转要求等政治化条件,以及潜在“后门”或突然禁运风险。目标是通过有限进口“消化吸收”,加速国产AI芯片生态(如昇腾910系列已孵化60+硬件伙伴)。

2.中国企业的态度是“观望+优先国产,实际采购意愿低”

大型互联网/云厂商(如阿里巴巴、腾讯、字节跳动、京东)对H200性能有需求(用于AI大模型训练),但实际行动谨慎,普遍遵循政府指导,优先选择华为等国产方案。

已获许可但未大规模采购:路透社今日(2026年5月14日)报道,美国已批准上述10家企业采购,但至今零交付。企业因北京“供应链安全”非正式指导,暂缓或优先国产,等待进一步协调(如特朗普访华期间突破)。

典型案例:

中国移动等国企在公开招标中直接选择华为昇腾910C,而非等待H200。

阿里云、腾讯云等虽有采购准备,但强调“国产优先”,部分订单需搭配国产芯片才能获批。

英伟达CEO黄仁勋多次访华推动,仍表示“正在耐心等待中国政府最终决定”,企业订单尚未实质落地。

企业考量:H200性能虽强,但面临美国政策不确定性(逐案审查、出口量限美国国内50%)、额外成本(25%分成)、以及国产替代已快速追赶的现实(华为Ascend性能逐步对标)。长期看,企业担心“依赖美芯”会受地缘政治波动影响,转而加速自建国产算力集群。

当前整体局面(2026年5月14日最新):中美双方均已批准,但芯片仍“卡在中间”。中国企业采购意愿低迷,实际出货为零,体现了“买方市场”的主动权。中国正以“静制动”方式,用国产替代作为筹码,避免陷入美国设定的“依赖陷阱”。

总结:政府态度是战略性克制(支持有限进口,但绝不让步于自力更生);企业态度是务实跟随(想买但不敢/不愿大规模买)。这反映中美AI博弈已从“美国单边封锁”转向“双向谨慎”。未来动态取决于特朗普-习近平会晤等高层协调,以及国产芯片成熟度。如果需要具体企业最新订单数据或华为昇腾对比分析,我可以继续帮你查。投资相关仍需关注地缘风险。

三、英伟达H200芯片与最先进芯片的差距

英伟达 H200 属于其上代 Hopper 架构的最终改良版旗舰,而当前其最先进的量产级芯片为 Blackwell 架构的 B200 核心(含由其组成的 GB200 超级芯片系统)。这两代芯片在底层微架构、算力精度以及显存带宽上存在代际差距。

1.核心参数与理论性能差距对比

下表对比了单个 H200 SXM 芯片与最先进的单个 B200 芯片的核心硬件规格:

配图

2.不同计算精度下的算力差距 (单芯片 Raw Compute)

B200 最核心的算力飞跃在于引入了原生硬件级 FP4(4位浮点)精度支持,同时大幅强化了高精度的张量核心输出:

FP8 Tensor 算力: H200 的 FP8 算力约为 32 PFLOPS,而 B200 提升到了 4.5 PFLOPS(4500 TFLOPS)。在相同 FP8 任务下,B200 的基础稠密算力是 H200 的 2.3 倍左右。

FP4 Tensor 算力: H200 芯片不支持原生 FP4 硬件加速。最先进的 B200 支持第二代 Transformer 引擎,FP4 算力高达 9 PFLOPS(9000 TFLOPS)。

3.实测场景性能与集群差距 (Real-world Performance)

在具体的 AI大语言模型(LLM)落地应用中,芯片在系统级上的算力差距会被成倍放大。

1)大模型推理性能(Inference): 最先进的 B200 / GB200 平台在使用 FP4 精度对万亿参数超大模型进行实时推理时,其系统级吞吐量(Tokens per Second)比上一代 Hopper 平台快了 高达 11 到 15 倍。这得益于更高的显存带宽(8TB/s)和 FP4 带来的单时钟周期吞吐量翻倍。

2)大模型训练性能(Training): 由于集群规模扩展时通信常常成为瓶颈,B200 的 NVLink 5 将双向带宽翻倍至 1.8 TB/s。在密集的分布式多卡集群大模型训练实测中,Blackwell 系统的训练效率可以达到 H200 / H100 系统的 3 到 4 倍。

3)单卡常规微调(70B 参数以内模型): 在处理未针对 Blackwell 深度优化的常规 FP16 混合精度模型时,单张 B200 相比 H200 的实测性能提升大约在 34.3% 到 56% 之间。

总结

H200 的优势在于其基于传统 700W 空冷机房即可轻松无缝平替改造。而最先进的 B200 / GB200 芯片则在算力上形成了绝对碾压(尤其是 15 倍的万亿模型推理优势),但需要企业购入整套新型数据中心架构并采用先进的液冷散热系统。

四、国产替代产品与英伟达H200芯片的差距

英伟达 H200 芯片(基于 Hopper 架构)作为美国允许对华出口许可的封顶型号,是中国市场衡量算力代差的直接标杆。当前国内最先进的国产替代芯片以华为昇腾 910C(最新发布的双芯片级联合封旗舰)和寒武纪思元 590等为主。

国产主流旗舰芯片在“单卡纯算力”上已能达到 H200 的 50% ~ 80% 左右(部分特定指标基本持平),但在显存带宽、集群互联以及软件生态上面临较为明显的“系统级代差”。

1.核心硬件规格与理论性能对比

以下为英伟达 H200 与国内最主流国产替代旗舰(以华为昇腾 910C 为主要代表)的详细底层数据对比:

配图

(注:另一款代表芯片寒武纪思元 590 的 TPP 指标约为 29,360,整体单卡效能约为 H200 的 49%。)

2.核心代差与性能差距深度分析

1). 单卡计算性能:制程工艺导致的“架构效率差距”

英伟达 H200 凭借台积电先进的 4N 工艺,可以在单颗 Die 内塞入极高的晶体管密度,核心主频与算力极高。

国产芯片目前主要受限于先进制程缺失,只能采用“系统级工程创新”——例如将两颗 7nm 级别的芯片通过 2.5D 集成技术进行“双芯合封”来强行叠加算力。这导致国产单卡的 FP16 浮点算力虽提升到了 800 TFLOPS,但由于芯片架构的逻辑面积更大,在底层的计算转换效率上依然和 H200 存在近 2 倍的代差。

2). 大模型大集群性能:通信带宽与千卡线性度瓶颈

在大模型训练场景中,“单卡强”不等于“集群快”。

训练吞吐量差距: 在实际进行千亿参数大模型跨节点训练时,受限于显存带宽(3.2 TB/s vs 4.8 TB/s)和复杂的异构网络开销,国产芯片单卡的训练吞吐量往往降到 H200 的 1/3 甚至更低。

堆卡弥补短板: 国内厂商(如华为)目前采用的策略是“用系统级工程弥补单点制程”。通过自研的超节点技术(如将 384 颗 910C 组成超节点集群,实现 269TB/s 的全对等 UB 网络总带宽),国产集群在系统层面的网络利用率能提升到 45% ~ 55%,从而能够通过“更大规模的堆卡”来强行平替 H200 的总算力。

3). 最大的隐形壁垒:CUDA 与国产软件生态的“阵痛期”

英伟达的 CUDA 生态在全球拥有超 400 万开发者,几乎完美适配所有主流 AI 开源框架。大模型在 H200 上部署几乎可以“开箱即用”。

国产芯片主要依靠自研的底层异构计算架构(如华为 CANN、昇思 MindSpore)。虽然已适配绝大多数主流模型,但企业若将现有的英伟达开源代码和权重迁移至国产算力平台,通常面临 30% ~ 50% 的迁移工程成本,甚至在迁移早期会因为算子不兼容而出现 40% 左右的性能折损。

总结与产业现状

国产主流替代芯片目前已经完全摆脱了“不可用”的阶段,其单卡性能不仅超越了英伟达对华特供减配版芯片(如 H20),还基本实现了 H200 约六成的理论性能。在政企、央企以及金融机构等硬性国产化指标要求的场景中,国产芯片的租赁与采购粘性极高。但若要完全取代 H200 进行超大规模的万亿参数模型“原生训练”,国内企业仍需承担更高的整体总拥有成本(TCO)与代码重构成本。

五、巨大利益下的多方博弈

1.中美两国之间

中美关于对华出口高端AI芯片的博弈,本质上是国家地缘战略安全与产业科技主导权的终极拉锯:

美国政府(降速与遏制): 核心诉求是维持绝对的科技霸权。其利用“小院高墙”策略,通过不断收紧的算力与显存带宽红线,严厉封锁最尖端的AI芯片(如Blackwell系列)对华出口,试图以此延缓中国在前沿万亿参数大模型与军事AI领域的演进速度。近期更倾向于将出口许可作为筹码,通过对合规芯片(如H200)有条件解禁并加收分成,实施经济拉锯。

中国政府(突围与自立): 核心诉求是算力主权与产业链安全。面对外部极限施压,中国政府以“十五五”规划为战略导向,通过国资引导、财政补贴(如算力券)以及重组本土半导体供应链,倾国力加速先进制程及HBM显存的国产化突围。政策上坚决窗口指导国内企业减少对美特供减配芯片的依赖,全力催熟以华为昇腾为代表的本土AI算力生态,谋求长远的科技自立自强。

这场博弈已超越单纯的商业贸易,成为决定未来地缘政治、经济命脉及人机协同工业体系核心竞争力的战略长跑。

2.美国内部

在这场高端AI芯片的出口博弈中,三方核心利益针锋相对:

美国政府(控风险): 核心诉求是国家安全与技术封锁。通过设立严格的算力与密度双重红线,死守高端芯片(如H200、Blackwell)不对华出口,意图卡住中国前沿AI大模型的训练脖子。

英伟达(保市场): 核心利益是商业利润与全球市场份额。面对中国这一占其收入近两成的重要市场,英伟达通过“精准切蛋糕”的策略,卡在禁令红线边缘极限推出特供“减配版”芯片(如H20/B20),在合规前提下极力挽留中国客户,对冲禁令带来的财务损失。

云厂商(求生存): 美国云厂商(微软、亚马逊 AWS、谷歌)核心考量是平衡合规风险、中国市场收益与全球AI领先地位。它们不愿放弃中国跨国企业及本土AI创新者的庞大云算力市场。若完全断供,将面临巨大营收损失。 它们一方面积极游说美国政府,要求延长豁免期并放宽对中国香港、中国澳门及海外实体的“穿透限制”;另一方面,它们高度配合禁令,在云端严格实施“最终用户审查”,甚至开始加速研发自研芯片(如TPU/Trainium),以降低对英伟达芯片在出口监管及供应链上的双重依赖。。

三方在“国家安全、商业利益、自主可控”之间反复拉锯,正彻底重塑全球半导体供应链格局。

3.中国内部

在这场高端AI芯片的博弈中,国内三方核心力量在“自主可控、商业利润、算力生存”之间激烈拉锯:

中国政府(求自主): 核心诉求是国家算力安全与产业链独立。通过政策引导、国资采购硬性指标及资金扶持,全力推动国产化替代。限制或窗口指导国内企业过度购买美国减配芯片,意图倒逼本土产业合力攻克先进制程与软件生态瓶颈。

AI芯片商(争空间): 迎来历史性黄金窗口。以华为、寒武纪等为代表的本土厂商,正利用政策红利加速技术迭代。其核心利益是借由禁令红利强行切入主流市场,通过“硬件级联、软件适配”等系统工程创新挽留客户,拼死抢夺英伟达退出的生态真空区。

云厂商(求生存): 面临商业与技术的双重焦虑。阿里、腾讯、百度等云巨头商业化压力巨大,由于庞大的 CUDA 存量生态,它们短期内仍倾向于争取英伟达合规特供芯片以维持国际竞争力。面对国产化要求,云厂商采取“两头押注”策略,一边采购特供卡维持算力不中断,一边加大国产芯片的混合部署与代码重构,谋求长远安全。

这场博弈的核心矛盾在于政策推动的自主速度与企业商业利益对算力时效性要求之间的赛跑。

附:路透社新闻全文:

此事意义重大,凸显了中美科技竞争如今甚至波及已获批准的贸易,令这家全球市值最高、芯片市场主导地位的公司陷入了两国相互冲突的利益考量之中。

在美国收紧出口限制之前,英伟达占据了中国先进芯片市场约95%的份额。中国市场一度占其总收入的13%,黄仁勋此前曾估计,仅中国人工智能市场今年的规模就将达到500亿美元。

据消息人士透露,美国商务部已批准包括阿里巴巴(9988.HK)、腾讯(0700.HK)、字节跳动和京东(9618.HK)在内的约10家中国公司购买英伟达(NVDA.O)的H200芯片。由于事态敏感,这些消息人士要求匿名。

据称,包括联想(0992.HK)和富士康(2317.TW)在内的少数分销商也已获得批准。其中两位人士表示,买家可以直接从英伟达购买,也可以通过这些中间商购买,根据美国许可条款,每位获批客户最多可购买75,000颗芯片。

此前,获批买家的身份以及他们与英伟达和授权分销商之间关于这款备受追捧的AI芯片的关系均未见报道。

负责监管H200半导体等出口管制措施的美国商务部发言人拒绝置评。

中国工业和信息化部以及国家发展和改革委员会均未回应置评请求。

联想在发给路透社的一份声明中证实,该公司“是获准在中国销售H200芯片的几家公司之一,这是英伟达出口许可证的一部分”。

英伟达、阿里巴巴、腾讯、字节跳动、京东和富士康均未回应置评请求。

黄仁勋周四在接受中央电视台采访时表示,他希望特朗普和习近平在北京会谈期间能够巩固双方良好关系,从而改善双边关系。

尚未达成交易

一位消息人士称,尽管美国已批准,但由于北京方面发出指导意见,中国企业撤回了订单,因此交易陷入停滞。

该消息人士补充说,中国方面的转变部分原因是由于美国方面的变化,但具体变化尚不清楚。

另一位消息人士称,北京方面正面临越来越大的压力,要求阻止或严格审查这些订单。

商务部长霍华德·卢特尼克也表达了类似的观点。他上个月在参议院听证会上表示,“中国中央政府尚未允许他们购买芯片,因为他们正努力将投资集中在国内产业。”

北京的犹豫反映了一种战略考量,因为它担心进口会削弱其自主研发人工智能芯片的努力。尽管中国的人工智能芯片仍然落后于英伟达,但像DeepSeek这样的公司却越来越强调其对国产芯片的依赖,包括华为开发的芯片。

它们转向华为凸显了英伟达在中国岌岌可危的地位。黄永昌警告称,美国的出口管制正在侵蚀该公司在中国的市场地位,并表示其在中国人工智能加速器的市场份额实际上已经降至零。

棘手的条件

由于双方都提出了一系列复杂的要求,这笔交易的完成之路举步维艰。美国1月份发布的规定要求中国买家证明他们已经安装了“足够的安全措施”,并且不会将芯片用于军事用途。

英伟达还必须证明其在美国拥有足够的库存。

特朗普谈判达成了一项协议,根据该协议,美国将获得芯片销售收入的25%。由于美国法律不允许直接征收出口税,因此芯片必须先经过美国领土才能运往中国。

尽管有消息人士称,这项协议主要是为了规避法律限制,但北京方面仍对潜在的篡改或隐藏漏洞感到不安。

第四位消息人士称,国务院近期发布了两项供应链安全规定,促使中国政府开展全员行动,以识别和消除关键技术基础设施中潜在的外国依赖,此后,中国的审查力度也随之加大。

华盛顿的对华强硬派对这一持续的延迟表示欢迎,他们驳斥了特朗普政府关于此类销售将阻止中国竞争对手缩小与美国芯片设计商差距的说法。

“任何允许英伟达向中国出售更多芯片的协议,都意味着美国公司能买到的英伟达芯片数量减少,美国在人工智能领域对中国的领先优势也会缩小,”外交关系委员会中国与新兴技术高级研究员克里斯·麦奎尔表示。

“令人惊讶的是,特朗普总统竟然一次又一次地被说服,将英伟达的利益置于美国利益之上。”

路透社报道;金美英和什里·纳瓦拉特南编辑

加入社区 · 第一时间获取观点

评论

登录注册 后参与评论。