解禁英偉達H20晶片對華出口 美國背後另有盤算?
在事先沒有風聲的情形下,Nvidia(英偉達)(美:NVDA)針對中國市場而設計的「特供版」人工智能(AI)晶片H20,突然獲得美國政府放行,將可以重新對中國出口。據媒體報道,這消息一出,除了引來中國的大型科網企業爭相訂購之外,也令中國的AI晶片商被殺個措手不及。有分析認為,特朗普政府此舉未必是單純為了改善對華關係,背後可能有多重計算。
換取中國放寬稀土磁鐵出口
Nvidia共同創辦人兼行政總裁黃仁勳4月份今年第二度訪問中國時,未有穿上其標誌性的皮褸,似乎看來悶悶不樂。但在本月中的盛夏今年第三度訪問中國時,他卻重新穿上其經典的皮褸戰衣,眉宇間更難掩喜悅之情。這是因為,Nvidia在7月14日晚間宣布,正在向美國政府提出申請,以恢復向中國企業銷售H20晶片,並相信很快就會獲得出口許可證。據報道,美國政府其實早在7月上旬已經通知Nvidia,將會對H20晶片出口中國重開綠燈,故黃仁勳在出發前幾日已經得知好消息。
不過,大多數分析都認為,特朗普政府此舉並非單純為了改善對華關係,背後可能更多是深層次和精密的計算。據路透社報道,美國商務部長盧特尼克在7月15日公開承認,讓Nvidia恢復對中國銷售H20晶片,是中美兩國稀土談判的一部分。盧特尼克指出:「我們把這一點寫入了與(稀土)磁鐵相關的貿易協議中。」但他未有進一步說明協議的具體內容。很明顯,這看來和Nvidia對特朗普政府的游說工作關係不大,主要還是因為中國在4月對7類中重稀土相關物項開始實施出口管制措施的博弈結果。
或拖慢國產替代計劃進度
此外,H20晶片重新獲准對中國出口,除了引來中國的大型科網企業爭相訂購之外,也令到中國的AI晶片商被殺個措手不及。有報道表示,騰訊(0700)和字節跳動等多家中國大型科網企業正在申請採購H20晶片,但字節跳動對此否認。更重要的是,中國推動的國產替代計劃,進度可能會出現逆轉。
據悉,Nvidia在中國AI晶片市場的佔有率,在2022年曾經高達95%。但因為美國政府其後多次限制對中國出口AI晶片的性能,Nvidia近月在中國AI晶片市場的佔有率已大跌至50%。而國產AI晶片商則借勢崛起,其中,華為的「昇騰910B」晶片在DeepSeek一體機市場的佔有率,一度超過了70%。
今年第一季,寒武紀(滬:688256)的營收亦大增至11.11億元人民幣,盈利3.55億元人民幣,扭轉了連續虧損的情形。至於沐曦股份和摩爾線程等其他AI晶片初創企業,亦在訂單激增的情形下加快推動上市進程。某程度來說,Nvidia的H20晶片突然獲得解禁的消息,就有如一盆冷水淋向原先正在升溫的國產AI晶片市場。
H20算力約為H100兩成
有內地評論員認為,美國重新批准H20晶片對中國出口為精心設計的措施,短期內好像對內地企業有好處;但同時亦可以對中國的AI技術發展速度維持住一定程度的控制,拖慢中國建立自身的AI生態系統。他們有這樣的結論,主要是基於H20晶片的設計。一般認為,H20晶片的整體性能大約只是H100晶片的20%,最理想也不過是約30%至33%。其中,H20的FP16浮點運算性能只是148 TFLOPS,而H100的FP16浮點運算性能高達989.4 TFLOPS。換言之,H20只相當於H100的大約15%。此外,H20的NVLink頻寬亦大幅降低至400GB/s,比H100的900GB/s低了約55.6%,更加完全刪除了Transformer Engine(TE)。
這種「閹割版」設計雖然保持了驅動AI大模型的推理能力,卻大幅降低了訓練AI大模型的能力。因為單枚H20晶片的運算能力遠低於H100晶片;但互連頻寬的降低又意味?即使採用多枚H20晶片來代替一枚H100晶片,系統訓練AI大模型的能力仍然會受到很大掣肘。
現時,國內外龍頭企業訓練AI大模型所需的AI晶片單集群規模已經上升至萬卡級別,並逐漸邁向10萬卡的水平。例如,xAI為了支援其人工智能模型Grok的開發和訓練,初期配備了10萬枚H100晶片,今年2月更增加至20萬枚。
使用數以萬計的AI晶片來訓練AI大模型,就像有成千上萬人協同工作,需要快速的數據交換。低互連頻寬將會導致溝通緩慢,思維效率低下。所以實際上,內地企業無法或很難使用H20晶片來訓練超大型人工智能語言模型,尤其是上萬億個參數者,這正是美國政府目的所在。一名中國軟件工程師形容,H20好像一輛擁有強大V12引擎的法拉利,但輸油管、變速箱和車輪全部被降級,令這輛法拉利只能在直路上正常行駛,持續加速或者急轉彎的性能受到限制。