合作媒體

中國AI公司DeepSeek傳規避美晶片禁令,用Nvidia Blackwell訓練模型

商傳媒|責任編輯/綜合外電報導

儘管美國實施嚴格的晶片出口管制,總部位於杭州的中國人工智慧(AI)新創公司 DeepSeek 傳出使用 Nvidia 最新 Blackwell 架構晶片訓練其即將推出的旗艦模型。美國政府官員於 2 月 23 日透露此消息,在華盛頓引發震盪。

Blackwell 晶片是 Nvidia 最新的高階 GPU(圖形處理器)架構,目前受到美國出口禁令限制,未授權運往中國。據美國情報部門消息,DeepSeek 取得這些高階晶片並非透過政策漏洞,而是透過複雜的管道規避貿易管制。

據報導,這些 Blackwell 處理器集中在中國北部內蒙古自治區的大型資料中心。調查人員認為,這些晶片是透過複雜的「灰色市場」網絡取得,該網絡涉及多家空殼公司和重複交易,繞過 Nvidia 的官方經銷管道。

美國官員表示,DeepSeek 可能正試圖從其系統中清除技術指標和元數據,以隱藏使用美國硬體進行訓練的痕跡。

DeepSeek 以「事半功倍」著稱。該公司先前已利用受制裁的 H800 晶片,以低於 600 萬美元的成本,實現了與 GPT-4o 相當的性能。DeepSeek-R1 模型則優化了較低的運算能力,證明高階推理並不需要 H100 晶片。據悉,DeepSeek 即將推出的新模型預計將於下週發布,並將利用被禁硬體推動「前沿」發展。

除了硬體取得問題,美國官員也呼應了 Anthropic 和 OpenAI 近期的說法,指出 DeepSeek 最新的模型可能依賴知識蒸餾(distillation),也就是利用 Claude 和 GPT-4 等西方模型的高品質推理輸出進行訓練。美國政府擔憂,DeepSeek 正透過結合「竊取」的高階硬體(Blackwell)與「竊取」的推理數據(知識蒸餾),繞過美國出口管制旨在保護的、長達十年的 AI 領先優勢。

此消息在美國政府內部引發激烈辯論:鷹派人士提議「全面禁止」任何與 AI 相關的出口,並可能將允許中國實體遠端租用 GPU 算力的雲端供應商列入黑名單。而白宮 AI 沙皇 David Sacks 和 Nvidia 執行長黃仁勳先前曾表示,出口略為「縮減」的晶片,實際上可能會阻止中國企業建立自己的替代方案(如華為的 Ascend 920B)。

前國家安全委員會官員 Chris McGuire 表示:「這表明向中國出口任何 AI 晶片是多麼危險。鑒於中國領先的 AI 公司公然違反美國出口管制,我們顯然不能期望他們會遵守美國的條件。」此事件可能促使美國重新評估對中國的晶片出口政策,並可能加劇美中科技戰。

美國的晶片禁令旨在阻止中國在 AI 和其他關鍵技術領域取得進展。然而,DeepSeek 事件顯示,中國公司可能正在尋找方法繞過這些限制。這對全球 AI 發展產生多重影響,包括刺激中國本土晶片產業發展,以及加速 AI 技術的全球擴散。此事件也突顯了在實施出口管制時,需要不斷調整策略以應對規避行為。