商傳媒|林昭衡/綜合外電報導
人工智慧(AI)領域的軍備競賽已從單純的模型智慧較量,演變為一場涵蓋硬體、運算、模型與應用層的全堆疊基礎設施之戰。業界普遍認為,單一環節的領先已不足以確保長期競爭力,企業必須垂直整合多個層面,才能在激烈的 AI 經濟中生存並創造新價值。
AI 堆疊通常包含四大關鍵層次:底層的硬體、負責執行運算的運算叢集、提供核心 AI 功能的模型層,以及直接面對用戶的應用層。過去,各公司可能專注於其中一層,但現今的趨勢是向上下游擴展,以保護利潤並掌握更多價值。例如,以模型開發為主的企業,為了降低成本並提升訓練能力,正被迫投入硬體和運算基礎設施的建設。
巨頭搶攻垂直整合強化競爭力
晶片龍頭輝達(Nvidia)在硬體層面仍佔據主導地位,提供昂貴的 AI 運算晶片。但為了確保硬體利用率並抵禦客製化應用特定積體電路(ASIC)的挑戰,輝達也於 2025 年底發布了完全開源的 Nemotron 3 模型套件。此舉旨在透過普及開源 AI 模型,刺激市場對實體運算硬體(GPU)的龐大需求,並最佳化 Nemotron 模型在自家晶片上的運行效率。
對模型業者而言,客製化硬體已成降低成本的關鍵。OpenAI 正與博通(Broadcom)合作,開發首款客製化 AI 推論晶片 Jalapeño,目標於 2026 年底前部署,以擺脫輝達 GPU 的高昂溢價。Anthropic 也面臨基礎設施瓶頸,與新興雲端供應商 FLUIDSTACK LTD 簽署了高達 500 億美元的基礎設施合作協議,共同在德州和紐約興建多千兆瓦數據中心。Anthropic 也每月支付 12.5 億美元給 SpaceX,以取得其 Colossus 超級電腦的運算能力。
從雲端到應用層的雙向擴展
由伊隆·馬斯克(Elon Musk)創辦的 AI 公司 xAI,則透過建造 Colossus 超級電腦,將母公司 SpaceX 轉變為超大規模雲端供應商,不僅自行掌握基礎設施,也將運算能力出租給其他產業參與者。SpaceX 於 2026 年 6 月更以 600 億美元的全股票交易,收購了程式編輯器 Cursor 的開發商 Anysphere。Cursor 透過處理數百萬次程式編寫會話,累積了龐大的使用者行為數據,並利用這些數據微調了開源模型 Kimi K2.5,開發出 Composer 2.5,降低對昂貴前沿 AI 應用程式介面(API)的依賴。這項收購案突顯了擁有龐大基礎設施的公司,正向上擴展至應用層,確保運算能力的出口。
傳統的超大規模雲端供應商如亞馬遜(Amazon)、微軟(Microsoft)和 Google,過去曾憑藉大規模運算能力吸引 AI 實驗室。如今,這些巨頭正積極地雙向擴展:向下整合晶片,向上整合軟體和模型。亞馬遜開發了客製化的 Trainium 和 Inferentia 晶片,強化 AWS(Amazon Web Services)在硬體層面的領先地位。微軟則將 AI 直接整合到企業工作流程中,並陸續發布了 Phi 系列開源模型和 MAI 閉源模型,為用戶提供更快速、更經濟的替代方案。
Google 是目前唯一同時在硬體(Tensor Processing Units, TPU)、運算平台(Google雲端平臺)、模型(Gemini 系列)和應用層(Gemini 應用程式、搜尋引擎、Workspace 套件)實現全面垂直整合的業者。其垂直整合模式創造了一個強大的「數據飛輪」,將應用層的使用者互動數據直接反饋給模型訓練管線,並在自家專有硬體上進行處理。
然而,Facebook公司(Meta)的經驗則顯示,即使擁有雄厚資金和龐大運算能力,若將基礎層(如 Llama 模型)開源給競爭對手,也可能導致優勢流失。由於競爭者利用其研究迅速趕上並超越其能力,Facebook公司已調整策略,於 2026 年 4 月發布了專有且完全閉源的多模態模型 Muse Spark,旨在專門用於商業變現。








