中國 DeepSeek V4 永久降價顛覆全球企業級 AI 市場

2026-05-30

商傳媒｜責任編輯／綜合外電報導

中國人工智慧（AI）公司 DeepSeek 近日宣布，旗下旗艦模型 V4 Pro 永久降價 75%，大幅降低企業使用成本。此舉不僅對 OpenAI 和 Anthropic 等美國主要 AI 業者構成直接競爭，更預示著企業級 AI 服務市場將迎來結構性變革，促使全球企業加速評估更具成本效益的 AI 解決方案。

根據《VentureBeat》報導，DeepSeek V4 Pro 模型在輸入成本上比 Anthropic 的 Claude Sonnet 或 OpenAI 的 GPT 5.5-Med 便宜 7 倍，輸出成本更便宜 17 倍。此外，輕量級的 DeepSeek V4 Flash 模型，相較於 Claude Haiku 等入門級替代方案，價格低了 10 至 25 倍。WEKA 首席 AI 官 Val Bercovici 指出，AI 代理程式使用的大部分是快取讀取 Token，而 DeepSeek V4 Pro 的快取讀取價格比西方模型便宜 87 倍，使其在成本效益上佔據壓倒性優勢。

DeepSeek 能夠實現如此大幅度的降價，主要歸因於其在軟硬體整合上的創新。早在 2024 年的 V2 架構中，DeepSeek 就已透過序列維度壓縮（Sequence Dimension Compression）、原生記憶體卸載（Native Memory Offloading）等四項突破性技術，大幅降低模型運行所需的記憶體與運算資源。例如，DeepSeek V4 Pro 僅需 5.48 GB 的高頻寬記憶體（HBM）即可處理一百萬個 Token 的上下文，相較之下，其他西方小型模型可能需要高達 89 GB。這項技術不僅提升效率，也被視為規避美國對輝達（Nvidia）頂級 GPU 出口限制的地緣政治策略。

在性能方面，DeepSeek V4 Pro 的表現已接近西方領先模型的水準。它在 SWE-bench Verified 編碼代理任務中取得 80.6% 的成績，並在 advancedMMLU-Pro 技術指標上達到 87.5% 的卓越推理分數。Ramp 的網路安全代理群體基準測試顯示，DeepSeek V4 Pro 在雲端組態分類等高負載基礎任務上，偵測率高達 100%，遠超 OpenAI 的 GPT-5.5 的 44%。

這波降價策略已開始影響市場動態。上週，DeepSeek V4 Flash 模型在 OpenRouter 排行榜上奪下首位，其 Token 使用量激增 48%，而 DeepSeek V4 Pro 也名列第六。包括 Uber、Airbnb 和 Pinterest 在內的企業，都曾因高昂的 Token 使用成本而尋求替代方案。Uber 一名主管表示，缺乏更好的產品展示，高昂的 Token 費用越來越難以證明其合理性；Airbnb 執行長 Brian Chesky 則傾向使用阿里巴巴（Alibaba）的 Qwen 等更快速、便宜的模型；Pinterest 技術長 Matt Madrigal 則透露，該公司透過在專有資料上訓練 Qwen 模型，將成本降低了 90%。

《VentureBeat》2026 年第一季的調查顯示，「單一 Token 成本或授權模式」從一月的 25.4% 躍升至三月的 36.7%，成為企業選擇 AI 模型的主要考量之一。安德里森·霍羅威茨（Andreessen Horowitz）的分析也指出，企業通常會同時部署 14 種不同的模型，以進行工作負載路由並避免單一廠商綁定。這種市場轉變對 OpenAI 構成巨大壓力，其營收組合高度依賴通用型 API 服務。為應對競爭，西方實驗室也已開始推出深度批次 API 折扣、提示快取功能和輕量級模型。

值得一提的是，DeepSeek V4 Pro 和 V4 Flash 均採開源（open-weight）模式，並在 MIT授權條款下發布，提供企業部署上的完全彈性。DeepSeek 也獲得中國國家積體電路產業投資基金等官方資金支持，估值達到 100 億至 450 億美元。除了 DeepSeek 的價格策略，中國科技巨擘騰訊（Tencent）旗下的 AI 助理 WorkBuddy 也正積極拓展全球市場，與矽谷科技公司爭奪 AI 助理領域的領導地位，顯示中國 AI 業者正全面性地挑戰西方科技巨頭。

儘管中國模型在西方市場面臨地緣政治挑戰與資安疑慮，對於台灣企業而言，DeepSeek V4 Pro 與 V4 Flash 提供的開源模型和極具競爭力的價格，可能成為加速導入人工智慧、優化營運成本的重要選項。尤其在大型語言模型日漸普及的背景下，高效能且低成本的解決方案，將有助於台灣企業在全球競爭中提升效率和創新能力。選擇開源架構也提供了企業在公有雲定價或 API 存取條件變化時，能保有戰略性的營運備援選項。