商傳媒|責任編輯/綜合外電報導
中國人工智慧(AI)公司 DeepSeek 近日宣布,旗下旗艦模型 V4 Pro 永久降價 75%,大幅降低企業使用成本。此舉不僅對 OpenAI 和 Anthropic 等美國主要 AI 業者構成直接競爭,更預示著企業級 AI 服務市場將迎來結構性變革,促使全球企業加速評估更具成本效益的 AI 解決方案。
根據《VentureBeat》報導,DeepSeek V4 Pro 模型在輸入成本上比 Anthropic 的 Claude Sonnet 或 OpenAI 的 GPT 5.5-Med 便宜 7 倍,輸出成本更便宜 17 倍。此外,輕量級的 DeepSeek V4 Flash 模型,相較於 Claude Haiku 等入門級替代方案,價格低了 10 至 25 倍。WEKA 首席 AI 官 Val Bercovici 指出,AI 代理程式使用的大部分是快取讀取 Token,而 DeepSeek V4 Pro 的快取讀取價格比西方模型便宜 87 倍,使其在成本效益上佔據壓倒性優勢。
DeepSeek 能夠實現如此大幅度的降價,主要歸因於其在軟硬體整合上的創新。早在 2024 年的 V2 架構中,DeepSeek 就已透過序列維度壓縮(Sequence Dimension Compression)、原生記憶體卸載(Native Memory Offloading)等四項突破性技術,大幅降低模型運行所需的記憶體與運算資源。例如,DeepSeek V4 Pro 僅需 5.48 GB 的高頻寬記憶體(HBM)即可處理一百萬個 Token 的上下文,相較之下,其他西方小型模型可能需要高達 89 GB。這項技術不僅提升效率,也被視為規避美國對輝達(Nvidia)頂級 GPU 出口限制的地緣政治策略。
在性能方面,DeepSeek V4 Pro 的表現已接近西方領先模型的水準。它在 SWE-bench Verified 編碼代理任務中取得 80.6% 的成績,並在 advancedMMLU-Pro 技術指標上達到 87.5% 的卓越推理分數。Ramp 的網路安全代理群體基準測試顯示,DeepSeek V4 Pro 在雲端組態分類等高負載基礎任務上,偵測率高達 100%,遠超 OpenAI 的 GPT-5.5 的 44%。
這波降價策略已開始影響市場動態。上週,DeepSeek V4 Flash 模型在 OpenRouter 排行榜上奪下首位,其 Token 使用量激增 48%,而 DeepSeek V4 Pro 也名列第六。包括 Uber、Airbnb 和 Pinterest 在內的企業,都曾因高昂的 Token 使用成本而尋求替代方案。Uber 一名主管表示,缺乏更好的產品展示,高昂的 Token 費用越來越難以證明其合理性;Airbnb 執行長 Brian Chesky 則傾向使用阿里巴巴(Alibaba)的 Qwen 等更快速、便宜的模型;Pinterest 技術長 Matt Madrigal 則透露,該公司透過在專有資料上訓練 Qwen 模型,將成本降低了 90%。
《VentureBeat》2026 年第一季的調查顯示,「單一 Token 成本或授權模式」從一月的 25.4% 躍升至三月的 36.7%,成為企業選擇 AI 模型的主要考量之一。安德里森·霍羅威茨(Andreessen Horowitz)的分析也指出,企業通常會同時部署 14 種不同的模型,以進行工作負載路由並避免單一廠商綁定。這種市場轉變對 OpenAI 構成巨大壓力,其營收組合高度依賴通用型 API 服務。為應對競爭,西方實驗室也已開始推出深度批次 API 折扣、提示快取功能和輕量級模型。
值得一提的是,DeepSeek V4 Pro 和 V4 Flash 均採開源(open-weight)模式,並在 MIT授權條款下發布,提供企業部署上的完全彈性。DeepSeek 也獲得中國國家積體電路產業投資基金等官方資金支持,估值達到 100 億至 450 億美元。除了 DeepSeek 的價格策略,中國科技巨擘騰訊(Tencent)旗下的 AI 助理 WorkBuddy 也正積極拓展全球市場,與矽谷科技公司爭奪 AI 助理領域的領導地位,顯示中國 AI 業者正全面性地挑戰西方科技巨頭。
儘管中國模型在西方市場面臨地緣政治挑戰與資安疑慮,對於台灣企業而言,DeepSeek V4 Pro 與 V4 Flash 提供的開源模型和極具競爭力的價格,可能成為加速導入人工智慧、優化營運成本的重要選項。尤其在大型語言模型日漸普及的背景下,高效能且低成本的解決方案,將有助於台灣企業在全球競爭中提升效率和創新能力。選擇開源架構也提供了企業在公有雲定價或 API 存取條件變化時,能保有戰略性的營運備援選項。







