商傳媒|責任編輯/綜合外電報導
中國人工智慧(AI)新創公司北京智譜華章科技有限公司近期發布了開源大型語言模型 GLM-5.2,該模型專為長時間編程任務和「代理工作流程」(agentic workflows)設計,擁有 100 萬個 Token(標記)的「上下文窗口」(context window,指模型能夠同時處理和理解的文字範圍),能力足以媲美美國 Anthropic 公司的 Claude Opus 4.8 以及 OpenAI 的 GPT 5.5 模型。
GLM-5.2 的開源特性,意味著任何個人或企業都可以下載、操作並修改這套系統,與美國主流 AI 公司如 OpenAI 和 Anthropic 通常採用的封閉式模型形成鮮明對比。這種策略讓中國 AI 模型在美國和歐洲以外的市場,因其成本較低而受到更多青睞,採用率也隨之提升。Vercel 執行長 Guillermo Rauch 對 GLM-5.2 的編程能力感到「極為驚豔,甚至震驚」,而曾任 Meta、Google DeepMind 和微軟高階主管的 Matt Velloso 則表示,這是「第一個達到日常使用標準的開源模型」。
然而,中美兩國在 AI 領域的競爭日益激烈。美國試圖透過晶片限制和存取控制來維持其技術優勢,中國企業則積極推動更經濟實惠且功能日益強大的開源模型。Anthropic 日前曾指控中國 AI 公司 DeepSeek、月之暗面和 MiniMax 進行「工業規模的知識蒸餾攻擊」(distillation attacks,指利用更強大的 AI 模型來訓練較小的「學生」模型),聲稱這些公司創建了 2.4 萬個假帳號,與其 Claude 模型進行 1,600 萬次互動,並以此來訓練自己的模型,此舉違反了 Anthropic 的服務條款。據外媒報導,美國認為 DeepSeek 涉嫌使用輝達(Nvidia)最新一代 Blackwell AI 晶片訓練其 V4 模型,可能違反了美國旨在阻止中國 AI 公司取得先進晶片的出口管制規定。美國方面認為 DeepSeek 在內蒙古自治區設有數據中心,內部充滿 Blackwell 晶片,但其取得方式仍不明。
儘管中國在 AI 晶片國產化方面,主要仰賴華為等企業的努力,但目前看來,在性能上仍未能完全趕上輝達的 Blackwell 晶片。為此,美國白宮也在和平隊(U.S. Peace Corps)框架下啟動一項「科技兵團」計畫,旨在向參與美國 AI 出口計畫的國家派遣具備技術技能的美國志工,以推廣美國的人工智慧系統,並抗衡中國在開發中市場日益增長的影響力。早在 2025 年 1 月,DeepSeek 發布的 R1 低成本推理模型便已引起矽谷關注,被視為對 OpenAI 的 o1 模型構成挑戰,預示著中國在 AI 領域的崛起。







