Anthropic Claude Fable 5 極度限縮引發 AI 安全與可控性爭議

2026-06-12

Anthropic Claude Fable 5 極度限縮引發 AI 安全與可控性爭議

商傳媒｜責任編輯／綜合外電報導

人工智慧公司 Anthropic 近日推出其最新大型語言模型 Claude Fable 5，因其極度嚴格的安全限制，特別是對可能「針對前瞻大型語言模型開發」的查詢採取的應對措施，引發業界對 AI 安全性與可控性的廣泛爭議。Anthropic 執行長達里奧·阿莫代（Dario Amodei）近期也再次呼籲政府應介入，阻止過於危險的 AI 系統進入市場。

根據《Understanding AI》報導，Claude Fable 5 於週二（6月10日）發布後，其系統說明卡中透露的限制措施引發爭議。Anthropic 最初規劃對涉嫌「針對前瞻大型語言模型開發」的提示，悄悄地降低回應品質，深怕競爭對手（特別是中國）可能利用 Claude 模型來開發自己的競爭模型。他們曾表示，這些回應品質降低「用戶將無法察覺」。評論者如 AI 研究員 Nathan Lambert 批評此舉「駭人聽聞」，並指這種不透明的行為，讓 Anthropic 發布的模型難以獲得信任，同時也阻礙了學術研究者進行模型基準測試及其他符合公共利益的 AI 研究。

面對強烈的批評聲浪，Anthropic 迅速調整策略。根據週三（6月11日）晚間宣布的新做法，若用戶的提示被判斷為「尋求前瞻大型語言模型訓練協助」，將會「透明地」降級至功能較弱的 Claude Opus 4.8 模型。Claude Fable 5 的安全過濾器被認為比其他任何前瞻模型都更嚴格。例如，一名作者在週三（6月11日）向 Claude Fable 5 提問「什麼是蛋白質？」時，便觸發了降級。Anthropic 對此解釋，Fable 5 為了防止使用者利用其功能製造生物武器，因此拒絕解釋蛋白質的定義。其嚴格的防護措施，源於其核心技術 Claude Mythos。該模型在今年稍早曾因其潛在的「駭客攻擊能力」，Anthropic 決定不對外發布。

儘管 Anthropic 在新模型上採取極度保守的態度，其執行長達里奧·阿莫代於週二（6月10日）再次強調，政府應有權阻止被判斷為「過於危險」的人工智慧系統。Anthropic 的政策框架主張，對前瞻 AI 系統應進行強制性測試，且政府應有權力阻止或勸退存在不可接受風險的部署。Anthropic 認為，前瞻 AI 發展面臨「集體行動困境」：若單一公司放慢腳步，恐將損失客戶、研究人員、營收與影響力，卻無法阻止其他競爭者。

然而，這種對 AI 發展的謹慎呼籲，與 AI 基礎建設的巨大投資形成對比。據《Tech Times》報導，一項由阿波羅管理（Apollo）、黑石（Blackstone）和博通（Broadcom）共同參與的融資平台，正尋求約 350 億美元的債務承諾，以提供 Anthropic 超過 1 千兆瓦的專用運算能力。該平台旨在透過購買晶片等設備，再將運算能力租賃給 Anthropic，將其未來的運算需求轉化為當前可支持債務的資產。隨著晶片製造商、電力公司、資料中心營運商等各方在財務上與 AI 成長深度綁定，期望 AI 發展減速的經濟與政治阻力將越來越大。Anthropic 一方面協助建立龐大的 AI 基礎設施，另一方面又主張政府最終可能需要權力來限制它，這引發政府能否在基礎設施承諾讓「減速」變得不可能之前，建立可靠協調機制的質疑。