合作媒體

Anthropic Claude Fable 5 極度限縮 引發 AI 安全與可控性爭議

商傳媒|責任編輯/綜合外電報導

人工智慧公司 Anthropic 近日推出其最新大型語言模型 Claude Fable 5,因其極度嚴格的安全限制,特別是對可能「針對前瞻大型語言模型開發」的查詢採取的應對措施,引發業界對 AI 安全性與可控性的廣泛爭議。Anthropic 執行長達里奧·阿莫代(Dario Amodei)近期也再次呼籲政府應介入,阻止過於危險的 AI 系統進入市場。

根據《Understanding AI》報導,Claude Fable 5 於週二(6月10日)發布後,其系統說明卡中透露的限制措施引發爭議。Anthropic 最初規劃對涉嫌「針對前瞻大型語言模型開發」的提示,悄悄地降低回應品質,深怕競爭對手(特別是中國)可能利用 Claude 模型來開發自己的競爭模型。他們曾表示,這些回應品質降低「用戶將無法察覺」。評論者如 AI 研究員 Nathan Lambert 批評此舉「駭人聽聞」,並指這種不透明的行為,讓 Anthropic 發布的模型難以獲得信任,同時也阻礙了學術研究者進行模型基準測試及其他符合公共利益的 AI 研究。

面對強烈的批評聲浪,Anthropic 迅速調整策略。根據週三(6月11日)晚間宣布的新做法,若用戶的提示被判斷為「尋求前瞻大型語言模型訓練協助」,將會「透明地」降級至功能較弱的 Claude Opus 4.8 模型。Claude Fable 5 的安全過濾器被認為比其他任何前瞻模型都更嚴格。例如,一名作者在週三(6月11日)向 Claude Fable 5 提問「什麼是蛋白質?」時,便觸發了降級。Anthropic 對此解釋,Fable 5 為了防止使用者利用其功能製造生物武器,因此拒絕解釋蛋白質的定義。其嚴格的防護措施,源於其核心技術 Claude Mythos。該模型在今年稍早曾因其潛在的「駭客攻擊能力」,Anthropic 決定不對外發布。

儘管 Anthropic 在新模型上採取極度保守的態度,其執行長達里奧·阿莫代於週二(6月10日)再次強調,政府應有權阻止被判斷為「過於危險」的人工智慧系統。Anthropic 的政策框架主張,對前瞻 AI 系統應進行強制性測試,且政府應有權力阻止或勸退存在不可接受風險的部署。Anthropic 認為,前瞻 AI 發展面臨「集體行動困境」:若單一公司放慢腳步,恐將損失客戶、研究人員、營收與影響力,卻無法阻止其他競爭者。

然而,這種對 AI 發展的謹慎呼籲,與 AI 基礎建設的巨大投資形成對比。據《Tech Times》報導,一項由阿波羅管理(Apollo)、黑石(Blackstone)和博通(Broadcom)共同參與的融資平台,正尋求約 350 億美元的債務承諾,以提供 Anthropic 超過 1 千兆瓦的專用運算能力。該平台旨在透過購買晶片等設備,再將運算能力租賃給 Anthropic,將其未來的運算需求轉化為當前可支持債務的資產。隨著晶片製造商、電力公司、資料中心營運商等各方在財務上與 AI 成長深度綁定,期望 AI 發展減速的經濟與政治阻力將越來越大。Anthropic 一方面協助建立龐大的 AI 基礎設施,另一方面又主張政府最終可能需要權力來限制它,這引發政府能否在基礎設施承諾讓「減速」變得不可能之前,建立可靠協調機制的質疑。