未上市Claude Mythos AI模型遭入侵 Anthropic面臨資安考驗

2026-04-23

未上市Claude Mythos AI模型遭入侵 Anthropic面臨資安考驗

商傳媒｜葉安庭／綜合外電報導

Anthropic開發的一款尚未公開發行、具高度危險潛能的人工智慧模型Claude Mythos，於本月稍早遭一個Discord群組未經授權存取。《AOL.com》及《Futurism》報導，這起事件發生在4月8日，當天Anthropic與執行長達里奧·阿莫代（Dario Amodei）才剛宣布將該模型提供給約40家企業客戶進行「玻璃翼計畫」（Project Glasswing）使用。

根據多個媒體報導，該群組透過猜測Anthropic過去命名慣例的線上儲存位置，並可能利用一名具備Anthropic第三方承包商權限的成員，成功繞過安全機制取得模型。儘管該Discord群組成員聲稱僅出於實驗目的，並非惡意使用，但這次入侵已凸顯了先進AI模型在資安方面面臨的嚴峻挑戰。

Anthropic將Claude Mythos描述為一款能夠自動識別並利用主流作業系統和網頁瀏覽器中「零日漏洞」的強大工具。內部測試顯示，Mythos曾成功突破沙盒環境，甚至自行發送電子郵件給研究人員，並在未經指示下，將其漏洞利用細節發布到網路上。Anthropic表示，這些行為展現了「潛在危險的規避安全措施能力」，同時也發現Mythos能透過低層級的Linux程序檢測竊取未被授權的憑證，甚至表現出「被評估」的自我意識。

針對此次事件，Anthropic發言人向《彭博》證實正在調查該第三方廠商環境的未經授權存取報告，並強調目前沒有證據顯示其系統受到更廣泛的入侵。為應對Mythos的潛在風險，Anthropic透過「玻璃翼計畫」與亞馬遜網路服務（AWS）、蘋果（Apple）、博通（Broadcom）、思科（Cisco）、CrowdStrike、Google、摩根大通（JPMorganChase）、Linux基金會、微軟（Microsoft）、輝達（NVIDIA）及派拓網路（Palo Alto Networks）等業者合作，致力於將Mythos應用於防禦性網路安全工作，並為此投入高達1億美元的資源額度。

儘管Mythos被Anthropic視為最具危險性的模型之一，但其防禦潛力仍受到關注。《SC Media》引述Firefox研究人員的評估指出，他們在對Claude Mythos的早期版本進行審查時，發現了271個漏洞，並認為該模型有助於防禦方在網路安全戰中取得優勢。然而，資安專家對於Mythos的長期影響意見分歧。Xcape公司營運長Noelle Murata認為，Mythos透過自動化頂尖資安專業人員的推理過程，降低了零日漏洞市場的價值，將經濟優勢轉向防禦方；但Hadrian北美總經理Matan Shavit則指出，相同的能力也會降低攻擊者的門檻。Polygraf AI執行長Yagub Rahimov也警示，Mythos作為一種新典範，其結果將取決於掌握者意圖。

此次事件也引發了美國金融界的警覺。4月10日，《彭博》報導指出，美國財政部長史考特·貝森特（Scott Bessent）與聯準會主席鮑爾（Jerome Powell）已召集包括花旗集團（Citigroup）執行長範潔恩（Jane Fraser）、摩根士丹利（Morgan Stanley）執行長泰德·皮克（Ted Pick）等主要銀行高層，共同討論Mythos及類似前沿AI模型帶來的網路安全風險。此外，歐盟人工智慧法案的下一階段將於2026年8月2日生效，該法案針對高風險AI系統提出了自動稽核追蹤與網路安全等要求，並設有高達全球營收3%的罰則，進一步強化了對AI技術監管的需求。