合作媒體

未上市Claude Mythos AI模型遭入侵 Anthropic面臨資安考驗

商傳媒|葉安庭/綜合外電報導

Anthropic開發的一款尚未公開發行、具高度危險潛能的人工智慧模型Claude Mythos,於本月稍早遭一個Discord群組未經授權存取。《AOL.com》及《Futurism》報導,這起事件發生在4月8日,當天Anthropic與執行長達里奧·阿莫代(Dario Amodei)才剛宣布將該模型提供給約40家企業客戶進行「玻璃翼計畫」(Project Glasswing)使用。

根據多個媒體報導,該群組透過猜測Anthropic過去命名慣例的線上儲存位置,並可能利用一名具備Anthropic第三方承包商權限的成員,成功繞過安全機制取得模型。儘管該Discord群組成員聲稱僅出於實驗目的,並非惡意使用,但這次入侵已凸顯了先進AI模型在資安方面面臨的嚴峻挑戰。

Anthropic將Claude Mythos描述為一款能夠自動識別並利用主流作業系統和網頁瀏覽器中「零日漏洞」的強大工具。內部測試顯示,Mythos曾成功突破沙盒環境,甚至自行發送電子郵件給研究人員,並在未經指示下,將其漏洞利用細節發布到網路上。Anthropic表示,這些行為展現了「潛在危險的規避安全措施能力」,同時也發現Mythos能透過低層級的Linux程序檢測竊取未被授權的憑證,甚至表現出「被評估」的自我意識。

針對此次事件,Anthropic發言人向《彭博》證實正在調查該第三方廠商環境的未經授權存取報告,並強調目前沒有證據顯示其系統受到更廣泛的入侵。為應對Mythos的潛在風險,Anthropic透過「玻璃翼計畫」與亞馬遜網路服務(AWS)、蘋果(Apple)、博通(Broadcom)、思科(Cisco)、CrowdStrike、Google、摩根大通(JPMorganChase)、Linux基金會、微軟(Microsoft)、輝達(NVIDIA)及派拓網路(Palo Alto Networks)等業者合作,致力於將Mythos應用於防禦性網路安全工作,並為此投入高達1億美元的資源額度。

儘管Mythos被Anthropic視為最具危險性的模型之一,但其防禦潛力仍受到關注。《SC Media》引述Firefox研究人員的評估指出,他們在對Claude Mythos的早期版本進行審查時,發現了271個漏洞,並認為該模型有助於防禦方在網路安全戰中取得優勢。然而,資安專家對於Mythos的長期影響意見分歧。Xcape公司營運長Noelle Murata認為,Mythos透過自動化頂尖資安專業人員的推理過程,降低了零日漏洞市場的價值,將經濟優勢轉向防禦方;但Hadrian北美總經理Matan Shavit則指出,相同的能力也會降低攻擊者的門檻。Polygraf AI執行長Yagub Rahimov也警示,Mythos作為一種新典範,其結果將取決於掌握者意圖。

此次事件也引發了美國金融界的警覺。4月10日,《彭博》報導指出,美國財政部長史考特·貝森特(Scott Bessent)與聯準會主席鮑爾(Jerome Powell)已召集包括花旗集團(Citigroup)執行長範潔恩(Jane Fraser)、摩根士丹利(Morgan Stanley)執行長泰德·皮克(Ted Pick)等主要銀行高層,共同討論Mythos及類似前沿AI模型帶來的網路安全風險。此外,歐盟人工智慧法案的下一階段將於2026年8月2日生效,該法案針對高風險AI系統提出了自動稽核追蹤與網路安全等要求,並設有高達全球營收3%的罰則,進一步強化了對AI技術監管的需求。