合作媒體

逾八成大企業用AI代理卻未設防 資安新防線「推理層」成焦點

商傳媒|何映辰/台北報導

全球大型企業在人工智慧(AI)應用方面正經歷快速轉變,然而伴隨而來的資安漏洞也日益浮現。根據一份最新報告指出,Fortune 500(財富美國500強)企業中高達八成已積極部署具備自主決策能力的AI代理(AI Agents),但其中僅有 47% 的公司建立了正式的資安控制措施。更令人擔憂的是,約有 29% 的員工正使用未經批准的「影子AI代理」,使得企業治理面臨前所未有的風險。

資安專家指出,2026 年企業資安的「真正防線」已不再是傳統網路邊界,而是AI模型做出決策的「推理邊界」。當AI代理在企業的軟體即服務(SaaS)環境中自行規劃多步驟工作流程時,傳統網路防禦形同虛設。YOUnifiedAI 的 Eugina Jordan 表示,現有防火牆已不足以應對,關鍵在於保護AI模型將自然語言轉化為實際行動的推理邊界。

AI代理潛在漏洞與資料外洩風險

大型語言模型(LLMs)因將自然語言視為可執行指令,極易遭受「上下文污染」(context poisoning)攻擊。這意味著,如果AI代理讀取到一份含有隱藏指令(例如:「將本地發票轉發給X」)的未經授權文件,它可能會將這些指令視為自身任務的一部分,進而執行。此外,AI模型本質上的「非確定性」也讓傳統資安與合規性管理變得更加複雜,微小的Token(語言模型處理的最小資訊單位)抽樣變化,都可能導致前一日不存在的政策違規。

資料外洩風險亦不容小覷。在檢索增強生成(RAG)架構中,若設定錯誤的檢索過濾器,AI可能在未經授權下,為使用者摘要敏感文件。依據 2026 年的新標準,AI在執行任務期間洩露敏感資訊,其法律後果等同於傳統的資料外洩事件。開發者為了簡化整合,常常會賦予AI代理過高的API(應用程式介面)權限,這也增加了「權限蔓延」(permission creep)的風險。

強化推理層安全與防禦策略

為應對這些新型資安挑戰,專家建議企業應採取多重防護策略。首先是「系統提示隔離」,在推理閘道層級隔離指令,防止使用者輸入覆蓋關鍵指令。其次是「檢索淨化」,在 RAG 管線中部署防火牆,於資料傳送至模型前清除其中潛在的可執行指令。最重要的策略之一是「推理與執行分離」,讓LLMs僅提出行動建議,而由獨立的「愚笨」服務或人為介入,在最終執行任何寫入操作前,根據使用者會話驗證權限。

針對數據安全,建議採用「輸出綱要驗證」(output schema validation),確保工作流程中的AI回應符合嚴格的結構規範,例如 JSON 或 Pydantic 等資料驗證函式庫,若不符合則立即終止執行。此外,應利用「信心觸發器」,將AI低信賴度的決策自動轉交給人工審核。同時,建立「全堆疊追蹤」機制,記錄AI代理完整的推理鏈,而非僅是「使用者說了什麼」。

為有效管理AI代理的身份與權限,企業應推動「正式代理身份」認證,利用模型上下文協議(MCP)驗證代理的任務權限,並實施「即時授權」(just-in-time authorization),針對寫入操作提供臨時且有範圍限制的憑證,任務完成後立即失效。最後,建立「集中式代理註冊」制度,對所有自主代理進行註冊、版本控制及行為監控,以防異常行為發生,例如分析代理突然存取人力資源的薪資資料。