合作媒體

TestMu AI強化代理測試平台 助企業驗證AI系統可靠性

商傳媒|葉安庭/綜合外電報導

AI品質工程平台TestMu AI於昨(24)日宣布,其代理對代理(Agent-to-Agent)測試平台已大幅強化,旨在提供企業更先進的工具,以深入且自動化的方式,在真實情境中驗證AI代理的效能與可靠度。此更新對於軟體測試工程師、AI開發者與科技專案管理者而言,尤其重要,因其直接解決了當前AI系統在複雜環境下測試的挑戰。

TestMu AI指出,隨著AI代理(例如聊天機器人、語音助理和混合式對話系統)日益普及並應用於關鍵任務服務,傳統的靜態腳本測試已不足以確保其安全性、公平性與營運韌性。為此,本次平台更新引入了多項核心功能,包括「自主多代理情境生成」,透過專門的AI評估器,自動產生多元且豐富的測試情境,以模擬真實使用者互動與智慧對抗行為。

此外,平台現在支援「豐富多模態測試」,能全面驗證AI代理在語音、混合輸入及各式真實世界情境下的表現。同時,系統會自動評估「全面品質指標」,涵蓋精確度、意圖識別、偏見偵測、幻覺辨識、安全合規性及對話一致性等多個維度。在執行效率方面,「無縫高效能運算級執行」整合TestMu AI的HyperExecute基礎設施,可在數分鐘內大規模平行運行數千個代理測試情境,並提供「可操作的診斷洞察」以協助團隊分析效能。

TestMu AI共同創辦人暨產品負責人Mayank Bhola表示:「我們看到市場迫切需要超越靜態腳本的下一代測試策略。AI代理正驅動著當前的關鍵任務服務,透過這些強化功能,TestMu AI協助團隊不僅驗證智慧系統的正確性,更確保其安全性、公平性與營運韌性。」

這些擴展的代理對代理測試功能已立即開放給TestMu AI現有客戶與試用者使用。組織可透過TestMu AI主控台配置並執行代理評估,並將結果無縫整合至其持續整合與持續部署(CI/CD)流程中。TestMu AI(前身為LambdaTest)作為全棧式代理式AI品質工程平台,旨在為網路、行動與企業應用程式提供端到端的AI代理測試解決方案。