商傳媒|責任編輯/綜合外電報導
通用汽車(General Motors)資深軟體工程師藍加・拉亞・埃拉甘雷迪(Ranga Raya Eragamreddy)於 2025 年 11 月發表一項研究,提出多代理強化學習(MARL)框架,旨在協調大規模電動車隊,提升能源效率與電網感知能力。
該研究名為「雲端電動車能源系統中用於協調車隊管理的多代理強化學習」,結合人工智慧與先進能源系統工程,展示超過一萬輛電動車如何透過雲端平台即時學習、適應與優化。
隨著全球加速電氣化,管理電動車充電網路、電力網與車隊物流之間的互動,已成為現代運算中最複雜的優化挑戰之一。埃拉甘雷迪的研究透過由六個自主代理組成的協調AI系統來應對此挑戰,每個代理負責一個特定領域:充電排程器、路線優化器、電網平衡器、電池保護器、需求預測器和車隊調度員。
該系統採用集中式訓練分散式執行(CTDE)模型,這是一種AI學習模式,允許個別代理集體訓練,但獨立決策。埃拉甘雷迪設計的創新之處在於其基於注意力的通信機制,使這些代理能夠共享見解並協調一致的全球目標,而無需明確的規則編程。
多代理強化學習框架並非採用僵化的邏輯樹或單一AI模型,而是允許決策動態產生。在實際應用中,這意味著當電網壓力過大時,車輛可能會稍微延遲充電,因為透過代理間的協調,得知這種小小的權衡可以為電網帶來收入、保護電池健康,並且仍然可以滿足交付排程。
該框架並非僅經過模擬,而是在德州電力可靠性委員會(ERCOT)電力市場的生產環境中部署了 18 個月,管理 10,200 輛電動車,橫跨 3,400 個充電站。結果顯示,埃拉甘雷迪的多代理強化學習系統實現了平均每千瓦小時 4.06 英里的車隊能源效率,比現有的基於規則的系統提高了 26.1%。同時,每輛車的能源成本降低了近 40%(從每月 142 美元降至 86 美元),電池壽命延長了 48.8%,並且減少了 28% 的尖峰電網需求。
最值得注意的是,該系統每輛電動車每月產生 68 美元的車輛到電網(V2G)收入,顯示車隊可以成為主動的電網參與者,而不是被動的能源消費者。
效能基準測試進一步顯示,多代理框架的效能優於單代理強化學習模型 13.4%,優於獨立多代理系統 9.4%,其中僅協調就佔總效率提升的五分之一以上。
傳統的強化學習模型長期以來難以應對車隊能源管理的多面向性。正如埃拉甘雷迪的研究指出,「電動車隊優化不是一個問題,而是一系列相互關聯的問題。」單一代理系統試圖在一個統一的獎勵函數中平衡成本、電池健康和電網穩定性,不可避免地會陷入平庸,無法特別出色地處理任何一個目標。埃拉甘雷迪的方法聰明地分解了問題,使每個AI代理都能在其狹窄的領域中表現出色,同時在上下文中進行交流,以找到全局最佳解。
這種架構能夠實現複雜的突發行為:例如,如果電池保護器警告說更便宜的時段會增加磨損,並且電網平衡器識別出同時存在的需求響應機會,則充電代理可能會願意選擇稍微更高的電力時段。這些交互作用在學習框架內自動發生,埃拉甘雷迪將其描述為「協調推理來自集體智慧」。
在可擴展性測試中,該框架展示了接近線性的效能,最多可達 10 萬輛車,使其成為首批經驗證可在工業和城市車隊規模運作的AI驅動能源管理系統之一。在商業物流、公共運輸和共享乘車營運中的五個案例研究證實了跨領域的可行性。
產業分析師認為這項工作是雲端能源協調領域的一項突破,隨著電動車普及率的激增,雲端能源協調至關重要。透過將自主學習嵌入到雲端基礎設施中,埃拉甘雷迪的模型使未來的電網能夠動態理解車隊行為,從而減少尖峰時段的壓力並穩定再生能源的貢獻。
在通用汽車的創新生態系統中,這項研究強化了公司更廣泛的軟體定義車輛和智慧能源整合的戰略願景。它提供了一條途徑,讓車隊不僅消耗能源,而且可以主動幫助平衡和支援即時電網。
除了技術架構之外,還存在一個更大的願景:將電動運輸轉變為一個生機勃勃的學習生態系統。埃拉甘雷迪的研究——在範圍和影響上都是獨一無二的——展示了人工智慧如何充當車輛、電網和人類系統之間的連接組織。
透過整合多代理強化學習、雲端運算和分散式能源優化,他的工作代表了向更智慧、更清潔和更具彈性的運輸網路的關鍵轉變。隨著行動性進入下一個演進階段,藍加・拉亞・埃拉甘雷迪在 2025 年發表的研究是一項決定性的貢獻,它表明人工智慧在設計上如果旨在協作而非競爭,就可以協調世界上一些最複雜的能源系統。








