微軟MAI-Image-2模型亮相力求圖像更真實並解決文字生成痛點

2026-03-25

商傳媒｜葉安庭／綜合外電報導

微軟（Microsoft）今日發表其最新自主開發的文字轉圖像模型「MAI-Image-2」，強調大幅提升影像真實感，並旨在簡化創意工作流程。這項新模型是基於先前的MAI-Image-1進行改進，將逐步整合至微軟旗下的Copilot與Bing Image Creator等產品中。

MAI-Image-2主要專注於生成更具自然光影、精準膚色及逼真環境的圖像。微軟表示，新模型的目標是為創作者提供「感覺真實存在於現實世界」的視覺內容，從而減少後期製作所需的編輯時間。開發團隊在過程中與攝影師、設計師及視覺創作者合作，解決了先前系統在真實性和一致性方面的問題。

MAI-Image-2最顯著的突破之一是解決了圖像生成模型長期以來難以生成清晰、連貫文字的痛點。此模型現在能更準確地產出包含文字元素的視覺內容，例如海報、資訊圖表和投影片等，這項強化對於行銷與設計工作流程尤為重要。

微軟指出，MAI-Image-2的推出已使其MAI模型家族在Arena.ai的排名中躍升至前三名。儘管取得顯著進展，微軟亦坦言，該模型在Arena.ai的評比中仍略遜於Google和OpenAI的競爭對手。微軟人工智慧部門執行長穆斯塔法·蘇萊曼（Mustafa Suleyman）表示，公司在模型與產品方面已取得重大進展，預計未來將有更多新產品問世。

目前，MAI-Image-2已透過MAI Playground平台開放使用，並正逐步導入Copilot與Bing Image Creator。部分企業客戶可透過應用程式介面（API）存取此模型，未來也預期將透過Foundry提供更廣泛的開發者使用權限。不過，微軟尚未公布MAI-Image-2將在全球所有服務中全面推出的具體時間表。