合作媒體

微軟MAI-Image-2模型亮相 力求圖像更真實並解決文字生成痛點

商傳媒|葉安庭/綜合外電報導

微軟(Microsoft)今日發表其最新自主開發的文字轉圖像模型「MAI-Image-2」,強調大幅提升影像真實感,並旨在簡化創意工作流程。這項新模型是基於先前的MAI-Image-1進行改進,將逐步整合至微軟旗下的Copilot與Bing Image Creator等產品中。

MAI-Image-2主要專注於生成更具自然光影、精準膚色及逼真環境的圖像。微軟表示,新模型的目標是為創作者提供「感覺真實存在於現實世界」的視覺內容,從而減少後期製作所需的編輯時間。開發團隊在過程中與攝影師、設計師及視覺創作者合作,解決了先前系統在真實性和一致性方面的問題。

MAI-Image-2最顯著的突破之一是解決了圖像生成模型長期以來難以生成清晰、連貫文字的痛點。此模型現在能更準確地產出包含文字元素的視覺內容,例如海報、資訊圖表和投影片等,這項強化對於行銷與設計工作流程尤為重要。

微軟指出,MAI-Image-2的推出已使其MAI模型家族在Arena.ai的排名中躍升至前三名。儘管取得顯著進展,微軟亦坦言,該模型在Arena.ai的評比中仍略遜於Google和OpenAI的競爭對手。微軟人工智慧部門執行長穆斯塔法·蘇萊曼(Mustafa Suleyman)表示,公司在模型與產品方面已取得重大進展,預計未來將有更多新產品問世。

目前,MAI-Image-2已透過MAI Playground平台開放使用,並正逐步導入Copilot與Bing Image Creator。部分企業客戶可透過應用程式介面(API)存取此模型,未來也預期將透過Foundry提供更廣泛的開發者使用權限。不過,微軟尚未公布MAI-Image-2將在全球所有服務中全面推出的具體時間表。