合作媒體

Cohere發布開源語音轉文字模型 主打資料隱私與本地部署

商傳媒|林昭衡/綜合外電報導

人工智慧企業 Cohere 今日宣布,已發布一款輕量級開源語音轉文字模型,旨在讓企業開發者能在自己的硬體上部署運行。此舉被視為直接挑戰 OpenAI 和 Google 等依賴雲端的語音轉錄服務,提供企業在處理敏感音訊資料時,能將資料留在內部環境的解決方案。

這款模型擁有 20 億個參數,其設計考量了部署的彈性,開發者無需高性能企業級圖形處理器(GPU)叢集,僅需消費級 GPU、現代遊戲電腦或中等規模的雲端實例即可運行。該模型支援 14 種主要商業語言,滿足多數企業的即時需求。

Cohere 的策略重心在於資料主權和部署的靈活性。相較於其他部分消費級 AI 公司,Cohere 不會透過使用者資料獲利,也不要求客戶的資訊必須經由其伺服器傳輸。這不僅有助於消除企業對供應商鎖定(vendor lock-in)的疑慮,也讓企業在建構語音應用時,毋須擔憂 API 使用成本隨用量增加而飆升。

儘管企業須自行承擔模型部署、擴展、監控及更新的管理工作,但此一模式顯示 AI 部署正呈現碎片化趨勢,尤其涉及敏感的企業工作負載,正轉向本地部署。對於台灣的 AI 開發者社群和企業而言,這類開源模型有助於在確保資料隱私的前提下,更具彈性地發展本地化語音應用,同時控制營運成本。

分析認為,Cohere 此番發布不僅為語音 AI 市場投下震撼彈,也對 OpenAI 和 Google 的語音 AI 策略構成壓力,更是一項戰略性賭注,押注在日益重視隱私的世界中,企業將如何處理敏感語音資料。