AI 根據文章內容回答
OpenAI 本次發布的三款模型分別為 GPT-Realtime-2、GPT-Realtime-Translate 以及 GPT-Realtime-Whisper。這三款模型的推出,標誌著語音 AI 從單純的對話互動,正式跨入能夠實際執行商業任務的「介面層級」。
在功能定位上,GPT-Realtime-2 是整個語音核心,專為即時互動打造,具備頂尖的推理能力,能處理複雜請求並自然地推進業務流程。GPT-Realtime-Translate 則專攻即時多語系翻譯,支援超過 70 種語言輸入與 13 種語言輸出,其強大之處在於能緊跟語速,並處理自然口語、上下文切換及地區性發音差異。GPT-Realtime-Whisper 則提供超低延遲的語音轉錄功能,採用全新架構的串流技術,能在使用者說話的同時即時生成文字,為會議記錄與無障礙字幕提供數位化基礎。這些模型共同解決了過去語音產品受限於模型理解力與記憶容量不足的痛點,讓系統能順暢應對多步驟指令。