
近期,OpenAI 正在積極布局語音AI硬體,在打造一款能與用戶進行自然語音交互的消費級AI硬體。這款硬體預計將採取「無幕設計」,讓用戶能通過語音指令與設備進行交互。
根據來源,OpenAI 已經組建了一個專門的團隊,負責開發一款「音訊優先」的新模型,試圖讓AI能直接理解並生成聲音,省去中間轉成文字的步。這款新模型預計將在 2026 年第一季度正式發布。
技術突破與組織整合
OpenAI 的技術團隊認為,目前的音頻模型在精準度與反應速度上明顯落後於文本模型。為了解決這個問題,OpenAI 正在整合工程、產品和研究力量,集中攻克音頻模型短板。這包括開發一款全新的音頻模型架構,能生成更自然、更富情感的語音回應,並具備與用戶實時同聲對話的能力。
同時,OpenAI 也在進行組織整合,組建了一個專門的團隊負責音頻AI的研發。該團隊由來自 Character.AI 的語音研究員 Kundan Kumar ,聯合產品研究主管 Ben Newhouse 等人,重構音頻AI基設施。
硬體布局
OpenAI 的硬體布局包括推出一款「無幕」硬體設備,預計於 2027 年面世。這款設備將採取「無幕設計」,讓用戶能通過語音指令與設備進行交互。OpenAI 的設計師 Jony Ive 調,未來AI設備應採取「無幕設計」,不僅能回自然交流,還能避免電子產品成。
OpenAI 的硬體設備預計將包括智能眼鏡和無屏幕智能音箱等。該公司的設想是,這類設備將以「伴隨式助手」的形態存在,主動理解環境和用戶需求,並在獲得授權的情況下,通過音頻和視頻持續提供助。
面臨挑戰
OpenAI 目前仍面臨現實挑戰,不少 ChatGPT 用戶並未習使用語音功能,這種情況不僅因為音頻模型效果不,也與功能認知不足有关。在推出音頻優先的 AI 備之前,OpenAI 必須先改變用戶的使用習。
結論
OpenAI 的語音AI硬體布局是公司未來發展的重要方向。通過開發「音訊優先」的新模型和推出「無幕」硬體設備,OpenAI 能為用戶提供更自然、更便捷的語音交互體驗。然而,OpenAI 仍面臨著現實挑戰,需要續努力改善音頻模型和用戶體驗。
參考資料與原文來源
- 原文來源: https://tw.stock.yahoo.com/news/openai%E7%AC%AC-%E5%AD%A3%E7%99%BC%E5%B8%83%E6%96%B0%E9%9F%B3%E9%A0%BB%E6%A8%A1%E5%9E%8B-%E5%8A%A0%E9%80%9F%E5%B8%83%E5%B1%80-%E7%84%A1%E8%9E%A2%E5%B9%95-ai%E7%A1%AC%E9%AB%94-001401588.html
- 原文來源: https://finance.sina.com.cn/stock/usstock/c/2026-01-02/doc-inhexfkm3525818.shtml
- 原文來源: https://www.ithome.com/0/909/870.htm
- 原文來源: https://tw.news.yahoo.com/openai-is-reportedly-going-all-in-on-audio-first-technology-a-major-internal-team-reorganization-and-a-focus-on-a-mysterious-ai-hardware-launch-next-year-are-also-implied-175155886.html
- 原文來源: https://www.zoom.com/zh-tw/blog/translated-captions/
🧠本文由 DreamJ AI 技術新聞生成系統 自動撰寫並進行語意優化,僅供技術研究與教學使用。
請以原廠公告、CVE 官方資料與安全建議為最終依據。












發佈留言