Home/AI 自動化 / OpenAI 搶先布局語音AI硬體:打造「無幕」智能交互新時代!

AI generated
圖片來源:Stable Horde(AI 生成)

近期,OpenAI 正在積極布局語音AI硬體,在打造一款能與用戶進行自然語音交互的消費級AI硬體。這款硬體預計將採取「無幕設計」,讓用戶能通過語音指令與設備進行交互。

根據來源,OpenAI 已經組建了一個專門的團隊,負責開發一款「音訊優先」的新模型,試圖讓AI能直接理解並生成聲音,省去中間轉成文字的步。這款新模型預計將在 2026 年第一季度正式發布。

技術突破與組織整合

OpenAI 的技術團隊認為,目前的音頻模型在精準度與反應速度上明顯落後於文本模型。為了解決這個問題,OpenAI 正在整合工程、產品和研究力量,集中攻克音頻模型短板。這包括開發一款全新的音頻模型架構,能生成更自然、更富情感的語音回應,並具備與用戶實時同聲對話的能力。

同時,OpenAI 也在進行組織整合,組建了一個專門的團隊負責音頻AI的研發。該團隊由來自 Character.AI 的語音研究員 Kundan Kumar ,聯合產品研究主管 Ben Newhouse 等人,重構音頻AI基設施。

硬體布局

OpenAI 的硬體布局包括推出一款「無幕」硬體設備,預計於 2027 年面世。這款設備將採取「無幕設計」,讓用戶能通過語音指令與設備進行交互。OpenAI 的設計師 Jony Ive 調,未來AI設備應採取「無幕設計」,不僅能回自然交流,還能避免電子產品成。

OpenAI 的硬體設備預計將包括智能眼鏡和無屏幕智能音箱等。該公司的設想是,這類設備將以「伴隨式助手」的形態存在,主動理解環境和用戶需求,並在獲得授權的情況下,通過音頻和視頻持續提供助。

面臨挑戰

OpenAI 目前仍面臨現實挑戰,不少 ChatGPT 用戶並未習使用語音功能,這種情況不僅因為音頻模型效果不,也與功能認知不足有关。在推出音頻優先的 AI 備之前,OpenAI 必須先改變用戶的使用習。

結論

OpenAI 的語音AI硬體布局是公司未來發展的重要方向。通過開發「音訊優先」的新模型和推出「無幕」硬體設備,OpenAI 能為用戶提供更自然、更便捷的語音交互體驗。然而,OpenAI 仍面臨著現實挑戰,需要續努力改善音頻模型和用戶體驗。

參考資料與原文來源


🧠本文由 DreamJ AI 技術新聞生成系統 自動撰寫並進行語意優化,僅供技術研究與教學使用。
請以原廠公告、CVE 官方資料與安全建議為最終依據。

OpenAI 搶先布局語音AI硬體:打造「無幕」智能交互新時代!

🧠 本文章與所附圖片部分內容為 AI 生成或 AI 輔助產製。文中提及之商標、品牌名稱、產品圖片及相關標識, 其著作權與商標權均屬原權利人所有,本網站僅作為資訊呈現與示意使用

最新文章

Domino郵件防護新境界:Rspamd整合,告別垃圾郵件困擾!

整合Rspamd以強化Domino箱件過能力
隨…

**AI 守護未來:自主安全、圖學習與星鏈,資安新戰趨勢深度解析**

自主安全營運、圖學習與星鏈技術:近期資安研究趨勢…

**告別煩惱,打造夢想家:新手入住必備的智能家居升級指南**

提升生活品質的智能家居設備選購指南
智能家居已經…

谷歌Propeller:高性能優化器或將納入LLVM主線,軟體效能有望大躍進!

谷歌提議將高性能優化器整合至 LLVM 主線開發…

推薦文章

留言

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

分析完成 ✔