OpenAI整合团队开发音频AI模型为发布AI个人设备铺路

时间：2026-01-01 23:56:04 栏目：新闻资讯浏览：5

　　据知情人士透露，OpenAI正采取措施优化其音频AI模型，为未来发布由AI驱动的个人设备做准备。三名知情人士表示，该设备预计将主要依赖音频交互。

　　目前，当用户与ChatGPT对话时，虽然聊天机器人能进行语音回复，但其语音版本与文本版本使用的底层模型并不相同。一位前员工和一位现职员工透露，OpenAI内部研究人员认为，当前语音模型在回答准确性和响应速度上均落后于文本模型。

　　为应对这一挑战，过去两个月内，OpenAI已整合了工程、产品和研究团队，共同推进音频模型的优化。提升语音模型准确性对OpenAI至关重要，因其计划推出一款支持语音指令的消费级设备。据此前报道，首款设备预计至少一年后面世。

　　知情人士称，新音频模型架构能生成更自然、更具情感且更精准深入的回应，同时支持与用户实时对话（现有模型无法实现）并更好地处理对话打断。该模型目标发布时间为2026年第一季度，OpenAI发言人对此不予置评。

　　与、、Meta和类似，OpenAI正探索开发新型个人AI设备（包括可穿戴设备）。部分公司认为，当前主流设备（如iPhone）未针对未来AI技术优化。OpenAI研究人员希望用户通过语音而非屏幕与设备交互，许多AI专家认为语音是更自然的交互方式，因人类日常沟通主要依赖语言。

　　无屏设计还可能减少用户对设备的依赖。与OpenAI合作硬件开发的前苹果设计主管乔尼·艾夫强调，纠正以往消费电子产品的负面影响是其首要目标。他在5月采访中表示：“即使初衷无害，若产品产生不良后果，也需承担责任。这种责任感驱动着我当前的工作。”

　　然而，OpenAI面临一大挑战：多数ChatGPT用户尚未养成语音交互习惯，或因音频模型质量不足，或因未意识到该功能。要推出以音频为核心的AI设备，需先培养用户通过语音与AI产品互动的习惯。

　　知情人士称，音频AI项目的核心人物是今夏从Character.AI加入的语音研究员Kundan Kumar，其他负责人包括重构音频AI基础设施的产品研究主管Ben Newhouse，以及多模态ChatGPT产品经理Jackie Shannon。

　　多名知情人士表示，OpenAI计划逐步发布一系列设备（如眼镜、无屏智能音箱），而非单一产品。今夏的内部演示中，研究人员称该设备将作为用户的“协作伴侣”，主动提供目标达成建议，而非仅作为应用入口。设备还能通过音频捕捉环境与用户信息，实现情景化交互。

关键词：

OpenAI整合团队开发音频AI模型 为发布AI个人设备铺路