新闻资讯

OpenAI整合团队开发音频AI模型 为发布AI个人设备铺路

  据知情人士透露,OpenAI正采取措施优化其音频AI模型,为未来发布由AI驱动的个人设备做准备。三名知情人士表示,该设备预计将主要依赖音频交互。

  目前,当用户与ChatGPT对话时,虽然聊天机器人能进行语音回复,但其语音版本与文本版本使用的底层模型并不相同。一位前员工和一位现职员工透露,OpenAI内部研究人员认为,当前语音模型在回答准确性和响应速度上均落后于文本模型。

  为应对这一挑战,过去两个月内,OpenAI已整合了工程、产品和研究团队,共同推进音频模型的优化。提升语音模型准确性对OpenAI至关重要,因其计划推出一款支持语音指令的消费级设备。据此前报道,首款设备预计至少一年后面世。

  知情人士称,新音频模型架构能生成更自然、更具情感且更精准深入的回应,同时支持与用户实时对话(现有模型无法实现)并更好地处理对话打断。该模型目标发布时间为2026年第一季度,OpenAI发言人对此不予置评。

  与、Meta和类似,OpenAI正探索开发新型个人AI设备(包括可穿戴设备)。部分公司认为,当前主流设备(如iPhone)未针对未来AI技术优化。OpenAI研究人员希望用户通过语音而非屏幕与设备交互,许多AI专家认为语音是更自然的交互方式,因人类日常沟通主要依赖语言。

  无屏设计还可能减少用户对设备的依赖。与OpenAI合作硬件开发的前苹果设计主管乔尼·艾夫强调,纠正以往消费电子产品的负面影响是其首要目标。他在5月采访中表示:“即使初衷无害,若产品产生不良后果,也需承担责任。这种责任感驱动着我当前的工作。”

  然而,OpenAI面临一大挑战:多数ChatGPT用户尚未养成语音交互习惯,或因音频模型质量不足,或因未意识到该功能。要推出以音频为核心的AI设备,需先培养用户通过语音与AI产品互动的习惯。

  知情人士称,音频AI项目的核心人物是今夏从Character.AI加入的语音研究员Kundan Kumar,其他负责人包括重构音频AI基础设施的产品研究主管Ben Newhouse,以及多模态ChatGPT产品经理Jackie Shannon。

  多名知情人士表示,OpenAI计划逐步发布一系列设备(如眼镜、无屏智能音箱),而非单一产品。今夏的内部演示中,研究人员称该设备将作为用户的“协作伴侣”,主动提供目标达成建议,而非仅作为应用入口。设备还能通过音频捕捉环境与用户信息,实现情景化交互。

  • 四季度政策有望继续强化逆周期调节|宏观晚6点
  • 千问App又崩了,官方发文回应:热度太高有点堵
  • 欧洲央行Nagel表示进一步降息可能危及价格稳定
  • 甲骨文任命希拉里·马克森为首席财务官
  • IPO雷达| 员工持股平台资金穿透异常,奥立思特遭二轮问询
  • 伊朗发射弹道导弹打击迪戈加中东军事基地
  • CPI全年节奏将演绎温和复苏特征|宏观晚6点
  • 澳大利亚悉尼枪击事件一名枪手身份已确认,警方正搜查其住所
  • 贵州董酒董事长蔡友平:董酒酒体中蕴含的健康物质远超其他酒类
  • 威高股份9月11日斥资242.48万港元回购42.92万股
  • 韩国警方申请逮捕59名柬埔寨遣返网络诈骗嫌疑人
  • 美国特使威特科夫称美方官员与乌克兰和欧洲代表举行了建设性会谈
  • 商务部解读《上海合作组织元首理事会关于支持多边贸易体制的声明》
  • 汽车早报|比亚迪预计年底将在全国建设20000座闪充站 奇瑞集团3月出口近15万辆汽车
  • 宣称孕妇专研专用实为普通备案?植物主义回应:产品通过所有安全检测
  • 关键词: