文章来源:互联网会员:cw59发布时间:2026-01-02 06:39:39
据知情人士透露,OpenAI正采取措施优化其音频AI模型,为未来发布由AI驱动的个人设备做准备。三名知情人士表示,该设备预计将主要依赖音频交互。
目前,当用户与ChatGPT对话时,虽然聊天机器人能进行语音回复,但其语音版本与文本版本使用的底层模型并不相同。一位前员工和一位现职员工透露,OpenAI内部研究人员认为,当前语音模型在回答准确性和响应速度上均落后于文本模型。
为应对这一挑战,过去两个月内,OpenAI已整合了工程、产品和研究团队,共同推进音频模型的优化。提升语音模型准确性对OpenAI至关重要,因其计划推出一款支持语音指令的消费级设备。据此前报道,首款设备预计至少一年后面世。
知情人士称,新音频模型架构能生成更自然、更具情感且更精准深入的回应,同时支持与用户实时对话(现有模型无法实现)并更好地处理对话打断。该模型目标发布时间为2026年第一季度,OpenAI发言人对此不予置评。
与谷歌、亚马逊、Meta和苹果类似,OpenAI正探索开发新型个人AI设备(包括可穿戴设备)。部分公司认为,当前主流设备(如iPhone)未针对未来AI技术优化。OpenAI研究人员希望用户通过语音而非屏幕与设备交互,许多AI专家认为语音是更自然的交互方式,因人类日常沟通主要依赖语言。
无屏设计还可能减少用户对设备的依赖。与OpenAI合作硬件开发的前苹果设计主管乔尼·艾夫强调,纠正以往消费电子产品的负面影响是其首要目标。他在5月采访中表示:“即使初衷无害,若产品产生不良后果,也需承担责任。这种责任感驱动着我当前的工作。”
然而,OpenAI面临一大挑战:多数ChatGPT用户尚未养成语音交互习惯,或因音频模型质量不足,或因未意识到该功能。要推出以音频为核心的AI设备,需先培养用户通过语音与AI产品互动的习惯。
知情人士称,音频AI项目的核心人物是今夏从Character.AI加入的语音研究员Kundan Kumar,其他负责人包括重构音频AI基础设施的产品研究主管Ben Newhouse,以及多模态ChatGPT产品经理Jackie Shannon。
多名知情人士表示,OpenAI计划逐步发布一系列设备(如眼镜、无屏智能音箱),而非单一产品。今夏的内部演示中,研究人员称该设备将作为用户的“协作伴侣”,主动提供目标达成建议,而非仅作为应用入口。设备还能通过音频捕捉环境与用户信息,实现情景化交互。
上一篇:烈焰燃情,战鼓催征!《烈焰飞雪》征战版新服11月15日热血开启
下一篇:暂无
最火的射击游戏 ios大型手游 适合18岁玩的游戏 大型网络手游
射击类手机游戏震撼作品
最火的射击游戏 ios大型手游 适合18岁玩的游戏 大型网络手游
射击类手机游戏震撼作品
角色 竞技 过年游戏
十年陪伴,无限热爱!
二次元 动作
二次元的美少女动作游戏
动作2023 角色2023 模拟2023 冒险2023
好玩的女高中生校园生活
梦幻花园 合成一排就消除 休闲消除
消除模拟经营的游戏
策略2023 战争策略
恢弘的战斗策略游戏
创意 角色 冒险 武侠
极致复原动漫中的故事情节!
创意 角色 冒险 武侠
极致复原动漫中的故事情节!
动作2024 角色2024
原创魔幻战斗冒险手游
我的世界珍妮slipperyt网站原版视频完整版