OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o：语音对话更流畅，免费提供

日期：05-14

IT之家5月14日消息，OpenAI宣布推出其最新旗舰生成式AI模型GPT-4o，该模型将在未来几周内分阶段集成至OpenAI的各个产品之中。最让人惊喜的是，GPT-4o将免费提供给所有用户使用。

OpenAI首席技术官穆里・穆拉蒂(MuriMurati)表示，GPT-4o将提供与GPT-4同等水平的智能，但在文本、图像以及语音处理方面均取得了进一步提升。

“GPT-4o可以综合利用语音、文本和视觉信息进行推理，”穆拉蒂在OpenAI公司总部举行的主题演讲中表示。GPT-4是OpenAI此前的旗舰模型，可以处理由图像和文本混合而成的信息，并能完成诸如从图像中提取文字或描述图像内容等任务，GPT-4o则在此基础上新增了语音处理能力。

GPT-4o的运行速度将大大提升，最大亮点在于其语音交互模式采用了新技术。OpenAI一直致力于让用户通过语音与ChatGPT进行交流，仿佛与真人对话一般。然而，之前的版本由于延迟问题，严重影响了对话的沉浸感。GPT-4o则采用了全新的技术，让聊天机器人对话的响应速度大幅提升。

IT之家注意到，发布会上OpenAI展示了使用GPT-4o进行语音对话的演示。演示者提问结束后，GPT-4o几乎可以即时回应，并通过文本转语音功能进行朗读，让对话感觉更加自然逼真。

另一个演示展示了GPT-4o根据要求调整说话时语气，GPT-4o可以根据指令改变声音，从夸张戏剧到冰冷机械，展现了出色的可塑性。最后，演示还展示了GPT-4o的唱歌功能。

以往，OpenAI发布新版ChatGPT模型时，通常会将其置于付费墙之后。不过这次GPT-4o将免费提供给所有用户，付费用户则可以享受五倍的调用额度。

此外，OpenAI还发布了桌面版的ChatGPT和新的用户界面。“我们认识到这些模型正变得越来越复杂，”穆拉蒂说道，“但我们希望用户与人工智能模型的交互体验能够更加自然、轻松，让用户可以将注意力完全集中在与模型的协作上，而无需在意界面本身。”

俄媒：美教官遗孀意外泄露乌军F-16损失