OpenAI推出了最新的AI模型GPT-4o,这是对对话AI技术的重大飞跃。这个新版本具有增强的功能,能够更像人类的聊天机器人,可以解释用户的音频和视频输入并实时响应。该模型被称为GPT-4 Omni,通过一系列演示展示了其多功能性和实际应用。
在这些演示中,GPT-4 Omni展示了其在各种场景中的实用性,从帮助用户准备面试到协助客户服务代表处理诸如请求更换iPhone等任务。此外,这个聊天机器人展示了它的轻松一面,比如分享笑话、在游戏中担任裁判,并在受到提示时以讽刺的方式回应。一个特别令人愉快的演示展示了AI对用户小狗的反应,表现出热情的问候。
CEO山姆·奥特曼对GPT-4o的进步表示兴奋,他将其能力比作科幻电影中的描绘。奥特曼强调了在实现人类级响应速度和表现力方面取得的重大进展,这是AI开发中的一个重要里程碑。OpenAI宣布文本和图像输入版本的GPT-4o已于5月13日发布,完整版将在接下来的几周内推出。
GPT-4o中的“o”代表“omni”,强调该模型能够同时处理文本、音频和图像输入,这比之前的版本有所改进。这种多方面的方法旨在增强人机交互,提供更自然和流畅的体验。OpenAI指出,GPT-4o不仅在视觉和音频理解方面表现出色,甚至可以捕捉用户的情绪和呼吸模式。此外,这个新AI模型比其前身具有更快的速度和更高的性价比,对开发者和用户来说都是一个具有吸引力的选择。




















