北京时间今日凌晨,OpenAI 再次引爆科技圈。在没有任何预热的情况下,Sam Altman 直接在社交媒体上发布了 GPT-5 的预览版链接,瞬间导致官网访问量激增,一度瘫痪。
推理能力:跨越式的提升
根据官方公布的技术文档,GPT-5 在 MMLU(大规模多任务语言理解)基准测试中取得了 95.8% 的惊人成绩,几乎达到了人类专家的水平。与 GPT-4 相比,其复杂逻辑推理能力提升了约 10 倍。
"这不仅仅是参数量的堆叠," OpenAI 首席科学家在博客中写道,"我们在模型架构和训练方法上取得了根本性的突破,使得模型能够像人类一样进行'慢思考'(System 2 thinking)。"
实时多模态:更自然的交互
除了智力的提升,GPT-5 最直观的变化在于其多模态能力。现在的模型可以像真人一样,通过语音实时打断、插话,并能理解视频流中的动态变化。
演示视频中,用户拿着手机摄像头对准一台故障的咖啡机,GPT-5 实时识别出了故障指示灯,并一步步语音指导用户完成了维修。整个过程流畅自然,延迟低至 200 毫秒。
行业影响与未来
业内专家普遍认为,GPT-5 的发布将进一步加速 AI 在垂直领域的落地。医疗诊断、法律咨询、复杂编程任务等曾经被认为难以被 AI 取代的领域,现在都面临着新的变革。