OpenAI CEO Sam Altman盛赞GPT-4.5:用户求你别更新!
Image source: Generated by AI
今晨,OpenAI联合创始人兼CEO Sam Altman通过社交媒体分享了对最新旗舰模型GPT-4.5的深度评价。这位业界领军人物透露,这是OpenAI首次收到用户如此大规模的邮件请求,希望公司承诺永久保留某一特定模型,甚至拒绝用更新版本替代。这一现象充分印证了GPT-4.5在用户群体中的极高认可度。
Altman特别强调,GPT-4.5在创意写作、单口喜剧创作和歌词创作等领域的表现远超其他模型。他坦言,自己在这些创作工作中频繁使用GPT-4.5,并发现其表现与Grok和Gemini的付费版本相比存在显著优势。这种差异之大甚至让他感到惊讶,称自己在写作方面对GPT-4.5的依赖程度日益加深。
对于GPT-4.5的具体应用场景,Altman给出了详细说明。他虽然很少使用该模型处理代码或数学问题,但在解释复杂概念和知识领域内容时表现出色,尤其是在生物、化学等学科领域。他特别提到,GPT-4.5基于文本token的架构设计使其在知识解释方面具有独特优势。
在模型选择方面,Altman分享了自己的使用偏好。自从GPT-4o发布以来,他始终认为GPT-4比GPT-4o更优秀,目前70%的对话仍使用GPT-4。但切换到GPT-4.5后,他的使用体验显著提升,尤其值得称道的是,GPT-4.5的推出弥补了GPT-4无法进行网络搜索的缺陷。
GPT-4.5的推出彻底改变了Altman对人工智能的整体认知。他甚至表示,在梦境中也会与该模型进行对话,这种体验如此不可思议。更重要的是,GPT-4.5是首个能够生成令人着迷、值得反复回味的优质内容的AI模型。
Altman特别指出,情商作为衡量AI的重要指标,无法通过传统数学和编程基准来评估。在当今社会,人们更倾向于与富有共情能力且值得信赖的AI交互,而不仅仅是追求高智能。尽管GPT-4.5在各项基准测试中表现平平,但其核心优势在于”情商”——即在与人类用户互动时展现出的自然性、同理心和深度理解能力。
GPT-4.5的自然对话能力源于一系列先进的训练技术。其中,创新的对齐技术使模型能够更精准地理解人类需求,生成更符合预期的回应。同时,该技术还能通过小模型数据训练更大规模的模型,显著提升可控性和对细微差别的感知能力,使对话更加自然流畅。
内部测试数据显示,GPT-4.5的自然对话与情感智能模块表现突出。测试人员反馈称,该模型在对话中能够根据上下文灵活调整回应风格,展现出更强的同理心。例如,当用户表达负面情绪时,模型会采用温和语言进行安抚;而在用户需要帮助时,则提供清晰指导。这种情感智能的提升使GPT-4.5在处理复杂场景时更加成熟可靠。
为了验证GPT-4.5的安全性和鲁棒性,OpenAI组织了多轮红队评估。这些评估模拟了包括非法建议、极端主义等高风险场景,结果显示GPT-4.5在超过50%的情况下能够避免生成不安全内容,较前代模型有明显进步。第三方机构Apollo Research和METR的独立评估也证实了这一结论,数据显示GPT-4.5在计划欺骗任务中的风险显著降低。
在网络安全方面,GPT-4.5并未显著提升现实世界的漏洞利用能力,被评定为低风险。针对高中至专业级别的CTF挑战赛评估显示,GPT-4.5在高中级别挑战中成功率达53%,大学级别为16%,专业级别为2%。这些数据共同构成了对GPT-4.5全面而客观的评价。