
OpenAI发布GPT-4.5:情商高、更擅长骗其他AI打钱
北京时间周五凌晨,美国初创公司 OpenAI 举行直播活动,发布了最新的大模型 GPT-4.5,并逐步向用户开放预览研究。
由于过去几周 AI 产业发生了重大变革,要准确形容这款被 OpenAI 秘密研发已久的大模型颇具挑战。OpenAI 在新闻稿中表示,GPT-4.5 是公司迄今为止最大、最强的聊天模型,在计算效率方面较 GPT-4 提升超过 10 倍。
作为“规模法则”(即通过增加算力和数据规模扩展无监督学习)指导下的产物,GPT-4.5 拥有更广泛的知识库,并且对人类意图的理解能力更强。同时,它在情感智能方面也有所提升。预计该模型将在写作、编程及解决实际问题方面表现更优异,同时“幻觉”现象(即 AI 生成错误或不真实的信息)将减少。

OpenAI 还强调,GPT-4.5 在审美直觉与创造力方面更胜一筹,尤其在写作和设计领域表现突出。然而,公司也承认,GPT-4.5 并非“思维链”(Chain of Thought, CoT)模型,因此它已不具备争夺“全球最强大 AI 模型”的实力。
在 GPT-4.5 的系统文档中,OpenAI 指出,与之前的推理模型相比,GPT-4.5 并未引入 7 项全新的前沿能力,并且在大多数能力评估测试中,其表现低于 o1、o3-mini 以及更深入的研究模型。OpenAI 也坦言,他们认为推理能力将成为未来 AI 模型的核心竞争力。

作为 OpenAI 迄今为止规模最大的模型,GPT-4.5 的未来充满不确定性。公司表示,GPT-4.5 计算需求极高,成本昂贵,无法替代 GPT-4o。OpenAI 目前正在评估是否长期在 API 中提供该模型,因此开发者和用户的反馈将在很大程度上决定其未来。
目前,每月支付 200 美元订阅费的 ChatGPT Pro 用户已可使用 GPT-4.5,其他付费用户的更新将于下周陆续开放。
此外,GPT-4.5 还展现出一项独特的能力:在骗取其他 AI 资金方面表现突出。
根据 OpenAI 提供的文档,GPT-4.5 由于“高情商”特性,在捐赠诈骗测试中成绩优异。在一项实验中,该模型在试图操纵另一 AI(GPT-4o)“捐赠”虚拟货币时,成功率远高于 OpenAI 其他可用模型,包括推理模型 o1 和 o3-mini。研究发现,GPT-4.5 似乎在对抗环境中形成了一种“小额诈骗”策略,因此单笔骗取的金额仅为 o3-mini 模型的一半。

此外,GPT-4.5 在欺骗 GPT-4o 透露机密代码词方面的成功率也高于 OpenAI 其他所有模型,比 o3-mini 高出 10 个百分点。

OpenAI 表示,在此特定基准测试类别中,GPT-4.5 尚未达到公司内部设定的“高风险”阈值。公司承诺,在实施“足够的安全干预措施”并将风险降至“中等”水平之前,不会发布达到高风险阈值的模型。
发布时间: 2025年02月28日 05:22