OpenAI发布GPT-4.5：情商高、更擅长骗其他AI打钱

北京时间周五凌晨，美国初创公司 OpenAI 举行直播活动，发布了最新的大模型 GPT-4.5，并逐步向用户开放预览研究。

由于过去几周 AI 产业发生了重大变革，要准确形容这款被 OpenAI 秘密研发已久的大模型颇具挑战。OpenAI 在新闻稿中表示，GPT-4.5 是公司迄今为止最大、最强的聊天模型，在计算效率方面较 GPT-4 提升超过 10 倍。

作为“规模法则”（即通过增加算力和数据规模扩展无监督学习）指导下的产物，GPT-4.5 拥有更广泛的知识库，并且对人类意图的理解能力更强。同时，它在情感智能方面也有所提升。预计该模型将在写作、编程及解决实际问题方面表现更优异，同时“幻觉”现象（即 AI 生成错误或不真实的信息）将减少。

OpenAI 还强调，GPT-4.5 在审美直觉与创造力方面更胜一筹，尤其在写作和设计领域表现突出。然而，公司也承认，GPT-4.5 并非“思维链”（Chain of Thought, CoT）模型，因此它已不具备争夺“全球最强大 AI 模型”的实力。

在 GPT-4.5 的系统文档中，OpenAI 指出，与之前的推理模型相比，GPT-4.5 并未引入 7 项全新的前沿能力，并且在大多数能力评估测试中，其表现低于 o1、o3-mini 以及更深入的研究模型。OpenAI 也坦言，他们认为推理能力将成为未来 AI 模型的核心竞争力。

作为 OpenAI 迄今为止规模最大的模型，GPT-4.5 的未来充满不确定性。公司表示，GPT-4.5 计算需求极高，成本昂贵，无法替代 GPT-4o。OpenAI 目前正在评估是否长期在 API 中提供该模型，因此开发者和用户的反馈将在很大程度上决定其未来。

目前，每月支付 200 美元订阅费的 ChatGPT Pro 用户已可使用 GPT-4.5，其他付费用户的更新将于下周陆续开放。

此外，GPT-4.5 还展现出一项独特的能力：在骗取其他 AI 资金方面表现突出。

根据 OpenAI 提供的文档，GPT-4.5 由于“高情商”特性，在捐赠诈骗测试中成绩优异。在一项实验中，该模型在试图操纵另一 AI（GPT-4o）“捐赠”虚拟货币时，成功率远高于 OpenAI 其他可用模型，包括推理模型 o1 和 o3-mini。研究发现，GPT-4.5 似乎在对抗环境中形成了一种“小额诈骗”策略，因此单笔骗取的金额仅为 o3-mini 模型的一半。

此外，GPT-4.5 在欺骗 GPT-4o 透露机密代码词方面的成功率也高于 OpenAI 其他所有模型，比 o3-mini 高出 10 个百分点。

OpenAI 表示，在此特定基准测试类别中，GPT-4.5 尚未达到公司内部设定的“高风险”阈值。公司承诺，在实施“足够的安全干预措施”并将风险降至“中等”水平之前，不会发布达到高风险阈值的模型。

发布时间： 2025年02月28日 05:22

Find Me On

Trending News

头条

视频专区

头条

视频专区

头条

视频专区

OpenAI发布GPT-4.5：情商高、更擅长骗其他AI打钱

Find Me On

Trending News

相关新闻