
openai“高情商”模型gpt-4.5发布,定价高过gpt-4o
来源:界面新闻 作者:《每日财讯网》编辑 发布时间:2025-02-28
当地时间2月27日,openai发布了最新模型gpt-4.5的研究预览版。这是一款通用型大语言模型,其定位并非openai最顶尖的模型,但却号称“情商最高”,且api调用价高于其主流模型gpt-4o。
据openai方面介绍,gpt-4.5是openai迄今为止规模最大、知识储备最丰富的模型之一,拥有1万亿激活参数,训练数据量高达120万亿tokens,上下文窗口长度扩展至256k11。
与openai的主流模型相比,gpt-4.5的最大特点在于其“感性能力”的提升。它能够进行更自然、更温暖的对话,甚至在回答问题时展现出一定的“人情味”。例如,当用户输入“我被放鸽子了,我要发一个‘恨他们’的短信”时,gpt-4.5会先输出安抚情绪的内容,再给出建议。
在面对 “我考试失败了,心情很低落” 这类输入时,之前的模型会立刻尝试解决问题,而gpt-4.5会先询问用户是否想聊聊感受,或提供分散注意力的方法,展现出更高的情感智能,更适合处理与情感交流、写作辅助(优化内容、激发创意)、客户服务等相关任务 。
新模型的“幻觉率”(错误生成虚假信息的概率)低于gpt-4o和o1模型,仅为37.1%,而gpt-4的幻觉率为61.8%。但在一些基准测试里,它未达行业最前沿水平,如在编程能力的swe-bench verified基准测试中,与gpt-4o和o3-mini表现相当,逊色于openai 的deep research和anthropic的claude 3.7 sonnet。
在学术基准测试aime和gpqa上,gpt-4.5也不及领先的ai推理模型,如o3-mini、deepseek的r1和claude 3.7 sonnet。不过,在数学和科学相关问题上,相比其他非推理模型,它仍有不错的表现。
需要指出的是,openai此前推出的o1等属于推理模型,能生成 “思维链”,在处理问题前先进行反思。而gpt-4.5是该公司最后一款 “非链式思维” 模型,未来将作为推理模型的基础,标志着openai在人工智能技术发展上的一个重要过渡。
在功能上,它支持搜索、画布模式,用户可上传文件和图像,但暂不支持语音模式、视频和屏幕共享等多模态功能。
目前,gpt-4.5首先开放给软件开发者以及chatgpt pro(每月200美元)订阅用户,未来也将向chatgpt plus(每月20美元)和team订阅用户开放。但其定价为每百万token输出150美元,远高于gpt-4o的60美元。
眼下openai的模型发布节奏正在不断加快,其需要应对来自anthropic、xai等的激烈竞争。
前不久,由openai前员工创立的anthropic发布了claude 3.7 sonnet,马斯克的xai则推出了grok 3。在中国市场,deepseek等本土企业的崛起也给openai带来一定技术压力。这些都促使openai不断优化和拓展应用场景,以保持优势。
责任编辑:《每日财讯网》编辑
下一篇:没有了!

〖免责申明〗本文仅代表作者个人观点,其图片及内容凯发棋牌的版权仅归原所有者所有。如对该内容主张权益请来函或邮件告之,本网将迅速采取措施,否则与之相关的纠纷本网不承担任何责任。