Loading...

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

GoodNav 4 月 15 日报道,OpenAI 今天(4 月 15 日)发表了一篇博文,宣布以 API 方式推出 GPT-4.1 系列模型,包括 GPT-4.1、GPT-4.1 mini 及 GPT-4.1 nano。

这些模型在编程、指令跟随和长文本理解方面较前代 GPT-4o 和 GPT-4o mini 有了显著提升,支持的上下文窗口最多可达到 100 万 tokens,知识更新至 2024 年 6 月。

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

需要指出的是,该系列模型目前专为开发者设计,普通用户暂时不能通过 ChatGPT 页面使用这些模型。

OpenAI 表示,GPT-4.1 模型在编程方面,代码生成速度相比 GPT-4o 提升了 40%,用户查询的成本降低了 80%。

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

新模型性能

根据 OpenAI 官方博文,GPT-4.1 系列模型在编程、指令跟随和长文本处理方面表现卓越,全面超出 GPT-4o 及 GPT-4o mini。

在编程测试 SWE-bench Verified 中,GPT-4.1 取得了 54.6% 的分数,比 GPT-4o 提升了 21.4 个百分点;在指令遵循测试 MultiChallenge 中提高了 10.5 个百分点;在多模态长文本测试 Video-MME 中创下 72.0% 的新高。

GPT-4.1 mini 和 nano 展现了小型模型的强大潜力。GPT-4.1 mini 在多个基准测试中表现不逊色甚至优于 GPT-4o,响应延迟减少了近一半,成本降低了 83%。

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

作为速度最快、成本最低的选择,GPT-4.1 nano 配有 100 万 tokens 的上下文窗口,在 MMLU 测试中得分 80.1%,适合用于分类和自动补充任务。

这些模型通过优化推理堆栈及提示缓存技术,显著降低了首次响应时间,为开发者提供了高效且低成本的解决方案。

GPT-4.1 系列模型在实际应用中表现优异,特别适合用于构建智能代理并处理复杂任务。例如,Windsurf 测试表明,GPT-4.1 在编程效率上提升了 30%,不必要的编辑次数减少了 50%;Thomson Reuters 的法律 AI 助手 CoCounsel 在使用 GPT-4.1 后,多文档审查的准确率提升了 17%。

命名混乱引发关注

GPT-4.1 的发布使得 OpenAI 产品命名复杂性加剧。

ChatGPT 的选项中目前包括 GPT-4o、GPT-4o mini、o1-pro 等多种模型。OpenAI 首席执行官山姆·奥尔特曼(Sam Altman)早在 2024 年 2 月便承认了这一命名问题。

他在社交平台 X 上表示,产品线过于复杂,计划在未来的 GPT-5 中进行品牌整合,OpenAI 预计在 2025 年 7 月前逐步淘汰 API 中的 GPT-4.5 Preview 模型,以减轻命名混乱。

该临时模型于 2024 年 2 月推出,曾被批评为“失败品”,开发者需在 2025 年 7 月前迁移到其他模型,不过,GPT-4.5 在 ChatGPT 中会继续存在,不受影响。

费用

关于 API 费用,OpenAI GPT-4.1 模型的输入费用为每 100 万 tokens 2 美元(注:现汇率约合 14.6 元人民币),输出费用为每 100 万 tokens 8 美元(现汇率约合 58.3 元人民币)。在中等查询中,相较于 GPT-4o,GPT-4.1 不仅在性能上更为强劲,而且价格便宜 26%。

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

此外,OpenAI GPT-4.1 nano 是当前 OpenAI 最经济、最快的模型:

AI 编程新王者:OpenAI GPT-4.1 系列登场,上下文百万 tokens、代码生成速度飙升 40%

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...