AI 编程新王者：OpenAI GPT-4.1 系列登场，上下文百万 tokens、代码生成速度飙升 40%

AI前沿资讯8个月前发布 GOODNAV.NET

3.4K 0 0

GoodNav 4 月 15 日报道，OpenAI 今天（4 月 15 日）发表了一篇博文，宣布以 API 方式推出 GPT-4.1 系列模型，包括 GPT-4.1、GPT-4.1 mini 及 GPT-4.1 nano。

这些模型在编程、指令跟随和长文本理解方面较前代 GPT-4o 和 GPT-4o mini 有了显著提升，支持的上下文窗口最多可达到 100 万 tokens，知识更新至 2024 年 6 月。

需要指出的是，该系列模型目前专为开发者设计，普通用户暂时不能通过 ChatGPT 页面使用这些模型。

OpenAI 表示，GPT-4.1 模型在编程方面，代码生成速度相比 GPT-4o 提升了 40%，用户查询的成本降低了 80%。

AI 编程新王者：OpenAI GPT-4.1 系列登场，上下文百万 tokens、代码生成速度飙升 40%

新模型性能

根据 OpenAI 官方博文，GPT-4.1 系列模型在编程、指令跟随和长文本处理方面表现卓越，全面超出 GPT-4o 及 GPT-4o mini。

在编程测试 SWE-bench Verified 中，GPT-4.1 取得了 54.6% 的分数，比 GPT-4o 提升了 21.4 个百分点；在指令遵循测试 MultiChallenge 中提高了 10.5 个百分点；在多模态长文本测试 Video-MME 中创下 72.0% 的新高。

GPT-4.1 mini 和 nano 展现了小型模型的强大潜力。GPT-4.1 mini 在多个基准测试中表现不逊色甚至优于 GPT-4o，响应延迟减少了近一半，成本降低了 83%。

AI 编程新王者：OpenAI GPT-4.1 系列登场，上下文百万 tokens、代码生成速度飙升 40%

作为速度最快、成本最低的选择，GPT-4.1 nano 配有 100 万 tokens 的上下文窗口，在 MMLU 测试中得分 80.1%，适合用于分类和自动补充任务。

这些模型通过优化推理堆栈及提示缓存技术，显著降低了首次响应时间，为开发者提供了高效且低成本的解决方案。

GPT-4.1 系列模型在实际应用中表现优异，特别适合用于构建智能代理并处理复杂任务。例如，Windsurf 测试表明，GPT-4.1 在编程效率上提升了 30%，不必要的编辑次数减少了 50%；Thomson Reuters 的法律 AI 助手 CoCounsel 在使用 GPT-4.1 后，多文档审查的准确率提升了 17%。

命名混乱引发关注

GPT-4.1 的发布使得 OpenAI 产品命名复杂性加剧。

ChatGPT 的选项中目前包括 GPT-4o、GPT-4o mini、o1-pro 等多种模型。OpenAI 首席执行官山姆·奥尔特曼（Sam Altman）早在 2024 年 2 月便承认了这一命名问题。

他在社交平台 X 上表示，产品线过于复杂，计划在未来的 GPT-5 中进行品牌整合，OpenAI 预计在 2025 年 7 月前逐步淘汰 API 中的 GPT-4.5 Preview 模型，以减轻命名混乱。

该临时模型于 2024 年 2 月推出，曾被批评为“失败品”，开发者需在 2025 年 7 月前迁移到其他模型，不过，GPT-4.5 在 ChatGPT 中会继续存在，不受影响。

费用

关于 API 费用，OpenAI GPT-4.1 模型的输入费用为每 100 万 tokens 2 美元（注：现汇率约合 14.6 元人民币），输出费用为每 100 万 tokens 8 美元（现汇率约合 58.3 元人民币）。在中等查询中，相较于 GPT-4o，GPT-4.1 不仅在性能上更为强劲，而且价格便宜 26%。

AI 编程新王者：OpenAI GPT-4.1 系列登场，上下文百万 tokens、代码生成速度飙升 40%

此外，OpenAI GPT-4.1 nano 是当前 OpenAI 最经济、最快的模型：

AI 编程新王者：OpenAI GPT-4.1 系列登场，上下文百万 tokens、代码生成速度飙升 40%