OpenAI 突破传统微调，RFT 技术可精准定制 o4-mini 模型

4.2K 0 0

GoodNav 5 月 9 日消息，科技媒体 marktechpost 报道，OpenAI 在其 o4-mini 推理模型中推出强化微调技术 (RFT)，让定制基础模型以适应特定任务变得更容易。

OpenAI 的 RFT 将强化学习融入模型微调，开发者无需完全依赖标注数据。他们可设计特定任务的评分函数，评估模型输出质量。

这些评分函数根据自定义标准（例如准确性、格式或语气）评估模型表现，并通过奖励信号引导模型学习，生成符合预期结果。这种方法对于难以定义标准答案的复杂任务非常有效，例如优化医疗解释的措辞，开发者可通过程序评估清晰度和完整性，从而指导模型改进。

o4-mini 是 OpenAI 于 2025 年 4 月发布的轻量级推理模型，支持文本和图像输入，擅长结构化推理和链式思维提示。

OpenAI 将 RFT 应用于 o4-mini，为开发者提供了一个高效、轻便的基础模型，适用于高风险、领域特定的推理任务，其计算效率高，响应速度快，非常适合实时应用。

文章版权归作者所有，未经允许请勿转载。

GoodNav.net

2.8K

GoodNav.net

4.8K

GoodNav.net

4.5K

GoodNav.net

5.6K

GoodNav.net

GoodNav.net

4.3K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...