Loading...

OpenAI 突破传统微调,RFT 技术可精准定制 o4-mini 模型

GoodNav 5 月 9 日消息,科技媒体 marktechpost 报道,OpenAI 在其 o4-mini 推理模型中推出强化微调技术 (RFT),让定制基础模型以适应特定任务变得更容易。

OpenAI 的 RFT 将强化学习融入模型微调,开发者无需完全依赖标注数据。他们可设计特定任务的评分函数,评估模型输出质量。

这些评分函数根据自定义标准(例如准确性、格式或语气)评估模型表现,并通过奖励信号引导模型学习,生成符合预期结果。这种方法对于难以定义标准答案的复杂任务非常有效,例如优化医疗解释的措辞,开发者可通过程序评估清晰度和完整性,从而指导模型改进。

o4-mini 是 OpenAI 于 2025 年 4 月发布的轻量级推理模型,支持文本和图像输入,擅长结构化推理和链式思维提示。

OpenAI 将 RFT 应用于 o4-mini,为开发者提供了一个高效、轻便的基础模型,适用于高风险、领域特定的推理任务,其计算效率高,响应速度快,非常适合实时应用。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...