Loading...

OpenAI 高管:AI 未来可自主生成知识,商业与科研迎来革命

GoodNav 5月13日消息,科技媒体The Decoder报道,OpenAI高级模型开发负责人Jakub Pachocki指出,AI推理模型正在展现出自主生成知识的潜力。

他认为,这种推理并非模仿人类思维,而是基于数据和算法的独特机制。Pachocki解释,AI学习分为两个阶段:第一阶段是无监督预训练,模型吸收海量数据,构建一个无意识、无时间线的“世界模型”来理解现实;第二阶段是通过强化学习与人类反馈(RLHF)将基础模型转化为实用工具,在最新的推理模型中至关重要。

OpenAI同时结合传统强化学习处理明确对错的任务,而RLHF更适合复杂问题,尽管其扩展性有限。Pachocki质疑预训练和强化学习是否应被视为独立阶段,认为推理模型的“思考”源于预训练数据,两者需要深度融合。

近期一项研究指出,推理训练并非赋予模型全新能力,而是帮助模型更高效地应用已有的知识,例如以更结构化的方式解决已知问题。Pachocki对此表示赞同,并补充道,模型已展现出…

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...