Loading...

苹果发布 DiffuCode-7B-cpGRPO 编程 AI 模型:基于 Qwen2.5-7B,可不按顺序生成代码

GoodNav 7 月 5 日报道,苹果公司悄悄在 Hugging Face 上发布了名为 DiffuCoder-7B-cpGRPO 的开源 AI 代码生成模型,该模型具有颠覆性的代码生成能力,能够跳过顺序生成代码,其性能与顶级开源编码模型相当。

传统的大语言模型(LLM)生成代码,就像人类阅读文本一样,通常是按顺序从左到右、从上到下进行的。

这是因为这些 LLM 通常采用自回归方式,即用户提问后,模型处理整个问题,预测第一个 token,然后带着这个 token 重新处理整个问题,预测第二个 token,依此类推。

LLM 中还有一个“温度”参数,控制输出的随机性。在预测下一个 token 后,模型会为所有可能选项分配概率。较低的温度更倾向于选择最可能的 token,而较高的温度则允许模型有更多选择不太可能的 token。

而 DiffuCoder 模型则采用了不同的扩散(Diffusion)方法,这

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...