昆仑万维发布并开源 Skywork-R1V 3.0,多模态推理能力逼近人类专家水平
GoodNav 7月9日消息,昆仑万维发布了Skywork-R1V 3.0模型,并将其开源。
昆仑万维表示,Skywork-R1V 3.0通过强化学习,显著提升了模型的跨模态推理能力,尤其在复杂逻辑建模和跨学科泛化方面取得了突破。
该版本基于上一代模型Skywork-R1V 2.0,利用蒸馏数据进行初始化,并通过拒绝采样构建高质量多模态训练集,引导开源视觉大模型InternVL-38B(38亿参数)掌握多模态推理技巧。
随后,引入强化学习算法GRPO,进一步激发模型推理能力,使其能够在图像和文本模态之间迁移推理能力,从而在跨模态、多学科场景下表现出色。
值得关注的是,Skywork-R1V 3.0仅使用约1.2万条监督微调数据和1.3万条强化学习数据就实现了高效训练,充分体现了模型的“小数据大能力”优势。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...