Loading...

昆仑万维发布并开源 Skywork-R1V 3.0,多模态推理能力逼近人类专家水平

GoodNav 7月9日消息,昆仑万维发布了Skywork-R1V 3.0模型,并将其开源。

昆仑万维表示,Skywork-R1V 3.0通过强化学习,显著提升了模型的跨模态推理能力,尤其在复杂逻辑建模和跨学科泛化方面取得了突破。

该版本基于上一代模型Skywork-R1V 2.0,利用蒸馏数据进行初始化,并通过拒绝采样构建高质量多模态训练集,引导开源视觉大模型InternVL-38B(38亿参数)掌握多模态推理技巧。

随后,引入强化学习算法GRPO,进一步激发模型推理能力,使其能够在图像和文本模态之间迁移推理能力,从而在跨模态、多学科场景下表现出色。

值得关注的是,Skywork-R1V 3.0仅使用约1.2万条监督微调数据和1.3万条强化学习数据就实现了高效训练,充分体现了模型的“小数据大能力”优势。

图片

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...