昆仑万维发布并开源 Skywork-R1V 3.0，多模态推理能力逼近人类专家水平

5.9K 0 0

GoodNav 7月9日消息，昆仑万维发布了Skywork-R1V 3.0模型，并将其开源。

昆仑万维表示，Skywork-R1V 3.0通过强化学习，显著提升了模型的跨模态推理能力，尤其在复杂逻辑建模和跨学科泛化方面取得了突破。

该版本基于上一代模型Skywork-R1V 2.0，利用蒸馏数据进行初始化，并通过拒绝采样构建高质量多模态训练集，引导开源视觉大模型InternVL-38B（38亿参数）掌握多模态推理技巧。

随后，引入强化学习算法GRPO，进一步激发模型推理能力，使其能够在图像和文本模态之间迁移推理能力，从而在跨模态、多学科场景下表现出色。

值得关注的是，Skywork-R1V 3.0仅使用约1.2万条监督微调数据和1.3万条强化学习数据就实现了高效训练，充分体现了模型的“小数据大能力”优势。

文章版权归作者所有，未经允许请勿转载。

GoodNav.net

5.6K

GoodNav.net

5.6K

GoodNav.net

6.5K

GoodNav.net

6.2K

GoodNav.net

6.2K

GoodNav.net

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...