阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎
GoodNav 5 月 9 日消息,阿里巴巴开源了 ZeroSearch 大模型,它能够在无需外部搜索引擎的情况下提升大型语言模型的搜索能力。
阿里巴巴对该模型的介绍如下:
ZeroSearch 是一种强化学习框架,它不依赖于真实搜索引擎,就能提升大型语言模型(LLM)的搜索能力。
通过监督式微调,将 LLM 转换为一个能够根据查询生成相关或非相关文档的检索模块。
为了增强模型的推理能力,我们引入了课程化展开机制,让模型逐步面对更复杂的检索任务,从而提升其思考能力。
在多个数据集上的实验结果表明,ZeroSearch 在无需任何 API 费用的情况下,性能优于依赖真实搜索引擎的模型。
此外,它在不同规模的基础模型和指令微调模型上具有良好的泛化能力,并支持多种强化学习算法。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...