Loading...

阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎

GoodNav 5 月 9 日消息,阿里巴巴开源了 ZeroSearch 大模型,它能够在无需外部搜索引擎的情况下提升大型语言模型的搜索能力

阿里巴巴对该模型的介绍如下:

ZeroSearch 是一种强化学习框架,它不依赖于真实搜索引擎,就能提升大型语言模型(LLM)的搜索能力。

通过监督式微调,将 LLM 转换为一个能够根据查询生成相关或非相关文档的检索模块。

为了增强模型的推理能力,我们引入了课程化展开机制,让模型逐步面对更复杂的检索任务,从而提升其思考能力。

在多个数据集上的实验结果表明,ZeroSearch 在无需任何 API 费用的情况下,性能优于依赖真实搜索引擎的模型

此外,它在不同规模的基础模型和指令微调模型上具有良好的泛化能力,并支持多种强化学习算法。

阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...