ZeroSearch:阿里巴巴開源的一種創(chuàng)新大模型搜索引擎框架
2025年5月8日,阿里巴巴開源了ZeroSearch大模型搜索引擎,ZeroSearch是阿里巴巴通義實(shí)驗(yàn)室開源的創(chuàng)新大模型搜索引擎框架,本質(zhì)上是一種獨(dú)特的強(qiáng)化學(xué)習(xí)框架,無(wú)需與傳統(tǒng)意義上的真實(shí)搜索引擎進(jìn)行交互,便能充分激勵(lì)大模型自身潛藏的搜索能力。

ZeroSearch主要功能
無(wú)需真實(shí)搜索引擎交互:模擬搜索引擎的方式,激勵(lì)大模型的搜索能力,避免與真實(shí)搜索引擎(如谷歌)的交互,降低成本和不可控性。
動(dòng)態(tài)控制文檔質(zhì)量:支持生成相關(guān)或噪聲文檔,基于調(diào)整提示中的關(guān)鍵詞,靈活控制生成文檔的質(zhì)量,為訓(xùn)練提供多樣化的檢索場(chǎng)景。
支持多種模型和算法:兼容不同參數(shù)規(guī)模的大模型(如3B、7B、14B),支持多種強(qiáng)化學(xué)習(xí)算法(如PPO、GRPO)。
ZeroSearch核心技術(shù)
無(wú)需真實(shí)搜索引擎交互:ZeroSearch通過(guò)強(qiáng)化學(xué)習(xí)框架,無(wú)需與谷歌等真實(shí)搜索引擎交互,就能激發(fā)大模型的搜索能力。它基于大模型在大規(guī)模預(yù)訓(xùn)練過(guò)程中積累的知識(shí),將其轉(zhuǎn)化為檢索模塊,根據(jù)查詢生成相關(guān)內(nèi)容。
動(dòng)態(tài)控制文檔質(zhì)量:該框架可動(dòng)態(tài)控制生成文檔的質(zhì)量,支持生成相關(guān)或噪聲文檔,為訓(xùn)練提供多樣化檢索場(chǎng)景。通過(guò)調(diào)整提示模板中的關(guān)鍵詞,引導(dǎo)模型學(xué)習(xí)質(zhì)量分級(jí)檢索。
輕量級(jí)監(jiān)督微調(diào):先將大模型轉(zhuǎn)化為檢索模塊,使其能生成高質(zhì)量或低質(zhì)量文檔,適應(yīng)不同訓(xùn)練需求。
課程學(xué)習(xí)機(jī)制:在訓(xùn)練中逐步增加文檔噪聲水平,讓模型從簡(jiǎn)單場(chǎng)景開始,逐步適應(yīng)更具挑戰(zhàn)性的任務(wù),提升推理能力。
基于F1分?jǐn)?shù)的獎(jiǎng)勵(lì)機(jī)制:用F1分?jǐn)?shù)作為獎(jiǎng)勵(lì)信號(hào),專注于答案準(zhǔn)確性。
多輪交互模板:設(shè)計(jì)明確的推理、搜索和回答階段,引導(dǎo)模型逐步完成任務(wù)。
性能與成本優(yōu)勢(shì)
性能表現(xiàn):研究人員在NQ、TriviaQA等七大問(wèn)答數(shù)據(jù)集上測(cè)試,70億參數(shù)監(jiān)督微調(diào)模型搜索能力達(dá)33.06,140億參數(shù)模型達(dá)33.97,超過(guò)谷歌搜索的32.47。
成本效益:使用谷歌搜索進(jìn)行約64,000次搜索查詢訓(xùn)練,成本約586.70美元,而用140億參數(shù)大模型在四個(gè)A100 GPU上模擬訓(xùn)練,成本僅70.80美元,成本降幅超80%。

ZeroSearch應(yīng)用場(chǎng)景
智能問(wèn)答系統(tǒng):可以快速準(zhǔn)確地回答用戶問(wèn)題,適用于智能客服和智能助手等場(chǎng)景。
企業(yè)內(nèi)部知識(shí)管理:企業(yè)可以利用ZeroSearch搭建高效的知識(shí)搜索平臺(tái),員工能夠快速定位所需信息,提升工作效率。
項(xiàng)目地址
項(xiàng)目官網(wǎng):https://alibaba-nlp.github.io/ZeroSearch/
GitHub倉(cāng)庫(kù):https://github.com/Alibaba-nlp/ZeroSearch
HuggingFace模型庫(kù):https://huggingface.co/collections/sunhaonlp/zerosearch
arXiv技術(shù)論文:https://arxiv.org/pdf/2505.04588
提交您的產(chǎn)品
Ai應(yīng)用
Ai資訊
AI生圖
AI生視頻
開源AI應(yīng)用平臺(tái)










