PaSa
PaSa簡介
PaSa-Agent.ai是字節(jié)跳動推出的一個基于強化學習的學術論文檢索AI智能體,能夠自動調用搜索引擎、閱讀論文并追蹤引文網絡,為用戶提供精準的學術文獻檢索服務。

PaSa核心功能:
智能檢索:PaSa-Agent能夠像人類研究者一樣,PaSa能夠根據用戶輸入的學術問題生成多樣化的搜索關鍵詞,自動調用搜索引擎,并執(zhí)行多次搜索,生成并執(zhí)行多樣化的搜索關鍵詞,以覆蓋更廣泛的學術文獻。
復雜查詢處理:專為處理復雜的學術查詢設計,能夠理解詳細的研究需求,包括特定算法、研究方法或領域內的細微差別。
引文網絡導航:不僅查找論文,還能通過PaSa追蹤相關論文的引文網絡,幫助用戶發(fā)現(xiàn)相關文獻和研究背景。
支持多領域查詢:雖然目前主要支持計算機科學領域的學術查詢,但未來將逐步擴展到其他學科領域。
閱讀和分析論文內容:通過Crawler和Selector兩個核心組件,PaSa能夠高效地收集和篩選相關論文,確保檢索結果的精確性。
選擇相關參考文獻:PaSa能從海量文獻中篩選出與用戶查詢最相關的參考文獻,提供全面且準確的搜索結果。
PaSa性能亮點:
超越傳統(tǒng)搜索引擎:在RealScholarQuery基準上,PaSa-7B模型在recall@20和recall@50指標上分別比Google Scholar高出37.78%和39.90%,顯示了其在學術搜索領域的卓越性能。
與大型語言模型結合:盡管訓練于合成數(shù)據,PaSa的性能超越了包括Google、Google Scholar、以及支持搜索的GPT-4o在內的多個基線系統(tǒng)。
PaSa技術原理:
PaSa的核心包括兩個主要的LLM智能體:Crawler和Selector。Crawler負責通過搜索引擎收集與用戶查詢相關的學術論文,而Selector則負責精讀每一篇論文,評估其是否符合用戶需求。PaSa使用強化學習(RL)和近端策略優(yōu)化(PPO)算法進行訓練,通過合成數(shù)據集AutoScholarQuery和真實世界查詢基準RealScholarQuery來提升搜索效率和準確性。

PaSa應用場景:
PaSa適用于學術研究、教育和企業(yè)研發(fā)等多個領域。在學術研究中,PaSa可以幫助研究人員快速定位領域內的里程碑論文,避免漏檢冷門研究。在教育領域,學生可以使用自然語言描述需求,PaSa自動推薦分級文獻。在企業(yè)研發(fā)中,PaSa可以實時追蹤最新技術動態(tài):
學術研究:研究人員可以利用PaSa快速找到相關文獻,節(jié)省時間,提高研究效率。
文獻綜述:在撰寫文獻綜述時,PaSa可以幫助研究者全面收集和分析相關文獻。
教育領域:教師和學生可以使用PaSa進行課題研究和文獻查找,提升學習效果。
跨學科研究:PaSa的多領域支持使其適用于跨學科的研究項目,幫助研究者獲取不同領域的文獻。
如何使用PaSa-Agent.ai進行學術查詢和文獻檢索?
在線使用
訪問網站:訪問PaSa-Agent.ai網站。
輸入查詢:在搜索框中輸入您的學術問題或研究主題。
獲取結果:系統(tǒng)會自動調用搜索引擎,瀏覽相關論文并追蹤引文網絡,最終提供精準、全面的學術論文檢索結果。
本地部署
數(shù)據準備:下載并準備數(shù)據集,包括AutoScholarQuery和RealScholarQuery。
模型準備:下載PaSa-7b-Crawler和PaSa-7b-Selector的模型檢查點。
運行PaSa:按照提供的指南克隆GitHub倉庫,安裝依賴項,并運行PaSa。
PaSa-Agent.ai還具備強化學習優(yōu)化的能力,使用合成數(shù)據集AutoScholarQuery進行訓練,這個數(shù)據集包含35,000個細粒度學術查詢及其對應的論文。此外,PaSa還開發(fā)了RealScholarQuery基準,收集真實的學術查詢,以評估其在更真實場景下的表現(xiàn)。
提交您的產品
Ai應用
Ai資訊
AI生圖
AI生視頻
開源AI應用平臺









