跳到主要內容

發表文章

目前顯示的是 6月, 2025的文章

RAG整理

RAG(檢索增強生成)課程重點整理 RAG,全名為檢索增強生成(Retrieval-Augmented Generation),有時也稱作檢索增強語言模型(Retrieval-Augmented Language Model, RALM)。它是一種旨在透過允許語言模型從外部來源檢索資訊來增強其能力的技術。 一、 RAG 的基本框架與必要性 1. RAG 是什麼? RAG 是一種提升語言模型(LM)能力的方法,使其能「查閱」外部知識庫,而非僅依賴訓練時所學的靜態資訊。 2. RAG 為何必要?語言模型的局限性: 長尾知識與幻覺 (Hallucination) :語言模型難以準確回憶訓練資料中不常出現的「長尾」資訊,容易產生看似合理但實際上錯誤的「幻覺」。例如,模型能正確識別蔡英文,但可能對陳縕儂的細節產生幻覺。RAG 透過查詢外部知識來補充這些「小眾」知識。 知識過時 (Outdated Knowledge) :語言模型的知識固定在其訓練時間點,無法獲取即時或頻繁更新的資訊(如即時股價、最新選舉結果)。雖然「知識編輯」是更新LM知識的研究領域,但RAG提供了一種透過即時資料檢索來解決過時知識的方法。 缺乏溯源性與可驗證性 (Lack of Traceability and Verifiability) :傳統語言模型通常不提供資訊來源,難以驗證其答案。RAG 可以為檢索到的文件提供明確的來源,提升答案的可驗證性。 3. 基本 RAG 的實作流程 (早在2020年就已存在) 最基礎的 RAG 方法包含在生成過程開始時進行單次檢索: 查詢輸入 (Query Input) :使用者提供一個查詢。 檢索 (Retrieval) :檢索器元件從外部知識來源(如網路或內部資料庫)搜尋相關的文本片段或文件,這就像是當你不確定時「打開書本」查找資訊。 拼接 (Concatenation) :將檢索到的資訊直接與原始查詢拼接起來。 生成 (Generation) :這個組合後的輸入(查詢 + 檢索到的上下文)隨後被送入語言模型的輸入層,LM 根據這些資訊生成回應。這種方法能顯著減少幻覺並解決資訊過時問題。WebGPT 模型就是一個例子,它模仿人類搜尋行為,生成搜尋查詢,選擇相關結果,並引用來源來回答知識密集型問題。 二、 進階 RAG 技術:提升性...