聽說了嗎,智能問答界又出現了 KAG,跟 RAG 有什么區別?
在智能問答領域,新技術不斷涌現。繼上期探討 RAG(檢索增強生成) 技術后【點擊閱讀原文】,近期 KAG (知識圖譜增強生成)技術又引起熱議。
通用RAG技術無法完全解決模型幻覺
RAG 技術的出現,宛如給大模型外掛了一個知識庫,助力大模型通過相關的知識片段快速精準作答。
但是,根據螞蟻集團發布的測評報告,盡管普遍認為引入 RAG 和外部知識庫能有效避免大模型的幻覺問題,但實際情況卻并非如此,這種方式產生的幻覺問題更為隱蔽。
螞蟻集團測評報告
如上圖所示,原文中提到功能飲料中的維生素、礦物質等成分對運動后補充身體營養、消除疲勞有益,而經模型重寫后,可能被錯誤地描述為 “對增加疲勞有一定作用”,這種誤導性信息會給用戶帶來極大困擾。
此外,通用 RAG 還存在實體反轉、合并錯誤、概念替換等問題,當模型生成的內容達到數百甚至數千字時,這些細節錯誤更是難以察覺。評估結果顯示,即便加入了 RAG 技術,大語言模型仍然存在 30%-40% 的幻覺率,這一比例不容小覷。
垂直領域對大模型有更高的要求
在真實的業務決策場景中,無論是生成研究報告還是處理車險理賠等復雜問題,都需要經過嚴格的步驟,包括問題規劃、數據收集、執行決策以及生成和反饋等流程。
在將大語言模型應用到專業領域時,也必須有一個嚴格且可控的決策過程。基于大模型提供專業知識服務時,就需要滿足以下條件:
首先,確保知識的準確性,涵蓋知識邊界的完整性以及知識結構和語義的清晰性;其次,具備邏輯嚴謹性、時間敏感性和數字敏感性;最后,還需要完備的上下文信息,以便在知識決策時獲取充分的支持信息。
2024年9月,螞蟻集團和浙江大學聯合推出了基于知識增強的、面向垂直領域的可控生成框架 KAG(知識增強大模型服務框架 )。經驗證,在政務問答場景中,相較于傳統的 Naive RAG 方法,KAG 技術將準確率從 66% 提升到了 91%。在醫療問答方面,準確率超過 80%,在更垂直的指標解讀任務上,已達到 90% 以上的準確率。
KAG對比RAG的優勢
對比RAG技術,KAG有以下幾個明顯的優勢:
#用戶操作:在上傳文檔時,RAG 支持常見的 pdf、word、txt 格式。KAG不僅能裝這些,還能上傳已有知識圖譜,知識來源豐富。
#技術路線:RAG 主要執行自己的索引策略,把文檔轉化成向量存進知識庫,好比把書分類放上書架。
KAG同時進行 RAG 和 KG 兩種索引策略,一邊構建向量知識庫,一邊自動構建知識圖譜,相當于同時打造兩個相互關聯的 “知識宮殿”,知識儲備更豐富、更有序。
#執行問答:RAG 向量化問題后,從向量知識庫中檢索相關文本塊,然后生成答案,像在書架上找書,找到就開始讀。
KAG同時運用 RAG 和 KG 兩種檢索策略,不僅召回相關文本塊,還從知識圖譜里撈出相關實體和關系,把這些信息組合起來后,讓大模型生成的答案更準確、更有邏輯。
執行問答階段RAG與KAG的技術路線區別
KAG 技術的引入與應用
金現代除了通過采用“創新性切分算法、自主召回策略、智能檢索重排、可視化切分配置”等手段對通用RAG進行微調,顯著推動大模型在垂直領域的應用和能力提升。
還率先將 KAG 技術應用在金現代小金智問?智能問答平臺中,使得用戶對準確率有極高要求時,小金智問可以靈活應對。
以最常見的差旅費管理場景為例,面對問答場景 “2021 年普通員工出差到武漢住宿最高限額是多少” ,RAG僅靠向量庫檢索給出260 元的錯誤答案,KAG 借助向量庫和知識圖譜檢索給出220元的正確答案。
金現代小金智問借助KAG實現的問答效果
從對通用 RAG 的優化提升,到率先引入 KAG 技術,金現代致力于通過技術創新讓智能問答在各類垂直領域發揮更大的價值,為企業AI場景落地提供有力支撐。