◎ 113年度計畫團隊技術組
一、生成式AI與RAG
本循證科普專欄曾於今(2024)年4月與6月發佈了關於生成式人工智慧(generative artificial intelligence,生成式AI)上篇與下篇之介紹文章,同時也提及檢索增強生成(Retrieval-Augmented Generation, RAG)的概念與實例。簡言之,生成式 AI作為AI技術的其中一個分支,原理是利用大量公開資料訓練大型語言模型(Large Language Model, LLM),使其在通用領域知識具備一定水準,進而解析使用者的提示詞(prompt)透過機率估算(或文字接龍)以生成其回應(response)。
由於LLM的回覆績效極度仰賴訓練資料之品質(預訓練知識,如流程圖),儘管網路上確實有大量公開文本,但有時卻難辨真假或判斷取材是否偏頗,而且特定專業領域或機敏文本也通常難以公開流通。因此生成式AI的幻覺(hallucination)疑慮至今仍是使用者必須高度關注且需要時刻注意的挑戰。緣此,RAG進一步結合了搜尋引擎與生成式AI技術,透過組織內部提供專業或機敏文本(自訂知識庫,如流程圖),再進一步融合即時的網際網路搜尋(RAG+Web Search)之成果(Sophia, 2024)。如流程圖所示,使其內容可透過生成式AI並根據使用者提示詞,轉化成淺顯易懂且相對更為可信的回覆。

二、 RAG在公部門的應用
如上述所述,RAG能夠透過整合歷年累積的施政報告、研究資料、與現有資訊系統蒐集累積的資料等組織內部專業領域文本,以提升通用生成式AI的品質進而輔助決策者迅速獲取關鍵資訊,提升政策制定的精準度,對於政府循證治理有所助益。以法規遵循方面為例,RAG能協助公務人員檢索相關法條、施行細則與辦法,確保機關操作合乎法律規範;對於民眾陳情的回覆,RAG也能將即時過往類似案由的陳情內容與回覆、以及相關公文與法規,協助公務人員研擬精準且即時的回應。
舉例來說,印尼政府財政部參考Fajar Febrian與Figueredo(2024)之研究,運用 LangChain與RAG技術開發 KemenkeuGPT,應用於政府財政數據和法規資料庫,使用印尼財政部、印尼統計局和國際貨幣基金組織(IMF)自 2003 年至 2023 年共二十年間的資料,輔助印尼政府規劃更好的財務決策。該研究顯示導入RAG對該模型的效能產生正向影響。研究發現亦指出:印尼財政部專家認為KemenkeuGPT可作為輔助決策的重要工具,基於循證決策的概念,可以此作為制定政策的依據。隨著技術進展,RAG勢必可被逐步運用於公共服務、民主參與、及政府內部行政管理的多元任務。
參考文獻
112年度計畫團隊技術組(2024)。生成式AI簡介與應用(上),循證尋政,4月。https://pse.is/6hazfc
112年度計畫團隊技術組(2024)。生成式AI簡介與應用(下),循證尋政,6月。https://pse.is/6hazdb
Fajar Febrian, G., & Figueredo, G. (2024). KemenkeuGPT: Leveraging a Large Language Model on Indonesia’s Government Financial Data and Regulations to Enhance Decision Making. arXiv e-prints. https://pse.is/6m3gnl
Sophia Parafina (2024).RAG with Web Search.DEV, April 30. https://pse.is/6mu8yz