◎ 李俊達(臺北市立大學社會暨公共事務學系教授)、劉自平(臺北市立大學社會暨公共事務學系助理教授)
本文針對「少子女化衝擊」課題,透過焦點座談受邀專家與GRB系統作為主要人才資料蒐集來源,包含領域專家名單及專家對應之著作文本內容。選擇這兩大來源作為人才蒐集的起點,主要目標在於提升資料的精確性與完整性,並藉由將人才姓名與著作資料納入檢索增強生成系統,以提供更準確的人才推薦結果。
首先,盤點既有人才資料階段。本文針對「少子女化衝擊」相關議題進行人才盤點,依據以下關鍵字設定範圍:托育與幼兒服務(如公托、準公托、保母等)、居住協助政策(如社會住宅、租金補貼等)、友善職場政策(如育嬰留職停薪津貼、彈性工時等)、生育獎勵與津貼、家庭教育政策(如性別角色、平權等)。
為了蒐集更具代表性的專業人才,設計「專業領域人才推薦問卷」,邀請專家填寫,並運用滾雪球抽樣法以擴充人才資料庫。人才資料來源分為兩大類,分別為:1、焦點座談會受邀專家:作為第一輪滾雪球抽樣的起點;2、GRB系統:透過課題關鍵字搜尋,篩選相關研究計畫的作者作為第一輪滾雪球抽樣對象。
自行政院於2018年7月核定《我國少子女化對策計畫》後,臺灣總人口數於2020年正式進入負成長階段。為完整觀察政策發展與研究趨勢,本文將GRB系統搜尋範圍設定於近五年內的相關計畫,以確保研究資料的時效性與代表性。
再者,為焦點座談與人才資料蒐集。由於國內專家學者較少主動維護個人學術資料庫,若僅依賴網路爬蟲技術蒐集資料,仍需人工驗證與補充。因此,本專案透過焦點座談會作為主要方法,以系統性方式達成資料蒐集目標。在具體作法上,分別有:1、焦點座談會發送人才蒐集問卷:問卷將提供給受邀專家,請其填寫相關專業領域資訊;2、GRB系統篩選之研究計畫作者:問卷亦將發送給GRB系統搜尋所得的計畫作者,請其根據各個課題關鍵字,推薦1至5位學者專家,並提供1至2篇相關政策或研究文獻。
其人才與文本蒐集結果,透過推薦機制蒐集到17位焦點座談專家。另外,依據GRB系統搜尋結果,蒐集58位專家學者。總計整理超過300篇相關政策或實務研究文本。透過滾雪球抽樣法,除了可擴充GRB系統外部的潛在人才,也能進一步提高資料的多樣性與代表性。此外,在研究初期,本文亦針對相關領域專家進行深度訪談,以獲取議題面向設定、可取得的數據與資料來源、適用的研究分析方法,該訪談結果亦可作為後續文本分析的補充資料。
最後,運用AI資料進行資料處理與建置人才推薦系統。除了傳統資料蒐集方式,本文亦採用AI技術,透過自然語言處理(NLP)與檢索增強生成(RAG)技術,提升資料處理與人才推薦的效能。其優勢在於收集專家學者的研究文本,透過AI分析,萃取關鍵字與專長領域,且透過語言模型解讀文本內容,歸納出更全面的關鍵字詞彙。另外,AI技術自動比對專長領域與文本關鍵字,進行專家分類與推薦。針對研究文本中提及的重要人物名稱進行額外歸納與儲存,以擴充資料庫內容。
本文透過焦點座談專家名單與GRB系統,建立「少子女化衝擊」課題之專業人才資料庫,並結合AI技術提升人才推薦準確度。透過滾雪球抽樣與深度訪談,確保人才來源的多元性;同時,利用自然語言處理技術解析研究文本,進一步擴充人才資料與專長分類。未來可進一步優化AI演算法,以提升資料分析與政策研究的應用價值。