此網頁需要支援 JavaScript 才能正確運行,請先至你的瀏覽器設定中開啟 JavaScript。

::: :::

滾雪球抽樣與初期人才資料庫建置

劉自平 (臺北市立大學社會暨公共事務學系助理教授)

  本計畫建立人才資料庫之流程為,待確定人才資料庫中所需涵蓋的資料內容後(以本計畫為例,目前包含:專家姓名、相對應之議題關鍵字、單位、職稱、著作以及ORCID等六項變數),藉由各個課題組所舉辦之專家會議,向與會專家發放問卷。問卷中除詢問專家上述所需之資料外,亦請受訪專家就各課題所訂定之各個關鍵字,再額外推薦一至五位專家。上述流程將會以滾雪球抽樣方式持續進行(即持續訪問受推薦之專家並請其繼續推薦其他專家)。
  在專家數量不大的情況下(以本計畫為例,在三位數以下),上述之較為傳統的資料庫建構流程,事實上為人才資料庫建初期較為有效率的方法之一。首先,資料庫建構小組不需要具備課題或關鍵字相關知識,即可依據專家所提供之問卷結果建置資料庫。再者,可藉由訪問受推薦專家時,除請其推薦其他的專家外,並同時請其確認相關資訊(例如:相對應關鍵字、著作和ORCID等)。
  藉由上述方法,本計畫在人才資料庫建置初期會以「精確」作為主要目標。而待人才資料庫內容累積至一定程度時,可以資料庫中之相關著作,訓練語言模型,在未來以具有相關關鍵字之著作搜尋、那如其他學者專家。簡言之,雖然本計畫在人才資料庫建構初期以較為傳統人工方式,同時建議在未來或可就既有之人才資料庫,以網路爬蟲和文本分析等現代方法,重新建構或擴充人才資料庫,並同時輔助訓練所需之語言模型。

已發佈

作者:

分類:

標籤: