劉自平
臺北市立大學社會暨公共事務學系助理教授
《摘要》
近年來由於科技的突破,為各個層面帶來顯著提升。其中之一即為人力資源管理。在資料科學技術的幫助下,組織不論在資料前端(資料獲取、清理和存取等)以及資料分析上皆較以往更為有效率、更精確,進而可優化人才管理。然而,若要有效地透過資料驅動達成人力管理,組織本身亦需要培養出相對應的資料素養(data literacy)和嚴謹的研究設計文化。當組織內部和管理階層建立起來好的資料治理素養後,將能夠產出更精準的分析結果,達成真正的資料驅動。
關鍵字:資料科學、資料驅動、人力資源管理、組織管理
壹、何謂資料驅動管理
科技一直以來高度影響人類生活的各個層面,從基本的食、衣、住、行,到進階的危機管理和人力資源管理等,皆深深受到科技發展的影響。其中,隨著資料科學在近年來的進步與突破,不論在處理/運算速度上的提升(包含硬體,如除理器;和軟體,如演算法等)、類神經網路(neural network)和深度學習(deep learning)的開發,以及人工智慧(artifitual intellegence,AI)的發展等,使我們能夠更迅速、有效率地處理分析大量資訊外,並產生更精準地的分析結果。目前既有的人力資源管理方法,傳統上往往多是依循過往慣例或既有組織文化,或是高度仰賴決策者本身主觀的經驗與直覺,缺乏科學證據的客觀支持。是故,原本最初僅是專注在行政上的功能的人力資源管理部門,若能搭配與數據科學的結合,人力資源專業相關人員更能夠制定出更好的決策,為員工、甚至整個組織帶來更令人滿意的成果。隨著資料治理的技術可行性大幅提高,並且管理者可更廣泛地使用各種不同來源的資料和數據,使循證為依據的人力資源管理政策成為未來必然的趨勢。同時,組織愈來愈可能根據客觀的資料和分析方法,發展出不同以往的模式進行招募、分發、培訓、激勵和留任員工,以及形塑組織文化等等。
所謂的資料驅動管理,即是將資料驅動決策(data-driven decision making,DDD)此一方式運用至人力資源管理中;其中,相較於上述由決策者本身主觀的經驗和直覺主導決策的傳統途徑,資料驅動決策指的是將決策的過程建立於資料分析上(Provost & Fawcett, 2013)。簡言之,資料驅動決策即是藉由資料和資料分析,幫助決策者認清現實狀況(the state of nature),並因應現狀選擇最有價值、效益的行動(Brynjolfsson, Hitt & Kim, 2011)。總的來說,以目前資料科學的發展與實踐來看,資料驅動管理即是透過將機器學習和人工智慧等資料科學技術進行之資料蒐集和資料分析結果,應用於人力資源管理中。本文將從組織行為分析、資料蒐集與管理,和人才管理等三個面向,討論資料驅動管理的實踐。
貳、資料驅動於人力管理應用實踐之面向
一、組織行為分析
事實上,上述所提及之管理模式於公、私部門雖然早已行之有年,但近年來在大數據(big data)的普及化和機械學習(machine learning)技術上的突破(例如:類神經網路和深度學習),現代的資料驅動管理較以往更能夠提升決策結果的效率以及精確性。透過現代數據科學技術,不論在資料蒐集的廣度和資料分析的深度皆獲得鄉大大幅度地提升,進而使管理者得以進行比以往更為精確的資料分析。他們不僅能夠瞭解某些因素是否對於組織內部或外部的互動和行為產生影響,還能具體衡量這些影響的大小和規模。這不僅能讓管理者掌握組織內部現有行為模式及其對內外環境的影響,還能清楚分析這些行為如何影響整體績效。例如,通過數據分析,管理者能夠準確定位某項決策或政策如何影響銷售、員工滿意度或市場反應,從而進一步調整策略以提升整體競爭力。
此外,這些技術使管理者能夠挖掘和分析數據中隱藏的潛在模式與相關性。通過深入分析這些模式,管理者可以更全面地理解組織行為、互動過程以及其績效表現的深層次原因。這種數據驅動的洞察不僅僅是靜態的描述,還具有預測功能,能夠幫助管理者前瞻性地制定決策,避免潛在問題,並發現新的機會。例如,某些部門之間的協作效率可能不明顯,但透過新型態的資料(例如:過往共同執行會議的紀錄、過往共同執行的業務、甚或不同部門間公事信件往來等)和更為前沿的數據分析方法(例如資料分群分析『clustering』等),管理者可以藉由分析部門之見過往的互動模式,進而發現這些部門之間合作的可能和未來潛力,進而增強其互動效果,最終提升整體組織績效。
二、資料蒐集與管理
事實上,與傳統管理模式相比,新技術和方法的應用可以極大地降低對於人力成本和時間成本的依賴。在傳統管理中,許多流程,如資料紀錄、保存、調閱和分析,往往需要大量的人工介入,效率較低且容易產生錯誤。然而,藉由現代化技術的輔助,這些流程可以以更加高效的方式完成,從而不僅減少重複性工作所需的時間和資源投入,還能顯著提升資料分析的深度和廣度。新技術的應用將使得資料處理從原本耗時、繁瑣的操作,轉變為自動化、快速且精確的作業,進一步提高組織的運作效率。舉例來說,目前可藉由AI輔助將錄音檔內容直接轉換為逐字稿,此方式除提高資料轉換(音頻檔案轉換為文字檔案)的效率外,亦大幅降低資料轉換過程中可能產生的錯誤。
除此之外,資料科學技術的發展也使得組織能夠更靈活且有效地蒐集、使用和分析以往無法妥善處理的數據,特別是在過去人力密集型管理環境下難以有效利用的資料。該數據不僅限於傳統的結構化資料(如透過Excel等工具儲存的數字資料),更包括非結構化資料,如文字、圖片、影像和音訊檔案等(Khatri & Brown, 2010),這些資料在過去通常僅作為輔助性資料存在,難以納入系統化分析。透過資料科學技術,這些非結構化數據可以被自動化處理、分類和分析,進而挖掘出更多有價值的洞察。此外,半結構化資料(如JSON格式、HTML腳本等)、時間序列資料(time-series data,如股價指數)和定群追蹤資料(panel data)等,也能在這些技術的輔助下,進行更精準的分析和預測,從而使決策更加科學化。
總體來說,目前許多資料管理辦法仍僅限於使用硬體設備儲存非結構化資料,例如將文字檔案轉換為PDF格式儲存,並透過人工檢索方式進行資料的調閱和內容獲取。此些做法雖然能夠滿足基本的資料格式化和資料存取等需求,但其效率遠遠落後於當前資料科學技術所能提供的方法和途徑。透過自動化技術,非結構化資料的處理將無需依賴人工逐一檢索,系統可自動提取相關資訊並進行分析。例如,利用自然語言處理(natural language processing,NLP)技術,系統能夠快速從大量文字資料中提取關鍵資訊(例如:Dredze et. al, 2010),或是運用影像數據處理技術,自動辨識和分析圖片或影片中的內容(例如:Abid et. al, 2020)。又或者可藉由網路爬蟲(scrape)和文字探勘(text mining)等技術,直接擷取網頁上的內容並即時轉換成結構化資料儲存(例如:Liu, 2020)。
三、人力管理相關實踐
在資料分析方面,資料的分析結果將可在各種人力資源管理面向帶來提升和進步。首先在招募方面,人力資源專業人員可以利用數據分析,有效度地篩選履歷,藉以準確地識別出最佳候選人,甚至可歸納每位申請人未來在組織內適合的職缺以及預期未來發展的潛能。舉例而言,公司可以透過潛在類別分析(latent class analysis)等相關技術,根據應徵者的各項特質,分析其所適合的部門、業務內容、管理模式等等。除此之外,人力資源專業人員亦能從最基本的人口統計數據進行管理。舉例來說,可透過分析組織內部人力的年齡分布情況,以及其他各方面的人口特徵(是否已婚?等)可以了解不同群體於公於私會面臨到的潛在困難與問題,從而分析訓練需求,或是進行更合適的工作安排調整,甚至可讓管理人員更清楚地了解組織內部的詳細人力概況等等。
透過資料分析與探勘,人力資源專業人員可以識別獨特的職涯發展需求,進而量身制訂培訓計劃。其優勢在於,就員工而言,基於技能、興趣和目標的個人化職涯規劃,可以促進人才留任;就組織而言,除盡可能地適才適所,對於人力分布的掌握更為精確,可節省營運成本且提高組織效率,甚至可能從而提高員工敬業度和生產力。當然,在員工接受培訓之後,更可以蒐集員工的培訓資料、績效表現或是內部流動資料,加以分析各項數據之間的關係(例如課程設計、訓練成效等)。
另外,人力資源專業人員可透過數據分析,了解影響員工的工作情形及歸納特定的模式。例如,追蹤員工的出缺勤分析加班情況,從而連結到組織在推動某些方案時,是否時常需要額外人力支援。更積極的作法,還可以藉以適時調整政策,提供合適的工作環境,調整或增加人力和資源的分配。此外,人力資源專業人員可以蒐集內部的人力調任與離職數據,了解各職位的異動情況,以及組織整體的人力流動是否合理健全,進一步完善組織內部的人力管理。透過分析相關數據,人力資源專業人員可以識別影響留任的因素,可針對各種個案設計的介入措施,並創造有利於提高員工滿意度和忠誠度的工作環境。資料的分析結果也可以使人管理人員更精準地預測潛在的挑戰,例如營運與管理成本的提高、人員流失風險、本職學能差距或績效問題等等,從而能夠採取主動措施來解決這些問題,或避免這些問題成為組織的主要障礙。最後,透過分析時間序列或定群追蹤資料等,人力資源專業人員可以藉由現有的人力變化模式,預測未來的人才需求,甚至預測未來人員的技能差距,進而研擬具體的策略來因應,例如確定外來所需的人才條件與技術、辨別員工在各種面向的潛能,以及預測各部門內的人員流動狀況。
參、組織文化與資料驅動管理
然而,不論現代資料驅動的模式與方法再進步、再有效率,組織若無法培育組織內部對於資料科學與資料驅動的教育、使用、開發等,其對組織帶來的改變與進步依舊相當有限。為避免此結果,首先,組織本身需要具有良好的治理體系與文化(Koltay, 2016, ORACLE, 2015)。在資料治理開始之前,組織本身要能夠定義各種所需部門以及相應業務內容,爾後才能夠定義出「要找什麼資料」,也才能夠進一步定義出「要去哪裡找資料」、「資料怎麼紀錄/測量」,以及「如何跨部門整合合適的資料形式」等。資料驅動管理相當依賴資料的品質,如果資料品質不好,就其所分析出之結果對於決策並無太大幫助,甚至可能造成錯誤的結果。
除了資料標準定義以外,組織本身亦肩負資料管理的責任。是故,組織亦需要能夠清楚地定義出每筆資料相對應的監控管理部門和負責人及其團隊為何,以確保儲存資料的品質,確保資料後續的提取、辨識以及分析等等都不會有額外的問題。簡言之,當組織導入以資料驅動為導向的資料治理模式時,與導入其他管理模式、方法時一樣,需有認知到如此的引進與改變並非僅適用於特定人士、管理階層,或者特定部門等,而是實際上建立一個組織內部橫跨各部門以及所有人員的管理系統。
肆、管理層的資料科學素養
除組織內部的資料文化養成外,管理階層和組織本身亦需要培養有關資料分析和結果詮釋的素養與認知(Fattah, 2024)。此考量可從兩個面向來討論,首先必須要有認知資料分析本身並非有如「上帝視角」般的全知全能,而是藉由有限的資料和技術來推估「現實中的潛在機制與模式」。因而實際上,往往分析的結果通常不可能一次(或者幾次)就到位,產出令人滿意、信服的結果。在嚴謹的資料分析過程中,一定都需要有多方面且長時間的考量與嘗試。再者,需要建立起「不過度解讀分析結果」的認知。而要避免此一結果,則必須要培養建立起正確的「研究設計」觀念與態度。其中最常見的詮釋謬誤即為「倖存者偏差」(survivorship bias)(Carpenter & Lynch, 1999),歸咎產生此原因的問題在於分析者以「依變數」作為資料選擇的依據。舉例而言,若組織欲分析影響內部人員工作表現差異的原因時,卻僅僅只考量、收集訪問表現好(或表現差)的人員資料,最終的分析結果並沒有在不同之間的群體進行比較分析,亦無法帶給組織有用的資訊。
另外一個常見的詮釋謬誤,則是沒有認知到「相關性不等同於因果性」的事實。也因如此,決策者往往忽略現有資料科學技術主要提升的是「預測能力」(predictability)而非「因果推論」(causal inference)。雖然往往在理論上討論的是因果機制,但分析者在資料收集及分析資料時卻常常忽略了分析因果機制的幾個常見錯誤:第一,「因」和「果」的變化是必須要有時間上的差異,也就是說因必須要發生在果之前;再者,忽略必須確保果對於因本身也不具有影響,此即為統計分析中常見的內生性(endogeniety)問題;最後,在資料收集和分析是必須確保干擾因素(confounder)屏除於分析過程中。值得注意的是,上述的問題無論資料的品質再好、分析的技術再先進,僅能透過嚴謹的研究設計解決。是故總的而言,組織在導入資料驅動管理時除了在內部培養並發展「資料素養」(data literacy)的能力外(Koltay, 2016),亦應培養「研究設計」的相關能力,以避免將錯誤的分析結果作為事實,又或者錯誤解讀分析結果,進而造成對於組織無法挽回的錯誤發展。
參考文獻
Abid, A., Zhang, M. J., Bagaria, V. K., & Zou, J. (2018). Exploring patterns enriched in a dataset with contrastive principal component analysis. Nature communications, 9(1), 2134.
Brynjolfsson, E., Hitt, L. M., & Kim, H. H. (2011). Strength in numbers: how does data-driven decision-making affect firm performance. SSRN: https://ssrn.com/abstract=1819486.
Carpenter, J. N., & Lynch, A. W. (1999). Survivorship bias and attrition effects in measures of performance persistence. Journal of financial economics, 54(3), 337-374.
Dredze, M., Jansen, A., Coppersmith, G., & Church, K. (2010). NLP on spoken documents without ASR. In Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing (pp. 460-470). Association for Computational Linguistics.
Fattah, I. A. (2024). The mediating effect of data literacy competence in the relationship between data governance and data-driven culture. Industrial Management & Data Systems, 124(5), 1823-1845. https://doi.org/10.1108/IMDS-11-2023-0812
Khatri, V., & Brown, C. V. (2020). Designing data governance. Communications of the ACM, 53(1), 148-152.
Koltay, T. (2016). Data governance, data literacy and the management of data quality. IFLA journal, 42(4), 303-312.
Liu, T. (2020). Political scandals and political behaviors: Examining the effects of political scandals at three analytical levels. ProQuest Dissertations & Theses A&I. Retrieved October 29, from https://www.proquest.com/dissertations-theses/political-scandals-behaviors-examining-effects-at/docview/2502171916/s
ORACLE (2015). The Five Most Common Big Data Integration Mistakes to Avoid, CA: Oracle Corporation, October 20. https://reurl.cc/93ejNv
Provost, F., & Focett, T (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking (2nd ed.). O’Reilly Media Inc.