您使用的是較舊的瀏覽器版本。若要獲得最佳 MSN 體驗,請使用支援的版本

社論-政府大數據資料分析應更上層樓

中時電子報 中時電子報 2015/12/21 主筆室

行政院歷時逾年的「大專以上畢業生就業狀況」大數據分析,於日前公布,這項大數據分析由教育部、勞動部分別進行,其結果與過去抽樣推計的數據出現若干差距。大數據與傳統的統計,孰輕孰重,有必要進一步探究。

我們過去對青年人就業、薪資的印象多來自人力資源調查、人力運用調查、職類別薪資調查與受僱員工動向調查,這些調查統計有些是訪查兩萬戶家庭推計而得,有些是調查一萬家廠商估算而得,與本次取自勞退資料檔、所得稅檔數百萬筆資料相比,自然有天壤之別。

行政院本次的大數據運用是透過大專畢業生就業追蹤系統,進而掌握勞保、勞退及所得稅等資料檔,教育部所發布的薪資係取自所得稅檔,其所列的各學歷月薪係包括年終獎金、加班費的平均月薪;而勞動部發布的薪資是取自勞退資料檔,勞退提繳工資不含加班費及年終獎金,比較貼近一般認知的經常性薪資,也就是月薪。正因為兩部會的大數據來源不同,因此所估得的月薪也有出入。

例如,依教育部的資料,取得碩士者第一年工作的月薪4.4萬元,勞動部的資料僅3.8萬元;取得博士者第四年的月薪,教育部說是9.2萬元,勞動部的資料僅6.9萬元。這個差距就在於勞動部發布的是「經常性薪資」,而教育部發布的是含有年終獎金、加班費的「平均薪資」。

這個結果與過去抽樣推計結果差多少?比對一下職類別薪資調查裡的起薪,以101學年度畢業(畢業時間為102年上半年)為例,職類別薪資調查裡具專科、大學與研究所(含碩、博士)學歷的初任人員「經常性薪資」,依序為23,890元、26,915元、32,017元;本次勞動部大數據裡的專科、大學、碩士與博士畢業,第一年「經常性薪資」是26,992元、26,032元、38,880元、58,388元。

很明顯,往日的調查除了大學學歷的起薪與大數據相近,其餘皆低估,專科學歷低估了三千元,而研究所學歷更低估了七千元,其間的差距或源於定義不盡相同,但不可否認的是這當中必然有統計誤差。大數據直接取得母體資料,沒有抽樣推估的誤差,有助於進一步了解經濟問題的真相。不過,這並非說大數據可以全然取代平日的抽樣估計,而是說兩者可以相輔相成,藉由抽樣以快速了解問題,透過大數據分析以深入問題核心。

今年6月底行政院為評估軍公教該不該加薪,首次以大數據分析民間加薪的情況,財政部以稅檔資料、勞保投保資料、投保單位行業別及政府機構清單,交互比對,篩選出各行業近三年加薪的情況。由於仍有22%~41%的人薪資呈負成長,因此行政院做出軍公教不加薪的決定,行政院長毛治國對此表示:「相對於過去傳統的統計方式,這份資料可看到公共政策的更多面向,代表大數據分析是正確的應用工具,可透過大數據分析觀察有價值的資訊,值得肯定。」

政府今年下半年已兩度運用大數據分析台灣當前的就業、薪資情勢,對大數據的運用已日趨熟練,我們認為以政府所擁有的稅檔、勞保、公保、金融、土地等龐大資料檔,若善於運用,還可以讓大數據的分析更上層樓,至少可以在以下三方面繼續努力:

其一,運用至所得分配的分析:我國所得分配統計長期以來一直仰賴主計總處辦理的「家庭收支調查」,這項調查以取得的一萬六千餘戶樣本去推計八百多萬戶的家庭所得分配,由於樣本數不夠多,僅能推估前20%與後20%家庭的所得差距,無法推計前5%、1%金字塔頂端所得集中的情況,行政院可以運用綜所稅檔、勞退及公保等資料檔,進一步推計台灣近年的所得差距。

其二,運用至財富分配的分析:美、歐各國除了關心所得分配之外,他們更關心財富分配,財富包括家庭持有的存款、股票、債券及房地產,相較於所得,這些資料更敏感,難以藉由訪查而獲得。但如果政府願意的話,依舊可以藉由財稅資料、金融體系等大數據資料,取得家庭資產淨額分配的情況,如此一來我們即可了解近年隨著房市、股市大起大落下,財富集中的情況已到什麼程度。

其三,運用至海外就業人數的推計:隨著全球化生產,國人赴海外就業的情況愈來愈普遍,但迄今我國一千一百多萬就業人口裡,究竟有多少人是在大陸、越南、歐洲工作,長期以來一直是個謎,雖然主計總處曾嚐試估算,但十多年來依舊杳無音訊。行政院應以跨部會的資源,藉由戶政、入出境及勞保等大數據的比對儘速完成估算,海外就業情勢的變遷與我國經濟、產業、消費等經濟活動息息相關,對於政府施政極為重要,不宜再延宕下去。

我們認為行政院今年以來兩度公布的大數據分析,解開了許多統計迷思,釐清了不少外界的誤解,值得肯定。政府擁有稅檔、戶政、地政、金融、勞保、勞退、公保及健保等大數據資料庫,未來應讓大數據分析更廣泛的運用,而上述財富分配、所得分配及海外就業這三項推計尤為緊要,實不宜再拖下去了。

更多來自中時電子報的文章

image beaconimage beaconimage beacon