您使用的是較舊的瀏覽器版本。若要獲得最佳 MSN 體驗,請使用支援的版本

不準民調扭曲選舉結果

中時電子報 中時電子報 2015/12/10 吳統雄

這次總統大選各坊間民調反映各組搭檔的數字相差懸殊,民調數字和選舉結果會不會有落差?若就歷史事實來看,答案為「是」。

以上次總統大選為例,民進黨提名民調,5家機構全部預測蔡英文贏標準化百分比10%,結果是輸近7%,誤差達到近17%!各級選舉中,民調誤差近20%的例子很多,只是沒有改變選舉結果,很容易被忽略與遺忘。

2014年的選舉,不準確的民調有可能改變了真實的民意結構。去年投票率不到標準化65%,是大型選舉史上最低,比平均低8%,如果分析各都市縣到區里的投票率、得票率,會發現絕對多數的區域,投票率所減少的百分比,恰好是藍營比歷年得票所減少的百分比。由於去年綠營贏7%,如非不投票者大增,藍營應倒贏1%。

這個現象是「不準確民調」、「選民結構」與「社會相信會造成事實」交互作用的效應。台灣「選民結構」中有8~16%的政治輕疏離群,如無可威脅之事、無可感動之人,通常不投票。當長期被「不準確民調」洗腦,認為選舉勝負差距太大,自己已不可能改變時,更不會投票,造成真正的小差距變大差距、甚至扭轉勝負的結果。從古典的「三人成虎」,到現代的「沉默螺旋」理論,這種「社會相信會造成事實」的史蹟屢見不鮮。

而「不準確民調」產生的原因,不外主觀扭曲或客觀能力不足。民調不可避免有商業化性質,委託人與製作者有為營利而聯合作假,捏造民調數字的事例。

民調不準確的客觀能力有如下幾項。第一、不正確方法的系統化、主流化。台灣民調界使用的CATI(電話調查資訊系統)幾由1家獨占,著重便於生產與降低成本,而非正確性。維持正確性的3大前提是:隨機性、樣本數、抽樣方法。「隨機性」就是每個樣本必須有相同被抽中的機會,實務上必須掌握包含所有選民的「母群清冊」,同時每個被抽出的樣本不得替代。

錯誤工具得到錯誤結果

當前許多人的電話不登記,所以只採用電話簿抽樣,不使用隨機撥號,一定不準。如果沒有作戶中抽樣,通常會發生男性、老年人偏少的情形,但主流CATI在女性樣本足夠後,便不准再訪問女性。這叫「配額法」,是倒果為因的非隨機法。

CATI或提供「加權法」,根據「性別、年齡」來加權。但中外研究史上,證明加權只是會美化包裝、創造更不實的數字。

坊間民調報告都有1句:「本調查訪問1067個樣本數,正負誤差約為百分之3」的「樣板敘述」。在學理上,這是二項分配的一個特殊情形,必須在滿足隨機性條件前提下、只有2位候選人、每一位受訪者都回答、且「樣本獲票」兩候選人剛好各為50%時,才可以推論。在實務上幾乎從來不曾符合過以上條件。

民進黨委託總統選舉調查的例子,不可能作假,卻能證明5家都綁在同一錯誤工具上,使用同一工具,不論誰操作,都會得到相同的錯誤結果。

第二、社會變遷,不易找到樣本,行動電話取代市內電話,家庭行為異質化。行動電話大幅度取代市內電話,各調查機構還報告「高數字的所謂成功率」,其實都是大量增加替代樣本,未反映真實的結果。市內電話調查已經到了誤差值超過觀察值的時代,在研究方法與調查科技改善上,尚待調整。(作者為世新大學資訊管理學系副教授)

更多來自中時電子報的文章

image beaconimage beaconimage beacon