2018年12月12日 星期三

續:票投國民黨還是不投民進黨-跨層次推論的方法


接續回應熱烈的前文票投國民黨還是不投民進黨?我運用跨層次推論(生態推論 Ecological Inference)的方法,應證了前文所講的:國民黨在高雄選勝主因並非倒戈,而是將上一次不投票的人,動員出來投給韓國瑜;以及今年不少民進黨支持者未出來投票。


一般而言,整體資料不能推論個體層次的行為,會有「區位謬誤」的問題。例如一個經典的例子:移民越多的區域,識字率也越高。原因不是移民識字率比較高,而是移民居住在都市,而都市識字率較高。

但是「跨層次推論」,可以克服這個問題,我主要使用Gary King的方法簡單來說是在一些前提假設[1]下,運用電腦模擬的方式,創造出數十萬套虛擬的個體資料,然後挑選出當中相似機率較高的出來進行估計。我透過R的"eiPack"套件進行分析,每個縣市大約模擬五十萬種個體資料可能的分配,挑選出當中合適的一千套樣本計算平均。




下面這個表是運用跨層次推論出「個體層次在兩次選舉中的投票行為」。DPP14代表2014年投給民進黨,KMT18代表2018年投給國民黨,non代表未投票與投給其他候選人。交叉表的部份例如[DPP14 , DPP18]=31.5,代表2014年投給民進黨、且2018年也投給民進黨的人,佔所有選舉人的31.5%。



  • 高雄



從高雄來看,綠營倒戈藍營僅佔7.2%,真正藍綠得票消長是靠動員出未投票的人出來投韓國瑜這群人,[non14 , KMT18]讓韓國瑜支持率足足多了12.6%;再加上今年不投票的14年綠營支持者,讓陳其邁少了5.8%。這種「出門投國民黨、窩在家不投民進黨」的效果,一來一往讓雙方支持率差了18.4%,換算成今年的選舉得票率,那是足足差了25%!



  • 台中



至於台中,也與上一篇文章的散佈圖所推測的一致,台中藍綠得票消長的主要原因,在於有7.7%民進黨2014年的支持者今年不願意出來投票。不過倒戈的也佔了5.6%。


  • 桃園

桃園則比較意外,從跨層次推論的估計來看,跟我原先預期的有點不同,不少2014民進黨的支持者這次也沒出來投票,但有更多2014年藍營的支持者倒戈與不出來投,才造成這次國民黨支持率下降、民進黨維持的情形。



  • 台南


為了方便運算,台南部分我仍將有大量得票的虧雞與陳永和列入non當中,視為未投票或沒投給國民兩黨人。台南的結果也如我所說,幾乎沒有倒戈的情形發生,而是大量民進黨支持者不投票或是投給其他黨籍的人。



  • 南投


 
倒戈最嚴重的縣市發生在南投,也是所有縣市中,國民黨支持率增加與民進黨支持率減少相關係數最高的一個縣市(r^2=0.75)。從跨層次推論的分析來看,南投國、民兩黨支持率的變化幾乎來自於倒戈。

以下則是所有縣市的結果。簡單整理各翻盤縣市的最大原因整理如下:
藍色選民蜂擁而出:高雄
綠色選民不想出來:臺中、雲林、嘉義市、澎湖
由綠轉藍:宜蘭、彰化、南投


跨層次推論解決了區位謬誤的風險,不過在這邊我還是提醒,跨層次推論的方法,在做估計時有相當強烈的假設,多數資料幾乎難以符合假設,這絕對會造成估計上的偏誤;而且估計出來的個體資料並非真實資料,而是最可能的資料,故此方法目前仍有爭議。最終的推論最好還是要回到個體資料上。

(不過這邊提醒,個體資料在問投票時,敗選方往往選擇緘默或回答沒投票,因此估計也不一定完全準確。)



[1]跨層次推論至少有兩個前提,其實都相當不可能達成。我們能夠將整體資料中 個地區的兩個變數X、Y所佔比例寫成下列的表。βai代表i地區Y=1|X=a的機率。

第一個假設是Yi|Xi要獨立於其他地區,也就是不能有空間上的自相關;翻成白話是各地區倒戈的情況,不能有空間上的相關性,某些鄰近地區倒戈率較高、某些地區較低。
第二個假設是Xi要獨立於,翻成白話,倒戈的機率,不能因為該地區是藍營票倉還是率營票倉而有所不同。

這兩個假設,用想的就知道不太符合現實,這會造成估計上的偏誤,這也是為何我說最好還是要回到個體資料上。





2 則留言:

  1. 請問也是"三腳堵"的嘉義縣與嘉義市的戰局,投給無黨籍候選人的選票如何歸類?

    回覆刪除
    回覆
    1. 無黨籍除了柯文哲,我都跟未投票算入non當中。因為無黨籍得票變異若是不夠大,無法估初個體層次上的投票行為。

      刪除