所以我打算採用的分析策略是傾向分數配對法(PSM)。由2018年八成以上的投開票所,與2014年的投開票所,投票的鄰里都完全相同,或是差異很小[1]。
因此我可以使用投開票所2014年的得票率,進行相似的批配。簡單來說:
「18年開很快、14年KMT低得票」與「18年開很久、14年KMT低得票」做配對
「18年開很快、14年KMT高得票」與「18年開很久、14年KMT高得票」做配對
這個動作是類似實驗法中隨機分派的效果,這樣就不會有「開票很久的地方,都是丁守中票倉」的問題了。當然在配對過程,一定有些投票所配不到,就會被遺漏掉。接著,就能夠看開票時間對兩間2014KMT得票率相似的投票所,有沒有造成不同的影響了。看不太懂文字嗎?那看圖示吧。
結果,讓我非常的困惑,開票時間越常,對於丁守中反而有提高得票率的效果?七點後開完,大概都顯著比七點前開完高了1%左右。
難不成深綠丁粉真的存在?對於這個結果,林澤民老師[3]、鄧志松老師[4]用其他的分析方法,似乎也有相同的結果。
[1]中選會僅公告開票完成時間,未公告開始開票的時間,因此我是假設開票越久,應該代表邊開邊投的問題越大。
[2]我允許2014投票所與2018的投票所有3成以下的差異。舉例來說,2014某個投票所是A里的3、6、8、9、11-15鄰、2018年是A里的6、8、9、11-16鄰。他們之間的相似度超過八成(9/11),我仍會視之為同一個投開票所。
[3]林澤民老師於FB的發文,請見連結。
[4]鄧志松老師於2019空間分析工作坊課堂上呈現他分析的結果,他使用的是空間回歸(SLM與GWR),有考量空間上的效果。結果投票與丁守中得票是正相關,但未達顯著水準。
幕後murmur:
2014中選會公告投開票所都是用PDF檔案,整個超級難整理。然後又要處理少數投開票所鄰里不同的問題。我當然不可能一間一間對,幸好會R,對於整理大量資料多打幾行程式就好了。
沒有留言:
張貼留言