要分析政治人物就必須先有名冊,我懶得自己建立,所以參考「網路溫度計」中前三百網路聲量的政治人物。這當然可能會有些很知名的政治人物,但是卻沒有在上面,例如最近很紅的蔣月惠,或是經常跟柯P新聞一起出現的王世堅。這些人我就不特別再處理了。
另外,PTT的文章標題必須出現全名才會被我識別,PTT標題經常會出現「柯文 」這樣的斷句,那我沒有做特別的處理。
我掃下來PTT四個月30萬筆的原始資料,全數公開在我的github。
首先看貼文最常出現的政治人物(前40名),貼文次數基本上呈現冪次分布。我有將ptt的貼文分為「一般貼文」跟「回覆貼文」,一般貼文基本上就是新聞(因為八卦版不能政問,所以有政治人物標題基本上多是新聞)。而數字則代表回覆貼文佔百分比,從回覆的百分比來看,可能暗示著某些政治人物比較容易被討論。(像蔡英文、新聞雖然多,但是討論並不熱絡。)
接下來則是這幾個月的政治人物熱門的變化量,為了繪圖的美觀,我只抓前10名,一樣把一般貼文跟回覆分開來。
比較有趣的是前教育部長吳茂昆,看來在拔管討論熱潮過了後,次數就大幅下降了。另外在6月姚文智討論的熱門度不輸柯文哲呀,不過我猜負面居多啦。
如果你還有想到這些資料可以做什麼有趣的分析,歡迎留言,或去下載來試試喔XD
沒有留言:
張貼留言