封面故事:tag網絡 |
我將中山大學前陣子舉辦的「銅像公投網路tag活動」,當中906筆tag訊息用爬蟲掃下來進行分析。這種tag朋友的行為,可以運用社會網絡進行視覺化,以下是「進行tag的人」與「被tag的人」共2700位活動參與者所繪製出來的網絡。
紅點代表「進行tag別人」的人
綠點代表「被tag」的人
大小代表「被tag」的次數
tag基本上是個四分五裂的網絡,仔細看中間的那大塊網絡,也僅僅是靠幾條線所聯繫起來。不過我關心的,是這樣tag他人的行為,是否能讓被tag的人也加入參與這個活動、一起傳播訊息?
假如今天tag是無用的,那麼我們可以預期每個人參加tag活動都是隨機的;假如是有用的,那理論上被tag越多次的人,參與這個活動的機率也會越大。[1][2]
我用很簡單的logistic regression進行分析,發現當只被tag一次時,只有20%不到的機率也進行tag他人;但是隨著被越來越多人tag,參與tag活動的機率也提高了。
註
[1]因為沒有被tag的人自然就不在資料中,我們也無法預期這樣的人有多少,因此換一個方式:透過觀察被tag的次數,也去tag他人的機率是否有隨之提高。
[2]我的分析有考量到tag時間的先後順序。例如 B 在被 A tag以前,B就已經tag C,D,E了,我們當然不能說「因為B被tag,所以他也去tag其他人」。
[3]使用logistic regression是很偷懶的作法,這個估計絕對會有偏誤,因為觀察值之間並不獨立。要做精確的估計,可以使用STERGM(Separable Temporal Exponential Random Graph Models)。
沒有留言:
張貼留言