2018年9月22日 星期六
滾雪球抽樣能夠估計母體?
「你這滾雪球抽樣,可能總同一群人,難以了解更異質的群體……」「滾雪球如果一開始找到錯的人,一路滾下去就會出問題……」質性研究在針對社會邊緣人士、次團體進行訪談時,因為研究對象難以接觸,經常會以滾雪球的方式徵詢受訪者。許多人認為會是滾雪球面臨的問題,滾出來的人經常差異不大。
但事實上,統計學家、社會網絡學家,早已對滾雪球做過不少研究(學術上通常稱之RDS, Respondent-Driven Sampling)。只要符合一些假定,不論一開始找誰滾雪球,在數波滾雪球後,樣本分配會趨近於平衡,甚至可以反應母體分配。
2018年4月30日 星期一
小世界網絡與Watts的小手段
有個有趣的實驗大家一定聽過,就是一個人在美國西岸,寄信給美國東岸的陌生人,平均只需要經過六步,就可以送達。這個「六度分隔實驗」背後的概念就是「小世界」。
小世界的概念簡單來說,就是世界上的人們各自群聚,大家分裂成東一塊、西一塊的,但是隨意的兩個人之間,卻能透過很短的步數連結起來。以送信的實驗為例子,美國的每個郡裡面的人民各自群聚,有很多的連結;而郡跟其他郡之間的人很少有連結,但是美國的任意兩個人,卻還是能透過六步的距離連起來。
小世界的概念簡單來說,就是世界上的人們各自群聚,大家分裂成東一塊、西一塊的,但是隨意的兩個人之間,卻能透過很短的步數連結起來。以送信的實驗為例子,美國的每個郡裡面的人民各自群聚,有很多的連結;而郡跟其他郡之間的人很少有連結,但是美國的任意兩個人,卻還是能透過六步的距離連起來。
2018年3月13日 星期二
夜市麻將賓果中獎率高嗎?
每次去夜市,都會看到「麻將賓果」這樣遊戲。這個遊戲規則通常是100元可以玩6局,每局抽15張麻將牌,在6*6的賓果上對獎,連成一線即中獎;當沒有連成一線,但有湊滿5張牌時即「聽牌」,可以再抽3張。如果中獎,可以得到娃娃一隻,或是其他獎品。
夜市麻將(圖片來源 CC授權)
那麼這個遊戲到底中獎律高不高呢?這當然可以用機率算,在不考慮聽牌規則的機率算法如下:
那有聽牌規則下的中獎機率呢?好複雜我也不想多想了,這種問題,就交給電腦處理吧!電腦不就是用來處理複雜、龐大的計算嗎。我用R寫了一個麻將賓果模擬程序,請它跑了100萬次,結果如下圖。
在有聽牌機制的情況下,連成一線的機率為 10.493%,連成二線的機率為 0.288%,連成三線的機率為 0.0015%。所以100元玩6局的得獎率為1-(1-10.7825)^6,大概是近五成。你覺得這樣的機率高不高呢?
另外,如果沒有聽牌機制,抽15張就連成一條線的機率大約只有3.56%,很低呢!
另外,如果沒有聽牌機制,抽15張就連成一條線的機率大約只有3.56%,很低呢!
不過既然都做模擬了,我們就來看一下各種條件下,獲勝的機率是多少吧。黑色的線代表花100元獲獎的機率,紅色代表單一局獲勝的機率。
其實從上面的圖可以看出,夜市麻將「100元玩6局,每局抽15張牌,聽牌再抽3張」讓玩家獲勝的機率拿捏的剛剛好,是很有數學根據的!
output<- mahjong(nmahjong = 15, draw = 3, games = 6, simula = 100000)
nmahjong是每局抽的牌數,draw是聽牌再抽的數量,games是100元玩的局數,simula是模擬次數。上面的數字都是可以隨意更改的,也可以直接mahjong()就會按照預設值跑出來。R的計算速度其實很慢,不建議模擬超過百萬次。
訂閱:
意見 (Atom)







