這是這一陣子在 PTT TechJob 和 Math 版上吵得很兇的關於機率的話題。
【前言】
原始命題:
- 小明過年期間去拜訪許久沒見面的同學,聽說同學已經生了兩個小孩,進門後小明看到朋友其中一個小孩是男生,請問,另一個是男生的機率為多少?
老實說,我已經懶得再裝瘋賣傻說服認為是 1/3 的人了。
雖然 terrorlone 大已經在 Math 版 17833 篇用程式說明這個命題以及為何會有人得出三分一之的結論,但我想程式不是每個人都看得懂,所以我做了這個實驗。
希望這篇能夠幫助像我一樣,數學差到不行,對於機率的認識就僅止於【機率=發生次數/樣本空間】和【所有情況的機率總合為 1】這個兩個原則,然後認為這個問題好像 1/2 也對,1/3 也說得通的朋友。
在這篇文章裡沒有任何除了上述兩個原則之外的算式,所以請數學和我一樣差的朋友也可以放心觀看。
裡面有的只有實驗設定與實驗步驟,以及每一次實驗的樣本與結果,所以唯一需要有的就是耐心,以及觀察力。
【三個命題】
首先,因為生小孩並沒有辦法實驗,所以我們轉換命題。
- 桌上有兩個用杯子蓋住的銅板,移開第一個杯子,發現是正面,則第二個杯子裡的銅板還是正面的機率是?
呃……因為我們數學不好,所以不會算,好像是二分之一,又好像是三分之一咧?是獨立事件嗎?還是條件機率?我只記得兩個的算法好像不一樣,可是也傻傻分不清楚要用什麼公式啊!orz...
不過沒關係,機率問題和其他數學問題不同而有趣的地方就在於我們大可以『做實驗驗證我們的猜想』。
但在實驗開始之前,你可以先想一下,以下這三個命題是不是等價。
-
桌上有兩個用杯子蓋住的銅板,移開第一個杯子,發現是正面,則第二個杯子裡的銅板還是正面的機率是?【命題A】
-
桌上有兩個用杯子蓋住的銅板,隨機開某個杯子,發現是正面,則另一個杯子裡的銅板還是正面的機率是?【命題B】
-
桌上有兩個用杯子蓋住的銅板,在其中至少有一個是正面的情況下,另一個杯子裡的銅板還是正面的機率是?【命題C】
覺得很像三個問題是等價的對不對?那我們開始來做實驗驗證我們的猜想吧!
【命題A的實驗】
實驗開始,實驗內容與結果可以在下面兩個網址下載,打開後請隨便在一個儲存格上打些字,就會更新實驗數據。
在這個檔案中,第一個活頁標籤是原始的樣本空間,也就是在實驗開始前,每一個杯子裡的狀態。而在這個實驗中,我們有以下的命題與假設以及符號標計設定。
-
命題
-
桌上有兩個用杯子蓋住的銅板,移開第一個杯子,發現是正面,則第二個杯子裡的銅板還是正面的機率是?【命題A】
-
假設
-
硬幣是公正的(Uniform 分佈),在只有『正』『反』的二元狀況下,有 50% 是正面,50% 是反面。
-
符號標記
-
0 代表硬幣反面
- 1 代表硬幣正面
實驗內容在第二張活頁標籤『實驗內容』裡面,實驗步驟如下。
-
開啟第一個杯子,如果是反面,此次實驗失敗(因為不符合題目『打開第一個是正面』的情況),在 G 欄的地方打 X,代表實驗失敗,直接進行下一輪。
-
若步驟 1 成功,在 G 欄的地方標 1,並且計數後開啟第二個杯子。在這邊成功進行實驗的次數總計在 G4。
-
若第二個杯子是正面,符合命題,把 H 欄標成 1,計數,總次數在 H4。
-
若第二個杯子是反面,符合反命題『第二個杯子是反面』,把 I 欄標 0,計算總共有幾次反面,總次數在 I4。
以上,第一個命題實驗結束,就結果來看,你會發現 H4 與 I4 的值接近。
不過既然是算機率嘛,總還是要有個答案出來,而且也要驗證我們的實驗有沒有錯漏,不然機率加起來不等於 1 就好笑了。
所以,以下是計算的部份,套用我們已知的兩個機率原則。
- 機率 = 發生次數 / 樣本數
- 所有可能發生的情況機率相加為 1
以下計算開始。
- 樣本數 = 第一次開啟時是正面的次數 = G4
- 正命題發生次數 = 第二個杯子也是正面的次數 = H4
- 正命題機率 = 發生次數 H4 / 樣本數 G4 = M20(請看實驗結果)
- 反命題發生次數 = 第二個杯子是反面的次數 = I4
- 反命題機率 = 發生次數 I4 / 樣本數 G4 = M22(請看實驗結果)
- 正命題機率 M20 + 反命題機率 M22 = M23
請對照實驗檔案,你會發現不論樣本空間的硬幣如何分佈,M20 和 M22 都會接近 0.5,而 M23 會逼進於 1。
第一個【命題A】的實驗,答案是 0.5。
【命題B的實驗】
對對對,我知道,你會說我會得到 0.5,是因為我先開第一個杯子的問題,如果我是隨便開第一個或第二個杯子,那麼答案一定會不一樣!
來吧!因為我們的命題改變了,所以重新做實驗唄!實驗的檔案如下。
這次的假設比較複雜一點,這是因為我們需要記錄實驗內容,所以必需用不同的方式達成同樣的命題。
簡單的來講,我們達成『隨機開第一個或第二個杯子』的方式,是先以夠亂並且公正的亂數,隨機調換兩個杯子內的硬幣。
換而言之,當調換完成後,我們打開第一個杯子時,有可能開到的是原始樣本空間內的第一個杯子的硬幣,但也很有可能是原始樣本空間內第二個杯子的硬幣。
以下是這次實驗的命題與假設。
-
命題
-
桌上有兩個用杯子蓋住的銅板,隨機開某個杯子,發現是正面,則另一個杯子裡的銅板還是正面的機率是?【命題B】
-
假設
-
我不知道第一次開的是第一個杯子或是第二個杯子。
-
當杯子內容隨機互換後,符合上述假設,亦即我是隨機開啟第一個杯子或第二個杯子。所以此時我已經不知道我是看到哪一個硬幣。
-
互換是公正的(Uniform 分佈),在只有『換』與『不換』的二元情況下,有 50% 會換,50% 不會換。
-
硬幣是公正的(Uniform 分佈),在只有『正』『反』的二元狀況下,有 50% 是正面,50% 是反面。
-
符號標記
-
0 代表硬幣反面
- 1 代表硬幣正面
- 0 代表不換
- 1 代表換
首先,在正式打開硬幣之前,我們先用以下的方式進行隨機掉換洗牌的動作,經過洗牌過後的杯子的情況,在第二個活頁標籤『隨機掉換順序』裡面。
-
先以亂數決定是否調換 = B欄
-
如果 B 欄為 1(換),原始樣本空間 C、D 欄互換
接著進行正式的實驗,過程與記錄在第三個活頁標籤『實驗內容』中,整個實驗的步驟如下。
-
開啟第一個杯子,如果是反面,此次實驗失敗(因為不符合題目『打開第一個是正面』的情況),在 G 欄的地方打 X,代表實驗失敗,直接進行下一輪。
-
若步驟 1 成功,在 G 欄的地方標 1,並且計數後開啟第二個杯子。在這邊成功進行實驗的次數總計在 G4。
-
若第二個杯子是正面,符合命題,把 H 欄標成 1,計數,總次數在 H4。
-
若第二個杯子是反面,符合反命題『第二個杯子是反面』,把 I 欄標 0,計算總共有幾次反面,總次數在 I4。
接著觀察 H4 與 I4,好像也很接近。為了驗證我們的想法和實驗,用機率的概念來試著計算看看唄!
套用我們已知的兩個機率原則。
- 機率 = 發生次數 / 樣本數
- 所有可能發生的情況機率相加為 1
以下計算開始。
- 樣本數 = 第一次開啟時是正面的次數 = G4
- 正命題發生次數 = 第二個杯子也是正面的次數 = H4
- 正命題機率 = 發生次數 H4 / 樣本數 G4 = M20(請看實驗結果)
- 反命題發生次數 = 第二個杯子是反面的次數 = I4
- 反命題機率 = 發生次數 I4 / 樣本數 G4 = M22(請看實驗結果)
- 正命題機率 M20 + 反命題機率 M22 = M23
請對照實驗檔案,你會發現不論樣本空間的硬幣如何分佈,M20 和 M22 都會接近 0.5,而 M23 會逼進於 1。
啥?怎麼算起來好像和【命題A】的答案一樣啊??是的,其實不論你先開哪個杯子,機率還是 0.5 的,除非我隨機掉換的假設是錯的(說實話,這邊我真的沒把握我隨機掉換的做法是對並且符合學理的)。
【命題C的實驗】
哇咧咧!我不相信,我一定要實驗出 1/3 這個數字才甘心,畢竟這麼多人說是 1/3,一定有他的道理在!佛說我不入地獄誰入地獄,既然堅持是 1/3 的朋有沒有人願意做實驗,那就我來做吧,哇哈哈~~~
同樣的,來看這次的命題與假設。首先,為了避免又有人在盧是啥開啟順序的關係,所以我們用【命題B】的方式,在正式實驗前,先將杯子亂數洗牌,讓我們是隨機開啟杯子一或是杯子二。
-
命題
-
桌上有兩個用杯子蓋住的銅板,在其中至少有一個是正面的情況下,另一個杯子裡的銅板還是正面的機率是?【命題C】
-
假設
-
我不知道第一次開的是第一個杯子或是第二個杯子。
-
當杯子內容隨機互換後,符合上述假設,亦即我是隨機開啟第一個杯子或第二個杯子。所以此時我已經不知道我是看到哪一個硬幣。
-
互換是公正的(Uniform 分佈),在只有『換』與『不換』的二元情況下,有 50% 會換,50% 不會換。
-
硬幣是公正的(Uniform 分佈),在只有『正』『反』的二元狀況下,有 50% 是正面,50% 是反面。
-
符號標記
-
0 代表硬幣反面
- 1 代表硬幣正面
- 0 代表不換
- 1 代表換
- 0 代表兩者都為反面
- 1 代表兩者至少有一個是正面
首先,我們用以下的動作進行亂數洗牌,洗牌過後的結果,位於第二張活頁標籤『隨機掉換順序』中。
-
先以亂數決定是否調換 = B欄
-
如果 B 欄為 1(換),原始樣本空間 C、D 欄互換
接著,正式開始做實驗,實驗過程與記錄在第三張活頁標籤『實驗內容』裡面記錄得很清楚,實驗步驟如下。
-
開啟第一個杯子,如果是正面,打開第二個杯子。
-
如果是反面,因為我們不確定『至少有一個是正面』的正面是不是出現在第二個杯子,所以也要打開第二個杯子,看裡面是不是正面。
-
如果第一個杯子或第二個杯子其中有一個是正面,符合題目描述的『至少有一個是正面』的前提,把 J 欄標 1,並將其加總至 J4。
-
若第一個杯子是正面,第二個杯子也是正面,此情形符合命題,將 H 欄標為 1,並於 H4 加總此狀況的次數。
-
若第一個杯子是正面,但第二個杯子卻是反面,符合反命題,我們將 I 欄標成 1,並且於 I4 加總發生這個狀況的次數。
-
若第一個杯子是反面,但第二個杯子卻是正面,同樣符合『至少有一個是正面』的先決件,是此題的反命題,所以我們將 K 欄標 1,並於 K4 計算發生這種狀況的次數。
接著,觀察實驗結果,你會發現 H4、I4 以及 K4 非常接近。
接下來,復習機率的基礎原則。
- 機率 = 發生次數 / 樣本數
- 所有可能發生的情況機率相加為 1
復習完了,就來計算機率唄!
- 樣本數 = 至少有一個是正面的狀況 = J4
- 正命題發生次數 = 第一個杯子是正面的情況下,第二個杯子也是正面 = H4
- 正命題機率 = 發生次數 H4 / 樣本數 J4 = N21
- 反命題(一)發生次數 = 第一個杯子是正面,但第二個杯子是反面 = I4
- 反命題(一)機率 = 發生次數 I4 / 樣本數 J4 = N23
- 反命題(二)發生次數 = 第一個杯子是反面,但第二個杯子是正面 = K4
- 反命題(二)機率 = 發生次數 K4/樣本數 J4 = N25
- 正命題機率 N21 + 反命題(一)機率 N23 + 反命題(二)機率 N25 = N26
仔細觀察 N21、N23 和 N25,你會發現大致上都接近 0.3333,而 N21 + N23+ N25 會逼進於 1。
是的,我們終於得出 1/3 的答案了!
【結論】
我數學很差,不過我知道如何做實驗,經過了以上的實驗,我們可以發現以下非常簡單明瞭的事實。
-
從結論來看【命題A、B】兩者與【命題C】是不等價的!
-
從實驗的方式和過程來看,『翻開後發現其中一個硬幣是正面』和『在已知其中至少有一個是正面的狀況下』也是不等價的敘述的!
發現問題所在了嗎?【命題A、B】在我們描述『第一次翻開來為正面』的時候,就已經把樣本空間縮小為『正反』與『正正』兩種了。(因為可以從題目敘述中推論出在一正一反的狀況下,保證正面一定會在第一次被翻出來)
但在【命題C】的時候,在『已知至少有一個是正面』的描述時,樣本空間卻包含了『正反』、『正正』、『反正』三種。是的,多了一個『反正』的組合出來!(因為我們不能從題目敘述中推論出一正一反的情況下,正面一定在第一次被翻出來。)
所以拜托,兩者是完完全全不同的命題,就算數學再差,差到和我一樣機統二修才低空飛過的差,也不要把這兩個命題混在一起做撒尿牛丸好不好啊。XD
回響