前往
大廳
主題

【隨筆】嚴重違反直覺的條件機率

愛天使亞夜 | 2024-05-05 08:00:04 | 巴幣 1006 | 人氣 62

這裡亞夜。

三年前敝人發表了這樣一篇文章:

同樣是鄰居,
同樣是兩個小孩,
但是只是隨著初始條件給的不同,
我們算出的機率就都不一樣。

甚至下面還有提到一個給圓畫弦的問題,
這其實是著名的伯特蘭悖論
請原諒敝人當時因為忘了關鍵字所以沒辦法進一步祥說

同樣做一件事,
因為做的方法不同,
因此得到的機率就不一樣。
那麼,
哪一個對?

結論是:都對。

所以說為什麼是「悖論」?
因為按照一般常識的想像,
評估一件事情發生的機率應該是一個客觀的事實,
因此他應該會有一個精確解才對。
換句話說,
解出三個不一樣的答案,
要嘛三個都錯,
要嘛至少有兩個錯才對。
然而實際上三種算法都是符合題意且無懈可擊的,
因此我們只能承認三種算法都對。
所以囉,
那只能是「只有一個精確解」這個前提是錯的。

硬要說的話就是,
因為題目給得不夠精確。
這一點上一次也講過了。
你如果不能完整描述定義整個過程,
那麼求機率就是沒有意義的,
因為只要說得通,
你就不能說他錯,
進而無從參考。

再回到前面所謂的雙子問題,
兩個孩子,
知道一個是男生,
另一個是男生的機率,
上次有討論過,
根據給的「無用條件」的不同,
機率會介於三分之一與二分之一之間。

這邊引入一個新的觀念:資訊熵。

熵是一個熱力學的名詞,
他的物理意義是「對一個事物的混亂程度的度量指標」。
越混亂(越不確定)熵就越大。
所以所謂的資訊熵就很好理解,
如果資訊越不精確,
那麼資訊熵就越大。

事實上,
在機率學中,
資訊熵與期望值呈現負相關,
也就是期望值越小,
他的資訊熵就越大。

所以,
如果資訊熵無窮大,
代表無比混亂,
因此他對於整個系統來說相當於「無用資訊」,
基本不會影響結果;
反之如果資訊熵是零,
那他就是一個明確的事件,
進而能大幅將機率收斂。

於是,
回到雙子問題:

如果什麼額外的資訊都沒有,
兩個小孩都男生的機率是多少?
是四分之一。
反過來說,
如果資訊很明確到,
比較小的那個小孩是男生的機率是多少?
是二分之一。
因此雙子問題的機率原則上就會介於四分之一跟二分之一之間。
而額外的條件,
如血型、生日、上班與否……etc,
這些看似無用的資訊,
實際上也會有所謂的資訊熵,
因此就會影響其計算的機率。

可是,
小孩是男是女,
不是板上釘釘的問題嗎?
何來機率之說?
沒錯,
這就是機率學兩大學派中的「頻率學派」的說法。

頻率學派認為:
機率是對於一件事情的發生頻率的計算,
例如籃球投籃,
你投 100 次,
進 30 次,
那麼投籃命中率就是 30%。
如果你只投 1 次,
要嘛進要嘛不進,
因此命中率就是要嘛 100% 要嘛 0%。
換句話說,
已經發生的事情就是確定的,
討論機率已不具意義。
例如投硬幣,
你還沒拋的時候,
出現正面的機率是 50%;
但是如果你已經拋了但蓋起來並且還沒看,
那麼出現正面的機率是多少?
頻率學派會認為:這件事情沒有意義,
因為他已經確定了只是你不知道。
你以為是 50%?
頻率學派認為:
如果事後證實是正面那就是 100%,
如果事後證實是反面那就是 0%,
只要今天不是既正又反,
那就不可能是 50%。

所以頻率學派來判斷雙子問題會怎樣?
他們會認為兩個小孩都已出生,
性別是已經確定的事情,
問機率這件事情就跟除以零一樣沒有任何討論價值。

這跟賭骰子還是抽鬼牌一樣,
骰子已經骰好只是還沒開盅,
結果只有一個,
因此機率只是浮雲;
抽鬼牌也是,
牌已經洗好排列好,
你會抽到哪一張是注定好的,
問機率就是耍流氓。

有沒有覺得,
頻率學派的主張跟我們高中學的好像不太一樣呢?
沒錯,
一般學校教的機率基本上都是「貝葉斯學派」。

然而學校沒有特別強調貝葉斯學派的細節,
其實重點就一個:
貝葉斯學派認為機率是對於無知的估量,
只要是「無知」,
就能估量一個值,
這個值就是機率。

我們回來看雙子問題,
為什麼會算出四分之一到二分之一之間的機率?
因為無知。
確實,
雙子的性別是既定事實,
但我們不知道,
於是我們只能估計。
既然是估計,
那就只是針對「目前已知的資訊去推測」的值,
換句話說,
一旦條件出現變化,
資訊出現變化也是當然的。

換句話說,
你不用去糾結一個機率的正確值是多少,
那個是依照給定資訊不同就會出現變化的值。
當然,
資訊給足就能算出精確值,
但那充其量就是針對那個前提去計算出來的評估值,
至於實際的結果如何那完全是另一個故事。
所以為什麼學校要教貝葉斯學派的機率而不是頻率學派?
因為這個考試才有唯一正確答案唄。

其實,
機率始終就是對一個未知的事物去作評估的學科,
因此機率會有一個絕對的前提叫作同等無知。
意思是如果真的完全沒有資訊可供判斷,
那麼所有的情況對我們而言就是毫無差別的,
因此就要假設所有情況出現的機率均等。

想想看是不是如此?
拋硬幣出現正面與反面的機率為什麼各二分之一?
因為沒有任何手段可以分別出正面跟出反面有哪裡不同,
因此只能假定兩面的機率均等,
進而強行規定它是二分之一。
也許你會反駁說:不是因為大數法則的關係嗎?
不是,
這是倒果為因。
的確,
一枚公正硬幣在丟很多次以後呢,
正反面出現的次數會差不多。
例如丟一百萬次,
可能會出現499998次正面跟500002次反面,
誤差不到萬分之一,
因此大約是二分之一,
所以這是公正硬幣。
但真是如此嗎?
重點在這個「公正」上。
我們預期「公正硬幣的正反面必須各二分之一」,
所以才把硬幣這樣設計的。
但可不可以設計一個硬幣怎麼拋都是正面?
或者有 90% 機率出現正面之類的?
答案是只要願意設計一定還是做的出來的嘛!
換句話說,
硬幣出現正反面的機率跟設計有關,
甚至跟拋的人或者環境之類的有關,
但問題就是,
如果你不知道這顆硬幣有沒有被動手腳,
也不知道拋的人有沒有心作弊,
也無法掌握當下環境的溫溼度甚至每一個空氣分子的運動情況,
換句話說你無法去計算出出現正面與出現反面的精確機率,
所以你只能假設出現兩面的機率箱同。

這跟抽撲克牌一樣道理。
一副牌有 54 枚,
抽到特定牌的機率就是五十四分之一。
但是對於魔術師而言,
它抽中的機率就是一分之一。
因為它會在洗牌時作弊,
或者說,
不知道如何在洗牌時作弊的魔術師根本就無法表演對吧?
不管洗牌有沒有作弊,
牌疊在桌上後會抽到哪張就是決定好的,
何來機率問題?
但因為我們不知道,
所以才有所謂的機率,
而且因為沒有其他資訊可以判斷,
因此只能判定每一張牌的機率都相同,
這就叫「同等無知」。

但是,
同等無知雖然是機率學的根基,
但濫用同等無知的結果就是會出現一堆悖論。
上面提到的伯特蘭悖論就是一個例子,
你認為畫出每一條弦的機率應該要一樣,
但實際上,
你畫弦的方法不同,
畫出不同弦的機率並不相同,
每一條弦的出現率並不是等價的,
所以才會出現悖論。
舉個誇張一點的例子,
最常被調侃的就是樂透中獎率為二分之一,
為什麼?
因為要嘛中獎要嘛不中獎,
因為同等無知,
所以中不中都是二分之一,
這就是經典的濫用同等無知導致的不客觀。

封面圖片:AI生成
送禮物贊助創作者 !
0
留言

創作回應

更多創作