創作內容

8 GP

假陽性?偽陰性?簡談貝氏定理

作者:伍德‧瓦懷特│2020-03-23 07:06:20│巴幣:16│人氣:1193
  最近(2020上半年)隨著各位越來越關注和這波肺炎有關的公衛消息,諸如「假陽性」、「偽陰性」這類和檢驗有關的術語再度躍入大眾視野。本期伍德說數帶你了解這些術語是怎麼回事,而我們又該怎麼理解它們和檢驗結果的關係。

一、難以避免的錯誤
  在生活中,我們常遇到需要判斷的場合。或許是像此次疫情是否有染病的檢驗,或許是法官判案時必須決定被告是否有罪*1,也或許是當你看到一個可愛的腳色,得判斷是不是男孩子。通常我們都希望自己的判斷越準越好,但人非聖賢,沒有百分百的檢驗方式,錯誤就是會發生。以疫情快篩而言,結果是陰性的人真的沒染病嗎?判斷是陽性的人真的就中標了嗎?其實在沒有更詳盡的病理檢查前,我們永遠不知道。
  就檢驗結果,我們可以分為以下四種情況*2:
實際上染病 實際上沒染病
檢驗染病 很棒*3 偽陽性(False Positive)
檢驗沒染病 偽陰性(False Negative) 很棒
(讀者可以自行將表格替換成「被告有罪;判決有罪」等等設定)

  詳盡點來說,明明實際上沒染病,檢驗結果卻是染病(陽性),這個陽性是錯誤的,我們稱為「偽陽性(假陽性)」。相反地,實際上染病,卻沒被檢驗出來(陰性),這樣的陰性不對,我們稱為「偽陰性(假陰性)」。從防疫角度來說,我們比較害怕偽陰性發生。對於假陽性的個案,或許只是過度反應;但不小心放過偽陰性的個案,可能會造成疾病繼續傳染。
  但並不是所有情況下,我們都比較擔心偽陰性。以司法例子來談,所謂的偽陽性就是「明明沒罪,卻被判成有罪」,再白話一點,就是冤罪。當然,能夠同時降低偽陽性和偽陰性是最好的,但現實往往受限於科技或訊息不夠而不允許。
  
  我們再定義兩個名詞:
  (1)靈敏度(Sensitivity):碰到陽性的樣本,檢測出陽性的機率。(真陽性率)
  (2)特異度(Specificity):碰到陰性的樣本,檢測出陰性的機率。(真陰性率)
  
  相信配合上面的表格,讀者可以理解下列的兩個式子:
  靈敏度+偽陰性率=100%
  特異度+偽陽性率=100%
  
  由於靈敏度和特異度都是正確的判斷,我們希望它們越大越好。然而,考慮一下這個「檢驗法」:「管它來的是誰,判斷是陽性就對了」。這樣的結果下,靈敏度是最高的100%,但它是好的檢驗嗎?說難聽點,這根本不是檢驗,特異度在這個檢驗下是0(永遠沒有陰性的結果)。簡單來說,我們在日常生活中,是必須在靈敏度和特異度之間作取捨的。
  那麼,這些數字跟檢驗結果有什麼關係呢?我們得談談所謂的「貝氏定理」(Bayes' theorem)

二、貝氏定理
  你覺得明天下雨的機率多少呢?突然問這個問題,你可能會覺得沒頭沒腦的,但總會有個估計。或許是根據你過去的經驗,也可能是靈機一動。現在讓我告訴你,明天颱風會來,你覺得下雨的機率有沒有提高些呢?*4
  像這樣,透過新的資訊修正機率的作法,在統計學中稱為「貝氏推論」(Bayesian Inference)*5。而貝氏學派奉為圭臬的,正是所謂「貝氏定理」(Bayes' Theorem)。
  一開始在我還沒提供資訊給你時,你靈機一動給出的下雨機率,我們稱為「事前機率」(Prior Probability);而在我給你資訊後,你更新的機率,我們稱為「事後機率」(Posterior Probability)。而貝氏定理正提供了各種事前及事後機率的轉換方法*6。

  我們透過實際的例子來看看貝氏定理怎麼用。
Ex1:
我們知道某疾病的發生率是1%。現在有個快篩,有99%的機率成功檢驗出染病者(靈敏度99%)、而碰到未染病者,有98%的機率成功檢驗出未染病(特異度98%)。
那麼,今天碰到一位民眾檢驗出染病,他真的染病的機率是多少呢?

這個檢驗看起來如何?應該看起來不錯?靈敏度和精確度都快到100%了呢──真的嗎?

先注意,這個機率我們稱為這個快篩的「準確度」(Precision),和靈敏度不一樣
靈敏度是:給定樣本實際上染病(陽性),檢測出染病(陽性)的機率。
準確度是:給定檢測出樣本染病(陽性),實際上真的染病(陽性)的機率。

照著上面的表格,我們可以計算出下列四種情形的機率。
(a)實際上染病,檢測出染病=0.01*0.99 (染病機率*檢驗染病者成功機率)
(b)實際上未染病,檢測出染病(偽陽性)=0.99*0.02 (未染病機率*檢驗非染病者失敗機率)
(c)實際上染病,檢測出未染病(偽陰性)=0.01*0.01 (染病機率*檢驗染病者失敗機率)
(d)實際上未染病,檢測出未染病=0.99*0.98 (未染病機率*檢驗非染病者成功機率)
注意:(a)+(b)+(c)+(d)=1

  那麼檢測出染病的機率,便是(a)+(b)了;而檢測出染病,實際上也染病的機率則是(a)。所以我們要的準確度,透過貝氏定理,便是(a)/[(a)+(b)]=1/3.

  你沒看錯,明明看起來快篩的能力很棒,但實際上給定檢測出陽性,對方真正染病的機率只有不到一半的1/3
  為什麼?問題在於「染病的人太少了」*7。就算快篩真的很厲害,也能用很高的機率做正確判斷(上例的0.99和0.98),碰到檢驗出染病者,很可能只是我們不小心犯了假陽性的問題而已。

  這代表這個快篩沒價值嗎?不是的。在沒有快篩下,我們看到一個人只有1% V.S. 99%的機率判斷它染病;但透過快篩,看到染病的結果,變成33% V.S. 67%的機率,終究是有提升。而我們能做的,便是透過反覆測試,讓判斷的準確度提升,所以你才會看見許多病例都經過了「多次快篩」。因為只篩一次,準確度確實差強人意。

三、結論
  我們這次簡單談了部分檢驗中常見的用語,並且使用貝氏定理,談到看起來很可靠的快篩,有可能不太準確。但快篩並非毫無價值,它依舊提供了我們資訊。貝氏定理簡而言之,便是透過資訊更新我們對現實的理解,進而做出推論與判斷。希望下次各位看新聞時,都能更理解偽陽性、偽陰性到底是什麼,及它們對準確度的影響(前提是我們記者朋友有用對這些詞語...)。
  那麼我是伍德‧瓦懷特,我們下次見!

*1.這是以我國現行制度來說。而陪審團制度下法官只負責量刑。
*2.在談假說檢定時,我們會在稍微不同的設定下看到同樣的表格。
*3.我是說檢驗結果很棒,不是染病很棒。
*4.沒有的,麻煩按上一頁找地科老師(欸)
*5.與之相對則是由費雪(Fisher)等人為主的頻率推論(Frequentist Inference),各位初等統計學大致都是跟著頻率學派走的,因為好理解很多。
*6.我不想在科普專欄裡真的把那公式寫下來。有興趣的讀者(或要考試的讀者...)請自行參照高中數學課本、初等統計學課本或其他網路資料。
*7.作者沒有希望染病人數上升的意思...
引用網址:https://home.gamer.com.tw/TrackBack.php?sn=4726112
All rights reserved. 版權所有,保留一切權利

相關創作

同標籤作品搜尋:伍德說數

留言共 1 篇留言

九方思想貓
這種檢驗畢竟很難0跟1,期望值達到「幾乎都是準確」就是最好的現象。

這種病毒才剛出現不多久,大概篩選的機制也還有比較高的誤差吧

03-23 10:24

伍德‧瓦懷特
這種準確度低的狀況是很難根治的,倒不是篩選機率高或低的問題。
文中的例子裡,分類正確的機率已經高到99%和98%,但準確率還是不高,真的是(一次檢驗)改不了的原罪。
當然我相信因為目前的病毒問世不久,正確的判斷率應該也還不到99%這麼高...吧(?)03-23 10:39
我要留言提醒:您尚未登入,請先登入再留言

8喜歡★e12344888 可決定是否刪除您的留言,請勿發表違反站規文字。

前一篇:[達人專欄] Math ... 後一篇:[達人專欄] Math ...

追蹤私訊切換新版閱覽

作品資料夾

kuso12336拉拉拉
【漫畫】【那個啥黑砂!?】跟朋友們的日常漫畫更新中! 無聊可以來看看~看更多我要大聲說昨天08:38


face基於日前微軟官方表示 Internet Explorer 不再支援新的網路標準,可能無法使用新的應用程式來呈現網站內容,在瀏覽器支援度及網站安全性的雙重考量下,為了讓巴友們有更好的使用體驗,巴哈姆特即將於 2019年9月2日 停止支援 Internet Explorer 瀏覽器的頁面呈現和功能。
屆時建議您使用下述瀏覽器來瀏覽巴哈姆特:
。Google Chrome(推薦)
。Mozilla Firefox
。Microsoft Edge(Windows10以上的作業系統版本才可使用)

face我們了解您不想看到廣告的心情⋯ 若您願意支持巴哈姆特永續經營,請將 gamer.com.tw 加入廣告阻擋工具的白名單中,謝謝 !【教學】