【大紀元5月18日訊】我開了一門《統計在工程上的應用》,教學生用統計方法來檢驗實驗資料。
我在第一堂課就推薦學生讀Darrell Huff的經典之作:《如何用統計騙人》,警告他們,統計數位有許多陷阱,不要誤用,也要小心勿被愚弄。
通常我舉的例子都太枯糙乏味,Huff的例子又太遙遠。好在最近中研院科資所的馬自恒副研究員提供了一個活生生的例子。他最近發現,“廢票率高的投票所,阿扁的得票率較高,連宋的得票率則較低”,以此證明有人作票,剛好是誤用統計的絕佳教材。
用統計學術語來說,馬博士發現了阿扁的得票率與廢票率成正相關。這個沒問題,但他由此推論兩者之間有因果關係,認爲是廢票造成阿扁當選,甚至指其作票,就太沒統計常識了。
統計第一課:相關性不等於因果關係。濫用這個等號,往往會得出荒謬的結論。譬如說,將臺北市過去10年大小火災的財物損失與所動用的消防車輛數作圖,也可以得到正相關性。根據馬博士的邏輯,他大概會說“消防車愈多導致火災的財物損失愈大”,因而懷疑消防員是否趁火打劫。其實真正的原因是,火災愈嚴重(A),財物損失就愈大(B),動用的消防車也愈多(C)。B與C有共同的原因,因此兩者有正相關性,但B與C並無因果關係。
再舉一個例子,我們發現70年代中研院研究員的收入持續上升(假設),又發現同一期間毒品的價格也不斷上漲,要不是有人提醒我們,真正的原因是當時通貨膨脹很嚴重,我們也可能得出嚇人聽聞的結論。
這兩個例子因爲結論太荒謬,比較容易覺察出來。但有些聽起來有道理的說法,也不見得正確。譬如“抽菸導致學業衰退”,可能對,也可能不對,必須從生物化學去證明其因果關係,絕對不能只依賴統計上的相關性。因爲真正的原因也可能是:因爲個性焦慮,所以無法專心讀書,也因爲焦慮,所以抽菸,兩者之間不見得有因果關係。我們的報紙電視上,充滿了這種號稱有統計資料支援的假科學論述,不能不小心。
阿扁的得票率與廢票率的正相關,也可能不是作票,而是因爲:選民不瞭解新修訂的投票規定,導致廢票率比以往高。但因連宋支持者集中在都會區,資訊充足,比較不容易蓋錯;阿扁的支持者較多在非都會區,宣導不夠,廢票率也較高。這樣也可以解釋的通。但是否真的如此,我也不敢肯定,要真正驗了票才知道。唯一可以肯定的是,馬自恒博士絕對無法從他發現的統計相關性中得出“有人作票”的結論。
令人不解的是,一位科學工作者,爲什麽會有如此不合科學理性的結論呢?
與墨非定律齊名的布勞奇定律說:“如果你手中只有一把鐵錘,一切事物在你眼中都成了釘子”,大概就是因爲偏見吧。
臺灣科技大學化工系)
劉進興
〔原載《臺灣觀察》#13;2004.5.14〕
轉載自《民主通讯》2004.5.14〕
(http://www.dajiyuan.com)
















































留言