統計數字在現代生活中無所不在,但正如馬克·吐溫所言:「謊言有三種:謊言、該死的謊言與統計數字。」然而,統計本身並非不好,關鍵在於解讀數字時是否足夠謹慎,在資訊爆炸時代,仍要抱持懷疑的態度、挖掘真相的能力,才能看穿數字背後真實樣貌。
數字與體感的落差:離群值造成的數字拉扯
根據2026年統計,台灣工業與服務業全體受雇員工平均每月總薪資在6萬4千元到7萬6千元之間,許多網友因此自嘲:「抱歉,我拉低了平均。」針對大眾常感受到政府公布的平均薪資、通膨數字與現實「體感」不符的現象,政治大學統計學系教授陳立榜指出,平均值的計算必須考慮樣本的來源與組成。
若樣本中出現「極端值」或「異常值」時,平均數就會出現嚴重拉扯,陳立榜幽默地舉例:「今天我跟(輝達執行長)黃仁勳的薪水平均完之後,我(薪水)就是好幾個億!」這種數字與體感的落差,背後可能也帶有特定目的。
陳立榜直言,政府或組織公告數據時,可能為了讓成果看起來更有成效,或必須對外證明,因此會透過不同統計方法,呈現特定數字樣貌。因此,他呼籲大眾面對數字時,應保持懷疑或挖掘真相的心態,而非一昧全盤接受。
數字背後的操作:從失業率到校園調分
陳立榜進一步舉例,為了美化數據,有時會採取特殊的操作定義。例如:中國過去為了降低失業率,「哪怕只工作一個小時,我也當作你有在就業...」透過放寬標準達到目的;或要求大學生若未取得實習、正職 offer,就不發給畢業證書,確保「有畢業的人才會有就業」,從而在數據上讓青年失業率大幅下降,對外界「證實」政府執政效果。
除了負面操弄,生活中也有較為「正向」的例子。陳立榜觀察到,有些學校老師為了不讓學生被當掉,或為了讓學生申請留學時有較好的 GPA(Grade Point Average),會進行加分或調分。雖然這會讓整體教學成果看起來非常成功,但陳立榜提醒,這可能影響學生對教學品質的判斷。
為何要學統計:從臨床試驗到半導體良率
儘管描述性統計當中,有這麼多可能被「操弄」之處,但陳立榜認為,統計學最有趣的地方在於其「數量化的技巧跟一些技術」,能活用在生活各領域。他說明,在醫療領域如 COVID-19 的藥物開發,藥廠必須透過臨床試驗蒐集數據,透過統計方法理解藥物是否有其功效。
此外,在台灣引以為傲的科技產業中,統計學同樣扮演關鍵角色。例如:台積電這類企業,在晶片製程中需要極嚴密的品質管控,必須掌握一台儀器生產晶片時,管線是否可持續生產品質良好的產品,只要透過統計分析,企業就能有效偵測並降低不良率,進而提高生產「良率」 。
個人生活影響:解碼 Google 評論的誘因
在個人生活中,統計概念同樣如影隨形。陳立榜提到,不論是計算吃飯的花費,或是評估考試的平均分數,舉凡與平均、總和、量化相關,都是統計的一環。
他認為,學習統計學的「直覺」,就是透過生活實例來理解這些統計描述。最貼近大眾的例子莫過於 Google 評論。例如:看到 4.8 顆星高分,陳立榜建議先質疑「這 4.8 是多少顧客投下?」樣本數太少會導致數據失真,例如:新開餐廳只有五則好評,但這些評論可能都來自支持餐廳的親友;此外,還須考慮人為誘因,如店家提供打卡送贈品等活動,以此拉高平均數字。
對此,陳立榜笑說,雖然他找餐廳也會參考 Google 評論,但面對數字,務必保持直覺或者是疑問心態,才能穿越重重迷霧,看穿數字背後的真相。
更多精彩內容歡迎參考《把統計學剝光光》
