立場新聞 Stand News

亂世中更要冷靜處理數據

2019/9/18 — 14:31

筆者,都用咗一晚時間去諗寫唔寫,同點去寫呢一篇文章。

但說到底,是其是,非其非,就算我認為警隊如何做錯,用上了錯誤的數據去指責他們,亦不是正確的事。

事緣 The News Lens 關鍵評論網香港 的編輯 Kayue 與我傾談剛在他們平台發佈的一篇由朱孝文先生寫的文章與另一篇廣為人轉載的《殺人警察》文章,用數據去分析有關近來香港的自殺數字,兩篇都是關於近期自殺數據,但各自得出的分析結果與及推論,可以說是完全相反的。

廣告

細閱他們的分析,縱然有所不同,但也是一些基本的方法,為何會得出如此不同的答案?

要知真相,就要由 raw data 開始睇起。

廣告

朱先生的文章用上了 2019 年 #香港自殺資料統計(朱先生的內文附有連結),由 1 月開始收集數據至 9 月 16 日,而《殺人警察》那篇文章則用了「學術界朋友的數據整合」(未知數據如何 systematically 咁收集),收集由 6 月 12 日開始的自殺個案。

只要細心看看 raw data , 2019 年香港自殺資料所收集的個案要比那位學術界朋友的要多,但 raw data 除了要數量以外,還要準確。

於是筆者進行抽樣檢查,發現 2019 年香港自殺資料的數據,抽了 5 個他們參考的新聞資料,確定了數據無誤。於是再去學術界朋友的數據,一看他們參考的新聞資料,發現第一個 6 月 12 日的個案,是發生在 6 月 15 日的,而第三個 6 月 15 日的個案,卻是發生在 6 月 16 日,而第七個在 6 月 17 日的個案,實際是在 6 月 18 日發生。

基於以上種種原因,筆者傾向覺得朱先生所用的數據較為可靠。

於是,筆者決定用上 2019 香港自殺資料的數據,認真自己從頭做一次分析。

以下是結果:

9 月自殺數字確實並無統計學上有意義 (Statistical Significance) 的上升。 9 月份直至 16 日平均每日有 3 宗個案,而由 1-8 月平均每日也有 2.95 宗個案。

而年齡上,由今年 1 月開始到 9 月 16 日,按月與月之間的比較也無統計學上有意義的分別。 9 月直至 16 日的自殺個案平均年齡是 48.8 歲,而 1-8 月的個案平均年齡是 48.2 歲。

最後,男女比例上, 9 月份自殺的女性比率是比其他月份高,到 9 月 16 日為止有 51% 為女性,而 1-8 月的數字為 37% ;但也沒有統計學上的意義,所以自殺個案的男女比率 9 月與之前的 1-8 月還是沒有大分別。

總括來說,筆者自己做的分析結果與朱先生文章上所說明的結論是相似的,但卻與《殺人警察》文章所得的結論有很大分別。

筆者的這篇文章,旨意希望大家留意分析時所用的數據與數據庫的質量,都會影響到得出的分析結果,然後直接就影響到所推出來的立論。

是的,我們都很想找到831的真相,但數據是需要認真對待的。筆者十分認同朱先生在文章所用的文字與結論。

大家要注意我所用的數據也只有 9 個月,仍然不足以顯示長期規律。由於自殺數據很受季節性影響,我認為只有用5年或以上的數據來進行比較,才有較大參考價值。

統計分析是不可能告訴大家到底有沒有「被自殺」個案的。基本上,除了實質證據(如太子站的 CCTV)能告訴我們事實真相,其他數字都只能作為一般參考。

#希望兩篇文章的原作者不介意
#在亂世中
#我們需要更清醒的頭腦
#及更清晰的思維
#黃藍是政見 
#求真是良知
#手足都要互相提點

原刊於作者 Facebook 專頁

發表意見