立場新聞 Stand News

自己遊行自己數

2017/6/25 — 22:36

2015 年七一大遊行資料圖片

2015 年七一大遊行資料圖片

【文:鄒之喬 美國德州州立大學地理系副教授】

每逢大型公民運動(如六四集會或七一遊行),舉辦單位和警方的出席人數往往大相逕庭,近年的相差甚至有數倍以上。六四集會每年都在香港維多利亞公園舉行,由於參加者一般會在特定時間聚集同一地點,統計相對簡單。筆者此前假設出席人數等於佔據面積乘人口密度,用空中圖片評估了過去兩年的六四集會出席人數1

相反,七一遊行​的參加者一般從維多利亞公園出發,遊行至中環或西環結束。由於人潮不斷移動,沿途有大量人加入和退出,統計比較複雜,因為

廣告

1)視乎遊行面積的大小形狀,單一空中圖片未必能夠覆蓋,
2)人潮不停移動,一般只能抽樣本計算,但是不同的時空樣本會有偏差(sample bias),
3)遊行途中多處人潮插入早退,難以計算,
4)遊行定義的不確定性:誰是參加者?行人道上的算不算?參加時間多長才算?

現行方法甚至沒有任何數據去評估這些不確定性因素(特別是3和4)對遊行人數統計的影響,這些挑戰都使動態人口統計變得複雜。究竟有多少人參與遊行?這是一個似乎很簡單的問題,基於不同的統計方法和假設,卻有不同的答案。

廣告

用傳統的統計方法去計算七一遊行,一般在遊行路線的兩個地點(如銅鑼灣廣場及金鐘太古廣場),派調查人員在高處計算人潮(如每十五分鐘數一分鐘內經過該處的人潮),再加上即場或事後的民調詢問有多少人經過那兩個或其中一個地點,以調整兩地所點算的人數。傳統的統計方法仍受上述的挑戰所限制,特別是2和3。對傳統的統計方法有興趣的讀者可以參考另文2

近年公民意識漸長,加上科技資訊發達,本文嘗試提出一個自下而上的做法,即自己遊行自己數。簡單而言,這個計劃希望遊行參加者可以善用智能手提電話,利用一個為跑步設計的手機程式,分享他們在遊行時的動向,即不同時間的時空座標(甚麼時候在那裡)。透過一定數目的參加者不同的時空座標(即每人不同的x, y, t),這些數據可以用來計算遊行人仕不同時段的步行速度,以及附近的人口密度3(圖一)。如果這個計劃的參加人數足夠,這些新數據可以解決一部分上述的挑戰,包括:1)數據直接量度遊行人仕,並不受限制於遊行面積的大小形狀,2)不同的時空樣本更有代表性,而非局限於兩個固定地點,減少偏差,3)遊行參加者可以按他們的現場需要加入早退,為不同地方加入或退出的人潮提供數據,4)讓遊行人仕自己定義何為參加者,遊行覆蓋面積,參加時間等等。

由於七一遊行的政治因素,以及時空數據所涉及的個人私隱,參加者在遊行時所收集的數據是不會包括任何個人資料(如姓名年齡等等),參加者也可以用匿名的戶口來向筆者分享他們的時空座標。筆者也保證會立即刪除與時空座標無關的任何原始數據(即metadata),並且不會分享這些時空座標或用在動態人口統計以外的任何事。由於編幅所限,有興趣的讀者可以瀏覽有關這個計劃的網站(https://chowte.wixsite.com/dynamicpop)。

本文嘗試剖析動態人口統計的挑戰,並提出新的統計方法,希望引起大眾對這個問題產生興趣。七一將至,究竟將會有多少人參與遊行?筆者誠意邀請参加者,自己遊行自己數!

圖一.步行速度與移動人口密度的關係。

圖一.步行速度與移動人口密度的關係。


1. 鄒之喬, 2017. 集會人數統計與另類事實. 明報, 6月17日
2. Yip, P.S.F., R. Watson, K.S. Chan, E.H.Y. Lau, F. Chen, Y. Xu, L. Xi, D.Y.T. Cheung, B.Y.T. Ip and D. Liu, 2010. Estimation of the number of people in a demonstration, Australian & New Zealand Journal of Statistics. 52(1): 17-26.
3. Bruno, L., and Venuti, F., 2008. The pedestrian speed- density relation: modelling and application. Proceedings of 3rd International Conference Footbridge 2008. 

發表意見