R 語言實做:台北捷運橘線分析

Avatar of 戴伯儒.
Avatar of 戴伯儒.

R 語言實做:台北捷運橘線分析

New Taipei City, Taiwan

作品連結 (分析時間區段為 3/01 至 6/30)

這個案例有分成三個部分:

  1. 我以捷運橘線新莊區的五個站為起點,練習去分析這五個站前往不同線的情況。
  2. 統整整條橘線的時段出入資料,並且試著用 PCA 主成分分析去看不同站的特徵為何。
  3. 繪製成隨時間變化的動態長條圖,觀看橘線上站所出入的人次變化。 

前提

我把民權西路、松江南京、忠孝新生、東門、古亭併入橘線統計。

這裡的人次是平均每日的統計,代表平均每天有幾個人在這裡進站,並且在某線出站。

在右欄,FALSE 代表假日,TRUE 代表工作日

從這裡可以看到:新莊五站大多數從橘線出站,其次是紅線,最後是棕線。頭前庄人數最少,而新莊站相較於迴龍、丹鳳、輔大人數稍微較少,而且從藍線出來的人次相較也少,可能是因為新莊離大漢橋比較近,可以比較快抵達捷運新埔站。

捷運局有區分五個不同的時段,分別是:

  1. 凌晨(morning):早上五點至六點
  2. 早上尖峰(morning_peak):早上七點至九點
  3. 中間(AM9_PM3):早上九點至下午三點
  4. 傍晚尖峰(evening_peak):下午四點到晚上七點
  5. 晚上(night):晚上八點到凌晨一點


我把人流按照這五大時段去作主成分分析:

我嘗試著利用 PCA 分析可以看到:早上尖峰與晚上尖峰幾乎呈反相,代表這兩個時段會讓各站的差距人次呈現極大的差異。例如 1 ~ 5 幾乎擠在一起,8、10 與 12 則是在傍晚尖峰相對自身的早上尖峰時段稍微多一點。16、18、19 附近是商辦區,因此傍晚尖峰就比較有顯著的進站人流。從這張圖可以看到:愈靠左邊,可能是愈靠住宅區,愈靠右邊,可能是愈靠近工作與讀書的地方。


值得注意的是,水平的貢獻度達到 97%,因此左右影響力會大非常多,上下指標的影響力就比較小。

此圖表的數據是橘線每站每小時的入站數減去出站的動態圖。此圖可以約略看出各站在進出人數差距上的不同情況。

這個案例有分成兩個部分: 1. 我以捷運橘線新莊區的五個站為起點,練習去分析這五個站前往不同線的情況。 2. 統整整條橘線的時段出入資料,並且試著用 PCA 主成分分析去看不同站的特徵為何。最後並繪製成隨時間變化的動態長條圖。
Avatar of the user.
Please login to comment.

Published: Oct 6th 2022
140
2
0

R
R 語言

Share