使用MS SQL從大數據資料庫當中撈取資料,Join不同的表格以獲取特定的使用者資訊。
使用Python爬取中央氣象局的歷年天氣資料,再用QGIS將地點與天氣結合,以便後續分析。
使用Python進行資料前處理,並建立機器學習模型,如SVM、Random Forest、Neural Network等,來
找出影響偵測率的重要變數。
使用Python 建立Neural Network + Genetic algorithm 模型,能夠找出能使偵測率最大的重要組合,理
想狀況下能夠提升4%左右的偵測率(89% to 93%)。
使用Python 建立Association rule和Decision rule,探索資料之變數之間隱藏的關係。
使用Tableau進行資料視覺化。