資料分析師
關貿網路股份有限公司
・
Contract任職於關貿網路股份有限公司並駐點於食藥署,主要工作內容是負責數據處理、清洗、整合、分類、視覺化及建立機器學習模型。數據分析的前期需要運用SQL、Python去處理,而後期會透過視覺化軟體(Tableau)製作淺而易懂的各種圖表並整理成分析報告作為貢獻。
※重要貢獻:
(1)人氣電商平台食安風險研析:成功稽查3家可疑業者,為國人食品安全把關
透過Python撰寫網路爬蟲抓取人氣電商平台之資料,接著利用SQL與食藥署資料庫進行勾稽比對,最後成功於260家業者中找出3家潛在風險業者。
(2)資料不平衡處理方法及效益評估:改善原有24個產品中分類模型中的14個
食藥署於2020年導入人工智慧,開始管控邊境進口之產品,因產品檢驗後大多為合格,故採用「等比例放大」及「SMOTE」方法來改善資料不平衡的問題。為了提升模型對於不合格產品之辨別能力,故針對其他資料不平衡方法進行研析(Borderline SMOTE、貝氏網路等),最終24個產品中分類模型中有14個採用新的方法。
(3)演算法最佳化參數調整評估:提供表現更好的參數建立模型,提高模型準確率
透過Python撰寫機器學習模型(決策樹、隨機森林、羅吉斯迴歸等)並持續調整各項參數,接著比較不同參數之預測成效,最後提供表現更好的參數去建立預測模型。
(4)設計簡單使用之統計檢定軟體:提供簡易方便的軟體供同仁使用
於食藥署駐點期間,除了要負責計畫專案的工作,也需要針對國內外食品進行數據分析,撰寫報告時經常會使用統計檢定,而署內同仁並非都擅長程式撰寫或使用統計軟體(SPSS),因此我設計了一個簡單方便的軟體供同仁使用,只需要透過讀取檔案即可完成所有的檢定。