Taiwan
緯創資通 - 軟體工程師 (機器學習、自然語言處理)
目前在緯創資通進行自然語言處理及分析,具備文字分析的實務經驗。
擁有強烈的自主學習能力,樂於透過線上課程及各項資源累積新知,並將所學透過部落格或是討論的形式,與他人進行交流,以達共同成長的效果。
除文字分析外,對於MLOps的數位工具(MLFlow, Airflow) 及容器化(Docker, K8S)有相當的興趣,將這些工具導入至專案中,期許自己持續累積相關經驗。
三月 2020 - Present
依據病人的文字病摘及其他病理報告,預測該次診療階段的疾病分類碼,協助疾病分類師進行判斷。在導入Clinical-BERT後,整體準確率提升10%,並實際提供區域醫院上線使用,每週使用量約300-400次。 此專案藉由 Azure Serverless API 及 資料庫建立雲端API和服務。
規劃及開發部門文字分析框架,使用語言模型(BERT, GPT-2, XLNet)處理常見的文字下游任務 (Sequence / Token Classification, QA)。 以 Transformers 及 Pytorch Lightning 建置,並以 MLFlow 作為 MLOps 的平台。此框架及相關成果在後續三項專案中持續使用。
收集市調公司、 論壇、 社群媒體等外部資訊,,建構模型萃取主題及情緒資訊,與公司內部的產線資訊進行統整 ,建立模型預測未來的出貨量,以協助工廠端調整存貨及製造量。
在Side Project 透過 Kubernetes部署 Airflow 服務,透過Scheduler 監控平台產生的流程檔案(DAG file),以K8S的機制動態調整Worker Pod 數量,達到流程管理及分散式處理任務的目的。
在專案中導入 MLFlow,搭配 Amazon S3雲端服務管理ML實驗的超參數、指標、及權重檔案,達到實驗版本管理、可重複利用、快速部署。目前已在3個團隊專案成功導入。
2018 - 2019
2015 - 2018
Coursera 線上課程
其他