吳明倫 Allen Wu

Data Scientist / Engineer

  Taiwan

緯創資通 - 軟體工程師 (機器學習、自然語言處理)

            https://minglunwu.github.io

目前在緯創資通進行自然語言處理及分析,具備文字分析的實務經驗。

擁有強烈的自主學習能力,樂於透過線上課程及各項資源累積新知,並將所學透過部落格或是討論的形式,與他人進行交流,以達共同成長的效果。

除文字分析外,對於MLOps的數位工具(MLFlow, Airflow) 及容器化(Docker, K8S)有相當的興趣,將這些工具導入至專案中,期許自己持續累積相關經驗。

技能

深度學習


  • Tensorflow2
  • Pytorch 
  • Pytorch Lightning
  • Transformers

API開發


  • Flask
  • FastAPI
  • Azure Serverless API

MLOps


  • Linux
  • Docker, K8S
  • Airflow
  • MLFlow
  • Gitlab CI/CD

資料庫


  • MongoDB
  • Relational Database

工作經歷

軟體工程師 (資料分析、自然語言處理)  •  緯創資通

三月 2020 - Present

  • ICD10 - 國際疾病分類標準碼預測

依據病人的文字病摘及其他病理報告,預測該次診療階段的疾病分類碼,協助疾病分類師進行判斷。在導入Clinical-BERT後,整體準確率提升10%,並實際提供區域醫院上線使用,每週使用量約300-400次。 此專案藉由 Azure Serverless API 及 資料庫建立雲端API和服務。

  • 語言模型框架規劃及開發

規劃及開發部門文字分析框架,使用語言模型(BERT, GPT-2, XLNet)處理常見的文字下游任務 (Sequence / Token Classification, QA)。 以 Transformers 及 Pytorch Lightning 建置,並以 MLFlow 作為 MLOps 的平台。此框架及相關成果在後續三項專案中持續使用。

  • Invoice Quantity Prediction -  產線出貨量預估 (進行中)

收集市調公司 論壇 社群媒體等外部資訊,,建構模型萃取主題及情緒資訊,與公司內部的產線資訊進行統整 ,建立模型預測未來的出貨量,以協助工廠端調整存貨及製造量。 

其他經歷

  • 在Kubernetes上部署Airflow

在Side Project 透過 Kubernetes部署 Airflow 服務,透過Scheduler 監控平台產生的流程檔案(DAG file),以K8S的機制動態調整Worker Pod 數量,達到流程管理及分散式處理任務的目的。

  • 導入 MLFlow,建構ML專案實驗管理機制

在專案中導入 MLFlow,搭配 Amazon S3雲端服務管理ML實驗的超參數、指標、及權重檔案,達到實驗版本管理、可重複利用、快速部署。目前已在3個團隊專案成功導入。


學歷

2018 - 2019

國立中山大學

資訊管理研究所 (五年學碩士計畫)  - GPA 3.88 / 4.3

2015 - 2018

國立中山大學

資訊管理學系 - GPA 3.9 / 4.3


證照

Coursera 線上課程

其他


經歷

  • 2020中山大學資管系程式設計研究社 - Python 講師
Powered by CakeResumePowered by CakeResume