陳怡如 Flora Chen

我有4年半的資料科學及系統開發經驗。工作內容多為參與系統開發,項目包含專案管理、UI呈現的API規劃、數據前處理、原始資料解析、視覺化呈現分析結果、系統模組開發。後期後轉調資料工程單位,除接手維護原舊有系統ETL模組,也加入資料平台的 API 及開發與測試。

專長:資料科學、統計模型、機器學習、Python/R、Impala、KuduPostgreSQL、Git、RESTful APIDocker、Nifi。

  Kaohsiung City, Taiwan   

工作經歷

資料工程師  •  鴻海(富士康)

五月 2021 - Present

資料平台開發:
- 搭建於 Apache Nifi 之上,透過 FastAPI 框架, Uvicorn, Gunicorn 開發RESTful API 及設計 MongoDB schema並使用 Docker-compose 進行開發與部署- 負責開發資料庫 Connector 操作頁面(支援 Impala, Kudu, PostgreSQL, MySQL, MS SQL, Oracle)、 Record Controller 功能、平台 Pipeline 中檢視資料的視覺化功能,以及熟悉 Nifi 各種Processor 功能加入系統中
- 協助用戶建置及改善 ETL Pipeline 效能

Line Notify 服務系統:
- 設計系統的架構流程及資料庫,以符合使用情境,如監控程式是否 alive 若無則推播訊息,或當程式 fail 時推播訊息
- PostgreSQL function,python backend 程式開發與 line notify api 應用,並使用 Docker 開發與部署

維護系統 ETL 模組:
- 增加 Impala 作為來源資料庫,調整資料串接 SQL 以及部署 ETL 模組容器

資料分析師  •  鴻海(富士康)

九月 2017 - 四月 2021

SMT領域:
- 使用 R串接 Oracle 資料庫中吸嘴清洗紀錄以及吸料、拋料數據,透過loglinear model 預測吸嘴的使用次數,開發吸嘴壽命估計系統,及早清洗吸嘴,驗證期間減少 5% 吸嘴損壞
- 串接 PostgreSQL 資料庫,使用R進行前處理,建立類神經網路模型,結合線性模型,開發印刷機參數智能調整系統,實時監控產品品質,於品質異常時,反饋印刷參數的調整建議,驗證期間 SPI 直通率由 93% 上升至 97%,產線顧線人員由 3 位減少為 1 位
- 量測機台管制上下限調整系統開發,由後段檢測結果,使用R進行K-means分群,區分出不同等級的資料,定時計算統計量,反饋上下限調整的建議值,SPI 直通率由 97% 上升至 98%。
- 人力估計預測分析模組開發,使用R進行資料前處理,並以線性模型估計各類別元件所需掃描外之處理時間。並且準確預測每月正常工時及加班所需員工數

面板領域:
- 利用PostgreSQL 串接玻璃的生產履歷資料與瑕疵資料,使用R/Python 開發演算法,計算瑕疵的集中度指標,列出製程中可能造成瑕疵的站點、機台。協助工廠工程師找出問題機台,節省篩選過濾資料的時間,每個案件可減少 60% 問題查找時間
- 鎖定可疑的站點、機台後,利用PostgreSQL 串接機台因子資料與瑕疵資料,使用R/Python做統計檢定,區別資料類型,匹配符合資料的檢定方法,找出機台問題因子。

數據分析套件:
- 整理來自 python 不同套件中,常見的各種模型的使用方法,並且執行 pytest 測試
- 開發整合型的模組,包含超參數調整的模組挑選出最佳的超參數,以及模型比較的模組,比較各個模型的表現。
- 使用 setuptools 打包

學歷

2015 - 2017

國立成功大學

統計研究所

2012 - 2015

台北市立大學

數學系