陳怡如 Flora Chen

我有4年半的資料科學及系統開發經驗。工作內容多為參與系統開發，項目包含專案管理、UI呈現的API規劃、數據前處理、原始資料解析、視覺化呈現分析結果、系統模組開發。後期後轉調資料工程單位，除接手維護原舊有系統ETL模組，也加入資料平台的 API 及開發與測試。

專長：資料科學、統計模型、機器學習、Python/R、Impala、Kudu、PostgreSQL、Git、RESTful API、Docker、Nifi。

Kaohsiung City, Taiwan

工作經歷

資料工程師 • 鴻海（富士康）

五月 2021 - Present

資料平台開發：
- 搭建於 Apache Nifi 之上，透過 FastAPI 框架, Uvicorn, Gunicorn 開發RESTful API 及設計 MongoDB schema並使用 Docker-compose 進行開發與部署- 負責開發資料庫 Connector 操作頁面(支援 Impala, Kudu, PostgreSQL, MySQL, MS SQL, Oracle)、 Record Controller 功能、平台 Pipeline 中檢視資料的視覺化功能，以及熟悉 Nifi 各種Processor 功能加入系統中
- 協助用戶建置及改善 ETL Pipeline 效能

Line Notify 服務系統：
- 設計系統的架構流程及資料庫，以符合使用情境，如監控程式是否 alive 若無則推播訊息，或當程式 fail 時推播訊息
- PostgreSQL function，python backend 程式開發與 line notify api 應用，並使用 Docker 開發與部署

維護系統 ETL 模組：
- 增加 Impala 作為來源資料庫，調整資料串接 SQL 以及部署 ETL 模組容器

資料分析師 • 鴻海（富士康）

九月 2017 - 四月 2021

SMT領域：
- 使用 R串接 Oracle 資料庫中吸嘴清洗紀錄以及吸料、拋料數據，透過loglinear model 預測吸嘴的使用次數，開發吸嘴壽命估計系統，及早清洗吸嘴，驗證期間減少 5% 吸嘴損壞
- 串接 PostgreSQL 資料庫，使用R進行前處理，建立類神經網路模型，結合線性模型，開發印刷機參數智能調整系統，實時監控產品品質，於品質異常時，反饋印刷參數的調整建議，驗證期間 SPI 直通率由 93% 上升至 97%，產線顧線人員由 3 位減少為 1 位
- 量測機台管制上下限調整系統開發，由後段檢測結果，使用R進行K-means分群，區分出不同等級的資料，定時計算統計量，反饋上下限調整的建議值，SPI 直通率由 97% 上升至 98%。
- 人力估計預測分析模組開發，使用R進行資料前處理，並以線性模型估計各類別元件所需掃描外之處理時間。並且準確預測每月正常工時及加班所需員工數

面板領域：
- 利用PostgreSQL 串接玻璃的生產履歷資料與瑕疵資料，使用R/Python 開發演算法，計算瑕疵的集中度指標，列出製程中可能造成瑕疵的站點、機台。協助工廠工程師找出問題機台，節省篩選過濾資料的時間，每個案件可減少 60% 問題查找時間
- 鎖定可疑的站點、機台後，利用PostgreSQL 串接機台因子資料與瑕疵資料，使用R/Python做統計檢定，區別資料類型，匹配符合資料的檢定方法，找出機台問題因子。

數據分析套件：
- 整理來自 python 不同套件中，常見的各種模型的使用方法，並且執行 pytest 測試
- 開發整合型的模組，包含超參數調整的模組挑選出最佳的超參數，以及模型比較的模組，比較各個模型的表現。
- 使用 setuptools 打包

學歷

2015 - 2017

國立成功大學

統計研究所

2012 - 2015

台北市立大學

數學系