Avatar of Yiru Chen.
Yiru Chen
資料工程師,資料平台開發及資料 ETL 處理
列印
Avatar of the user.

Yiru Chen

資料工程師,資料平台開發及資料 ETL 處理
我有4年半的資料科學及系統開發經驗。工作內容多為參與系統開發,項目包含專案管理、API規劃、數據前處理、原始資料解析、視覺化呈現分析結果、系統模組開發。後期後轉調資料工程單位,除接手維護原舊有系統ETL模組,也加入資料平台的 API 開發與測試。 專長:資料科學、統計模型、機器學習、Python/R、Restful API、SQL、NoSQL、Git。
Logo of the organization.
鴻海(富士康)
Logo of the organization.
國立成功大學
台灣高雄

职场能力评价

专业背景

  • 目前状态
    就职中
  • 专业
    数据科学家
  • 产业
    软件
  • 工作年资
    4 到 6 年 (4 到 6 年相关工作经验)
  • 管理经历
    无管理经验
  • 技能
    Python
    R
    SQL
    Git
    Data Analytics
    Data Visualization
    Data Science
    Project Management
    Statistical Analysis
    API Development
    API
    API Testing
    CDH
  • 语言能力
    English
    中阶
  • 最高学历
    硕士

求职偏好

  • 预期工作模式
    全职
    对远端工作有兴趣
  • 希望获得的职位
    資料工程師
  • 期望的工作地点
    台灣台北
    台灣台中
    台灣新竹
  • 接案服务
    不提供接案服务

工作经验

Logo of the organization.

資料工程師

2021年5月 - 现在
台灣高雄市
資料平台開發: - 搭建於 Apache Nifi 之上,透過 FastAPI 框架, Uvicorn, Gunicorn 開發RESTful API 及設計 MongoDB schema並使用 Docker-compose 進行開發與部署- 負責開發資料庫 Connector 操作頁面(支援 Impala, Kudu, PostgreSQL, MySQL, MS SQL, Oracle)、 Record Controller 功能、平台 Pipeline 中檢視資料的視覺化功能,以及熟悉 Nifi 各種Processor 功能加入系統中 - 協助用戶建置及改善 ETL Pipeline 效能 Line Notify 服務系統: - 設計系統的架構流程及資料庫,以符合使用情境,如監控程式是否 alive 若無則推播訊息,或當程式 fail 時推播訊息 - PostgreSQL function,python backend 程式開發與 line notify api 應用,並使用 Docker 開發與部署 維護系統 ETL 模組: - 增加 Impala 作為來源資料庫,調整資料串接 SQL 以及部署 ETL 模組容器
Logo of the organization.

資料分析師

2017年9月 - 2021年4月
3 年 8 个月
台灣高雄市
SMT領域: - 使用 R串接 Oracle 資料庫中吸嘴清洗紀錄以及吸料、拋料數據,透過loglinear model 預測吸嘴的使用次數,開發吸嘴壽命估計系統,及早清洗吸嘴,驗證期間減少 5% 吸嘴損壞 - 串接 PostgreSQL 資料庫,使用R進行前處理,建立類神經網路模型,結合線性模型,開發印刷機參數智能調整系統,實時監控產品品質,於品質異常時,反饋印刷參數的調整建議,驗證期間 SPI 直通率由 93% 上升至 97%,產線顧線人員由 3 位減少為 1 位 - 量測機台管制上下限調整系統開發,由後段檢測結果,使用R進行K-means分群,區分出不同等級的資料,定時計算統計量,反饋上下限調整的建議值,SPI 直通率由 97% 上升至 98%。 - 人力估計預測分析模組開發,使用R進行資料前處理,並以線性模型估計各類別元件所需掃描外之處理時間。並且準確預測每月正常工時及加班所需員工數 面板領域: - 利用PostgreSQL 串接玻璃的生產履歷資料與瑕疵資料,使用R/Python 開發演算法,計算瑕疵的集中度指標,列出製程中可能造成瑕疵的站點、機台。協助工廠工程師找出問題機台,節省篩選過濾資料的時間,每個案件可減少 60% 問題查找時間 - 鎖定可疑的站點、機台後,利用PostgreSQL 串接機台因子資料與瑕疵資料,使用R/Python做統計檢定,區別資料類型,匹配符合資料的檢定方法,找出機台問題因子。 數據分析套件: - 整理來自 python 不同套件中,常見的各種模型的使用方法,並且執行 pytest 測試 - 開發整合型的模組,包含超參數調整的模組挑選出最佳的超參數,以及模型比較的模組,比較各個模型的表現。 - 使用 setuptools 打包

学历

Logo of the organization.
Master’s Degree
統計研究所
2015 - 2017
3.9/4 GPA
Bachelor of Science (BS)
數學系
2012 - 2015