陳承穎 Benson Chen

0937-585-057 | [email protected]

LinkedIn:    GitHub: 


工作經歷

資料分析工程師

MediaTek  •  2020/04 - 2021/09

  • 幫助 R&D 部門導入數據分析工具 Splunk,縮減分析所需時間和提升分析數據量至每日數百GB量級
  • 作為 Splunk 數據專案的窗口,專注於使用者需求收集、提出資料模型、使用 Git 佈署、優化使用者體驗和資料報表開發
  • 協助 modem 團隊佈署 ParserMAMA/Bombyx,並且將產生的 ELG log 對接導入Splunk,合作部門包含 WCT/WSP
  • 使用 NiFi & GCP 開發parser framework & data pipeline,協助 CAI 團隊將良率測試資料自動化導入資料倉儲 BigQuery,包含使用 GCS 作為資料湖 ,Airflow 作流程控制
  • 熟悉 Linux 環境,用於測試 Splunk 新需求 POC,以及負責維護 Splunk service server

客戶服務工程師

 ASML - Cymer  •  2017/08 - 2019/05

  • 與 TSMC & UMC 合作,進行曝光機之雷射安裝、升級和維修,確保機台效能,優化和穩定晶圓生產品質
  • 安排與協調客戶機台 action plan,降低 down time,有效提升客戶產能
  • 處理預期外的當機事件,能夠單獨面對緊急且棘手的複雜問題,trouble-shooting 找出軟硬體失效的原因

技能

Programming

  • Python
  • C/C++

Data Tool

  • Splunk
  • NiFi (ETL tool)
  • SQL
  • Airflow
  • Spark

Cloud 

  • BigQuery
  • Redshift

Others

  • Git
  • Linux

專案

Cloud data warehouse with Redshift 

(Udacity nano degree of data engineer)

  • 使用 AWS Redshift 建立資料倉儲,將存放在 AWS S3 的資料,透過 ETL 資料管線導入 Redshift,並將資料轉換成分析導向的 dimension model 供資料分析者使用
  • GitHub 專案 Data Warehouse with Redshift

Data lake with Spark

(Udacity nano degree of data engineer)

  • 使用 AWS S3 配合 Spark 建立資料湖應用,Spark 撈取 S3 資料後,利用 schema-on-read 處理資料,將資料轉換成 star schema 形式,再以 parquet 格式放回 S3 
  • GitHub 專案 Data Lake with Spark

學歷

國立中央大學

光電科學碩士  •  2012/09 - 2014/06

  • C/C++ 配合 NVIDIA GPU 開發 multi-threads 平行運算的三維影像重建演算法,提升 10 X 的運算速度,應用在核子醫學的造影系統
  • 使用 LabVIEW 開發自動化的訊號擷取系統,用於有效地收集核種衰變產生的輻射訊號
  • 修習課程: 半導體製程、光學計算(Matlab 實作光學理論)、傅立葉光學

元智大學

光電工程學士  •  2008/09 - 2012/06

  • 修習課程: 線性代數、程式設計、電磁波理論、幾何光學

專業證照

  • 課程時長五個月,約200小時,利用大數據技術,共實作六個專案
  • 使用 Python & PostgreSQL實作 SQL relational data model 
  • 使用 AWS Redshift 建立雲端資料倉儲
  • 使用 Spark & AWS S3 建立資料湖
  • 使用 Airflow 建立自動化 ETL data pipeline 
  • Skill-sets: Python、SQL、AWS、Spark