Lea Yeh / 葉美伶

現任聯發科技公司 | AI & Big Data 部門 | 半導體先進製程 | 資料科學家

業務橫跨公司成本控管及晶片開發,開發 PB-level 資料從 data integration 到 machine learning 的所有環節,能快速分析巨量資料,並從資料源頭提升 prediction model 表現。

  • Data Science, 
    • 透過 machine learning model 改善控制手機溫度控制機制,降低溫度誤差 < 1C
    • 協助晶片開發者降低 20% 功耗,提升手機效能 14K Antutu score
    • 開發 BI Dashboard 分析 EDA tool 使用狀況,降低 25% 採購成本
  • Data Engineer, 
    • 建立結構化資料和非結構化資料之 automating data pipelines
    • 設計 PB-level 資料 ETL 流程並引入阿里巴巴 data warehouse 分層設計
    • 建立資料品質 realtime 監控機制,資料缺失率 50% 降低到 <1%

  Taipei City, Taiwan         

工作經歷

Data Engineer / Scientist

MediaTek Inc.  •  2019/07 - Present

協助晶片設計提升產品效能

  • 透過 regression model 改善控制手機溫度控制機制,溫度誤差 < 1C
  • 透過 unsupervised learning 精確分貨,多救回過去誤分的 5% 高階晶片
  • 建立 PB-level data warehouse 降低 20% 功耗並提升手機效能 (14K Antutu Score)

協助晶片開發掌握新製程特性

  • 透過 Plotly/Dash 進行數據分析,協助晶片開發人員縮短開發時間 50%
  • BigQuery 透過數倉分層設計及優化 SQL 提升 70% 效能

建立雲端分析管道

  • 透過 NiFi, Airflow, Dataflow, BigQuery 設計 ETL 流程
  • 在公司數位轉型初期,引入阿里巴巴數據中台理論的數據分層設計,提升資料表重用率
  • 建立資料品質實時監控機制,資料缺失率 50% 降低到 <1%,每個月降低人力成本 7.5man-day

進行 EDA License 及 Computing Farm 成本控管

公司三大成本: EDA License, Computing Farm, 人力

  • 透過 Splunk 建立互動式 BI Dashboard,輔助 EO 採買決策,減少 25% 採購成本
  • 提升 11% 整體 EDA license 使用率,19% EDA temp license 使用率

能跨部門協調獨立作業,並帶領團隊完成專案

  • 深獲合作部門肯定,於 2021 獲得 15 個跨部門 vAward
  • 為公司節省巨額採購成本,於 2020 獲得 IT 年度獎

Software Engineer

MediaTek Inc.  •  2016/09 - 2019/07

開發 Modem Log 相關除錯及分析工具

  • 以 Vue.js 搭配 Electron 建立 World Wide Field Frial Upload Tool
  • 結合 Python 及 Jenkins 開發 ICD DMS 達到自動化以文件規範實作
  • 透過 AngularJS 開發 StackOverflow-like QA 平台

技能

Programming Skills

Python, SQL, SPL, NodeJS, HTMK, CSS, Git, CI/CD

  • 8 年以上 Python 編程經驗,嚴格遵守 PEP8 coding style 規範,追求高效優雅 pythonic 開發
  • 3 年 SQL 及 SPL 開發經驗,力求優化查詢效能
  • 2 年網頁後端開發經驗,貢獻 CDNJS 大型開源專案 (9.4K stars)

Machine Learning Skills

Sklearn, Numpy, Pandas, Scipy, seaborn, shap value, xgboost, random forest, linear regression, feature engineering, high dimension clustering (fit JD key word)

Data Engineering & Analysis Skills

Airflow, NiFi, Dataflow, BigQuery, Cloud Function, Plotly/Dash, Splunk

Cloud Platform

GCP: Cloud Function, Dataflow, Composer, BigQuery

學歷

2014 - 2016

National Chiao Tung University

Computer Science - Data Mining Lab

2011 - 2014

Tatung University

Computer Science