CakeResume Talent Search

Advanced filters
On
4-6 years
6-10 years
10-15 years
More than 15 years
Avatar of the user.
Avatar of the user.
Past
Senior Data Analyst @趨勢科技
2022 ~ Present
Data Scientist, Data Analyst, Machine Learning Engineer
Within one month
python
R
SQL
Unemployed
Ready to interview
Full-time / Interested in working remotely
4-6 years
輔仁大學 Fu Jen Catholic University
統計資訊學系
Avatar of Yen-Ting Liu.
Avatar of Yen-Ting Liu.
Data Engineer @Tesla
2023 ~ 2023
Data engineer / Data anyayst
Within two months
Yen-Ting Liu 我具有5年python資料分析,熟悉以Docker搭配nginx, redis部屬api及系統於GCP上。熟悉Airflow程式及報表自動化分析流程,並有Hadoop,Elasticsearch群集管理實務、pyspark數據ETL經驗。我喜歡學習新技術,並追求以更高效率進行資料處理流程。 Santa Clara, CA, USA [email protected] 工作經歷 Data Engineer
python
Linux
R
Employed
Ready to interview
Full-time / Interested in working remotely
4-6 years
University of Texas at Dallas
Information Technology and Management
Avatar of 陳昭儒.
Avatar of 陳昭儒.
Past
Data Engineer @BUBBLEYE | We're hiring!
2021 ~ 2022
Software Enginer
Within two months
陳昭儒(Chao-Ju Chen) Github [email protected] Education National Taiwan University Bachelor’s Degree, Electrical Engineering 2012 ~ 2017 Project Highlights Aggregating Files in one ETL, output 60B row to Data Warehouse Input :gzipped files(200GB in total) Task : Loading columns with values parsed from each gzipped file name. Wrote to BigQuery existing table(specific schema) in parallel. Tool: GCP Dataflow(Hosted Serverless Apache Beam) Result : The job took 40min to finish. Machine Type: n1-standard-1(1 vcpu, 3.75GB memory) Autoscaled up to 122 workers at peak. The data
Python
ETL
Web Scraping
Unemployed
Ready to interview
Full-time / Interested in working remotely
4-6 years
National Taiwan University
電機工程學系
Avatar of Clark Wang.
Avatar of Clark Wang.
Senior Data Scientist @PTI 力成科技
2016 ~ Present
大數據分析,資料科學家,資料工程師,AI工程師
Within one month
known their requirement and current difficulty, and guide end-user to establish their own analysis flow, thus reducing and replacing many daily manual analysis processes. In the meantime, i have experience on In-house user training too. iv. ETL for Tableau. I write python script on pyspark to summary daily output, machine error code, quality checking data, and pass it to Tableau for visualization. v. Unscheduled AI and statistical education and training for production line person and engineers. 學歷 SepJun 2012 逢甲大學 Applied Mathematics - Master degree 技能 Data
Data Augmentation for Rare Defect Images
Signal Processing & Recognition
Administrator for Engineering Data Analysis System
Employed
Open to opportunities
Full-time / Interested in working remotely
6-10 years
逢甲大學
Applied Mathematics
Avatar of 謝欣宏.
Avatar of 謝欣宏.
高級工程師 @電商
2023 ~ Present
軟體工程師、影像處理工程師、AI處理工程師、演算法工程師
Within one month
市集 六月至今 成功實作整合了 Kubernetes、Airflow、Gitlab、Gitlab Runner 和 Docker Registry 的微服務系統架構 。 重構 TensorFlow Model Server AI 專案,實作 gRPC 協定減少通訊延遲 。 使用 PySpark 和 Apache Beam 處理深度學習的億級資料前處理 。 利用 Spring Boot 改進了 NLP 專案,增加模組化設計、新增單元測試,加入微服務同步機制
C++
Java
JavaScript
Employed
Open to opportunities
Full-time / Interested in working remotely
More than 15 years
國立台灣科技大學
資訊與通訊
Avatar of 許立農.
Avatar of 許立農.
數據科學家 @中國信託商業銀行股份有限公司
2021 ~ Present
AI工程師、機器學習工程師、深度學習工程師、資料科學家、Machine Learning Engineer、Deep Learning Engineer、Data Scientist
Within three months
許立農 | Hsu, Li-Nung Data Scientist、Data Engineer Taipei [email protected] Education National Chenchi University, MS, Statistics, 2015 – 2017 GPA : 3.84 / 4.0 Master Thesis: Entropy Based Feature Selection, Professor Pei-Ting, Chou Objective: Build a similarity matrix based on Mutual Entropy under Hierarchical Clustering. Afterwards, select clustered features as the final selection. Compare the model with other feature selection methods like RF, Lasso, F-score. National Chen-Kung University, BS, Mathematics, 2011 – 2015 Skills Programing Python Scala R MSSQL Data-related Tools Tensorflow (Keras) PyTorch Spark Docker
Python
R
MSSQL
Employed
Open to opportunities
Full-time / Interested in working remotely
4-6 years
政治大學
統計
Avatar of the user.
Avatar of the user.
Data Engineer @美好金融
2022 ~ 2023
軟體工程師
Within two months
Java
Python
MongoDB
Employed
Open to opportunities
Full-time / Interested in working remotely
6-10 years
國立中央大學
物理
Avatar of 孫煜凱.
Offline
Avatar of 孫煜凱.
Offline
Past
機器學習工程師 @順豐科技公司
2021 ~ 2022
AI工程師、機器學習工程師、深度學習工程師、資料科學家、Machine Learning Engineer、Deep Learning Engineer、Data Scientist
Within one month
5. 技術能力 熟練Hadoop生態和集群運行原理 ,與 Hive、 Presto組件 ,熟練掌握SQL語言編寫與模型落地,具有其調優經驗 ; 熟練使用Python與Pyspark, 熟練 使用RDD算子與Spark SQL、Sklearn等,進行機器學習與數據分析 ; 熟練使用Git與Docker,能進行YAML、Dockerfile編寫與CICD部署流程、搭建RESTful API等 ; 熟
Word
PowerPoint
Excel
Unemployed
Full-time / Interested in working remotely
4-6 years
國立政治大學(National Chengchi University)
統計系
Avatar of the user.
Software Engineer / Backend Engineer
Within three months
FastAPI(Python)
System Design
GCP Compute Engine
Unemployed
Full-time / Interested in working remotely
6-10 years
中原大學 Chung Yuan Christian University
資訊工程學系
Avatar of 翁崇恒.
大數據資料工程師、演算法工程師
Within two months
翁崇恒 我的名字是翁崇恒,自2018年從事資料科學與AI領域約5年的時間,目前正在尋求資料科學與人工智慧的職務。我曾在工作上研發新的深度學習演算法,能夠在非常少的資源下運行模型來做自動控制;在學術研究上,我能夠發明新的方法
Python
machine learning
Data Analysis
Full-time / Interested in working remotely
4-6 years
國立中央大學 National Central University
人工智慧

The Most Lightweight and Effective Recruiting Plan

Search resumes and take the initiative to contact job applicants for higher recruiting efficiency. The Choice of Hundreds of Companies.

  • Browse all search results
  • Unlimited access to start new conversations
  • Resumes accessible for only paid companies
  • View users’ email address & phone numbers
Search Tips
1
Search a precise keyword combination
senior backend php
If the number of the search result is not enough, you can remove the less important keywords
2
Use quotes to search for an exact phrase
"business development"
3
Use the minus sign to eliminate results containing certain words
UI designer -UX
Only public resumes are available with the free plan.
Upgrade to an advanced plan to view all search results including tens of thousands of resumes exclusive on CakeResume.

Definition of Reputation Credits

Technical Skills
Specialized knowledge and expertise within the profession (e.g. familiar with SEO and use of related tools).
Problem-Solving
Ability to identify, analyze, and prepare solutions to problems.
Adaptability
Ability to navigate unexpected situations; and keep up with shifting priorities, projects, clients, and technology.
Communication
Ability to convey information effectively and is willing to give and receive feedback.
Time Management
Ability to prioritize tasks based on importance; and have them completed within the assigned timeline.
Teamwork
Ability to work cooperatively, communicate effectively, and anticipate each other's demands, resulting in coordinated collective action.
Leadership
Ability to coach, guide, and inspire a team to achieve a shared goal or outcome effectively.
Within one month
Machine learning enig
順豐科技公司
2021 ~ 2022
台灣基隆
Professional Background
Current status
Unemployed
Job Search Progress
Professions
Machine Learning Engineer, Data Analyst, Information Analyst
Fields of Employment
Artificial Intelligence / Machine Learning, Big Data
Work experience
4-6 years
Management
None
Skills
Word
PowerPoint
Excel
Python
PySpark
R
Power BI
Tableau
MariaDB / MySQL
Hive
Presto
Linux
Git
CICD
Docker
Kubeflow
Languages
Chinese
Native or Bilingual
English
Fluent
Job search preferences
Positions
AI工程師、機器學習工程師、深度學習工程師、資料科學家、Machine Learning Engineer、Deep Learning Engineer、Data Scientist
Job types
Full-time
Locations
台灣台北, 台灣新北市, 台灣新竹市新竹
Remote
Interested in working remotely
Freelance
Yes, I freelance in my spare time
Educations
School
國立政治大學(National Chengchi University)
Major
統計系
Print

孫煜凱 - 目標是成為資料科學家

 

        畢業於政治大學統計所,擁有大數據分析與機器學習、模型部署的工作經歷,希望透過數據科學,實現數字化運營,達到業務上真正的數據驅動,充分挖掘數據價值,實現公司盈利持續的增長。


         技能方面主要使用 PythonSQL,大數據工具 (HiveSpark等)、數據分析(統計、機器(深度)學習)等相關經驗,此外也熟悉維運相關之部屬(CICDKubeFlow) 、BI Tools(TableauPower BI)等應用。


          畢業後即在廣東工作,有製造業與深圳互聯網數據分析與部署經驗;先前任職於廣東深圳物流公司研發中心-順豐科技,擔任機器學習工程師一職。

    E-Mail: [email protected] | Phone: 0908563192  | Line: karta282950

            

學歷Education

政治大學, National Chengchi University, 碩士(M.S.),

 Statistics, 2015-2017

  • 擔任世新大學民意調查中心數據分析師,研究領域:問卷調查與信效度分析
  • 碩士論文:簡單順序假設波松母數較強檢定力檢定
    • 提出一種新的離散型數據較強檢定力檢定
    • 透過蒙地卡羅模擬波松分布實證新的較強力檢定效果優於當前方法

國立臺北教育大學, National Taipei University of Education,

 理學士(B.S.), Mathematics, 2011~2015

專業能力Specialty

1. 業務理解能力

  • 能快速瞭解公司各業務線,將產品經理提出派生指標需求對應到公司相關業務線,梳理業務事件,並通過拆解需求指標形成閉環,為後續模型開發打下基礎

2. 需求拆解能力

  • 可將複雜的派生指標拆解成原子指標和修飾字段,熟悉公司的元數據管理系統,通過元數據管理系統對原子指標對應的表進行數據探查,瞭解數據源、數據量及其應用場景,形成數據流文檔,制定模型設計基礎

4. 全鏈路優化能力

  • 跑數優化:從數據源到程式優化、數據接入的方式,進行全鏈路的調優提高效率
  • 跑數採集:採集工具參數調優與調整採集策略、時間、任務相依性,對部分表全量抽取改為增量抽取等
  • 保存策略:部分歷史數據價值不大,保留日期顆度最小需求歷史快照以及拉鍊表處理緩慢變化等模型
  • 設計方面:按照模型架構和設計原則,避免竪井式開發;統計各任務調度時間,對執行過長的任務進行優化。

5. 技術能力

  • 熟練Hadoop生態和集群運行原理,與Hive、Presto組件,熟練掌握SQL語言編寫與模型落地,具有其調優經驗
  • 熟練使用Python與Pyspark,熟練使用RDD算子與Spark SQL、Sklearn等,進行機器學習與數據分析
  • 熟練使用Git與Docker,能進行YAML、Dockerfile編寫與CICD部署流程、搭建RESTful API等
  • 熟練使用TableauPower BI,熟練使用Tableau函數與Dax、M語言製作Dashboard與移動端App

技能Skill

Data Base


  • MySQLMariaDB
  • PostgreSQL
  • Hive、Presto

Languages


  • Python - 5+ years
  • Pyspark - 2+ years
  • R - 3+ years

BI Tool


  • Power BI
  • Tableau

CI/CD


  • Gitlab CI
  • Docker Compose
  • Kubernetes
  • Kubeflow

Analysis


  • Feature engineering
  • Tree model、Time series
  • Deep learning

  • Model Stacking
  • Tune parameters(Optuna)
  • Cross validation(Oof)

Others


  • Kaggle Expert
  • TOEIC 785
  • FastAPI
  • Airflow
  • Hydra
  • Wandb

項目經歷Project Experience

包裹件量數據處理


  • 搭建中國包裹件量數據底盤
  • 新增時序、天氣、疫情等特徵

包裹件量預測模型


  • 透用Prophet與LightGBM預測全中國、各省、營業點、社區未來1、7、45、120天的包裹量

疫情監控融合包裹件量模型


  • 異常檢測疫情期間件量,融入模型預測與後處理

工廠作業員離職率預測


  • 預測每個月作業員離職人數
  • 分析離職原因與降低離職率

工廠設備備料預測


  • 收集產線設備歷史維修量與產量、安全水位等
  • 預測未來四個月的備料量

市場售後品質分析


  • 透過失效模型(韋伯分配-右刪失),預測零件退回量
  • 透過DTW與Kmeans,預測整機未來39個月內退回量

工廠生產異常描述分類


  • 生產異常時工程師手動記錄原因
  • 利用哈工大bert中文預訓練模型對描述分類(10類)

SPI與SPC優化


  • SPI站電路板錫膏印刷點位分群(k-means),監控異常
  • 優化SPC告警系統

屏幕白平衡RGB調整


  • 屏幕透過調整RGB,測試不同色溫白平衡是否合規

  • 透過機器學習降低調整次數

工作經歷Work Experience



順豐科技公司 SF Technology, Machine Learning Engineer,   Aug 2021~Jul 2022

  • 搭建中國各省、城市、營業點、社區的收派包裹數據底盤、畫像
    • Hive做ETL任務,每日處理上億筆訂單數據;新增天氣、疫情等特徵融入分析、後處理;
    • 透過Pyspark補日期空值、異常值並抽取各時間序列特徵
  • 預測中國各省、城市營業點、社區未來1、7、45、120天收、派包裹件量
    • 1、7天包裹量用LightGBM做預測;45、120天包裹量用Prophet做預測
    • 設置Prophet中節假日表,支持電商節(如雙11、618女王節等)的預測
    • 搭建疫情包裹件量異常監控模型打點,並加入天氣、疫情數據融入模型與後處理
  • 機器學習模型落地與監控效果
    • 撰寫YAML文件,在Kubeflow上部署模型
    • 透過Tableau製作監控看版,包含:每日模型準確率、各地包裹量等情況

(Key skill: Hive、Presto、Pyspark、Python、Tableau、Kubeflow)

緯創資通 Wistron, AI Engineer, Jan 2018~Aug 2021

  • 工廠作業員離職率預測
    • 每月22號提供HR下個月離職人數,以提前備人,降低招聘成本
    • 負責新增統計與類別特徵,並透過Catboost建,準確率:97.9%
  • 工廠生產異常描述分類
    • 生產中異常發生問題,工程師手動紀錄不良原因,利用深度學習自動分類
    • 哈工大中文RoBERTa預訓練模型分類,共10類,準確率:85%
  • 工廠設備備料預測
    • 工廠產線設備的歷史維修備料量,預測下個月需準備多少備料
    • 將歷史時序領用量做分群(ADI與CV指標),不同群搭配不同模型(XGBoost、Croston、指數平滑、移動平均)預測,準確度平均70%,庫存水位降低30%
  • SPI與SPC優化
    • 利用電路板錫膏印刷體積隨時間各點位變化進行k-means,搭配點位分群結果與SPC監控製程穩定度
    • 搭配機台參數與錫膏體積建立預測模型,建議體積超規格時如何調整,R^2 = 42%,MAPE=5%
  • 產品售後市場失效預測系統
    • 單個零件失效透過右刪失韋伯分配(Right-Censoring Weibull distribution),預測未來每月退回零件
    • 整機售出後未來39個月保固期內,透過動態時間規整(Dynamic Time Warping)預測每月退回整機數量

  • 屏幕白平衡RGB機台調整參數自動推薦
    • 產線屏幕測試需要調整RGB(0~255),使畫面色彩平衡顯示正常
    • MultiOutput Regression與XGBoost搭配GridSearch與Asymmetric Loss
    • 降低測試次數與時間,一次性通過率原先40%提升至90%
(Key skill: Mysql、Python、Tensorflow、Docker、Fastapi、CI/CDPower BI)

其他經歷Others

大碩研究所補習班郭銘慶老師助教

2016 

政大大學部統計學助教

2016 

 參與行政院委託世新民調中心分析環境素養問卷調查分析與建模

2017

Kaggle Expert

2023

Resume
Profile

孫煜凱 - 目標是成為資料科學家

 

        畢業於政治大學統計所,擁有大數據分析與機器學習、模型部署的工作經歷,希望透過數據科學,實現數字化運營,達到業務上真正的數據驅動,充分挖掘數據價值,實現公司盈利持續的增長。


         技能方面主要使用 PythonSQL,大數據工具 (HiveSpark等)、數據分析(統計、機器(深度)學習)等相關經驗,此外也熟悉維運相關之部屬(CICDKubeFlow) 、BI Tools(TableauPower BI)等應用。


          畢業後即在廣東工作,有製造業與深圳互聯網數據分析與部署經驗;先前任職於廣東深圳物流公司研發中心-順豐科技,擔任機器學習工程師一職。

    E-Mail: [email protected] | Phone: 0908563192  | Line: karta282950

            

學歷Education

政治大學, National Chengchi University, 碩士(M.S.),

 Statistics, 2015-2017

  • 擔任世新大學民意調查中心數據分析師,研究領域:問卷調查與信效度分析
  • 碩士論文:簡單順序假設波松母數較強檢定力檢定
    • 提出一種新的離散型數據較強檢定力檢定
    • 透過蒙地卡羅模擬波松分布實證新的較強力檢定效果優於當前方法

國立臺北教育大學, National Taipei University of Education,

 理學士(B.S.), Mathematics, 2011~2015

專業能力Specialty

1. 業務理解能力

  • 能快速瞭解公司各業務線,將產品經理提出派生指標需求對應到公司相關業務線,梳理業務事件,並通過拆解需求指標形成閉環,為後續模型開發打下基礎

2. 需求拆解能力

  • 可將複雜的派生指標拆解成原子指標和修飾字段,熟悉公司的元數據管理系統,通過元數據管理系統對原子指標對應的表進行數據探查,瞭解數據源、數據量及其應用場景,形成數據流文檔,制定模型設計基礎

4. 全鏈路優化能力

  • 跑數優化:從數據源到程式優化、數據接入的方式,進行全鏈路的調優提高效率
  • 跑數採集:採集工具參數調優與調整採集策略、時間、任務相依性,對部分表全量抽取改為增量抽取等
  • 保存策略:部分歷史數據價值不大,保留日期顆度最小需求歷史快照以及拉鍊表處理緩慢變化等模型
  • 設計方面:按照模型架構和設計原則,避免竪井式開發;統計各任務調度時間,對執行過長的任務進行優化。

5. 技術能力

  • 熟練Hadoop生態和集群運行原理,與Hive、Presto組件,熟練掌握SQL語言編寫與模型落地,具有其調優經驗
  • 熟練使用Python與Pyspark,熟練使用RDD算子與Spark SQL、Sklearn等,進行機器學習與數據分析
  • 熟練使用Git與Docker,能進行YAML、Dockerfile編寫與CICD部署流程、搭建RESTful API等
  • 熟練使用TableauPower BI,熟練使用Tableau函數與Dax、M語言製作Dashboard與移動端App

技能Skill

Data Base


  • MySQLMariaDB
  • PostgreSQL
  • Hive、Presto

Languages


  • Python - 5+ years
  • Pyspark - 2+ years
  • R - 3+ years

BI Tool


  • Power BI
  • Tableau

CI/CD


  • Gitlab CI
  • Docker Compose
  • Kubernetes
  • Kubeflow

Analysis


  • Feature engineering
  • Tree model、Time series
  • Deep learning

  • Model Stacking
  • Tune parameters(Optuna)
  • Cross validation(Oof)

Others


  • Kaggle Expert
  • TOEIC 785
  • FastAPI
  • Airflow
  • Hydra
  • Wandb

項目經歷Project Experience

包裹件量數據處理


  • 搭建中國包裹件量數據底盤
  • 新增時序、天氣、疫情等特徵

包裹件量預測模型


  • 透用Prophet與LightGBM預測全中國、各省、營業點、社區未來1、7、45、120天的包裹量

疫情監控融合包裹件量模型


  • 異常檢測疫情期間件量,融入模型預測與後處理

工廠作業員離職率預測


  • 預測每個月作業員離職人數
  • 分析離職原因與降低離職率

工廠設備備料預測


  • 收集產線設備歷史維修量與產量、安全水位等
  • 預測未來四個月的備料量

市場售後品質分析


  • 透過失效模型(韋伯分配-右刪失),預測零件退回量
  • 透過DTW與Kmeans,預測整機未來39個月內退回量

工廠生產異常描述分類


  • 生產異常時工程師手動記錄原因
  • 利用哈工大bert中文預訓練模型對描述分類(10類)

SPI與SPC優化


  • SPI站電路板錫膏印刷點位分群(k-means),監控異常
  • 優化SPC告警系統

屏幕白平衡RGB調整


  • 屏幕透過調整RGB,測試不同色溫白平衡是否合規

  • 透過機器學習降低調整次數

工作經歷Work Experience



順豐科技公司 SF Technology, Machine Learning Engineer,   Aug 2021~Jul 2022

  • 搭建中國各省、城市、營業點、社區的收派包裹數據底盤、畫像
    • Hive做ETL任務,每日處理上億筆訂單數據;新增天氣、疫情等特徵融入分析、後處理;
    • 透過Pyspark補日期空值、異常值並抽取各時間序列特徵
  • 預測中國各省、城市營業點、社區未來1、7、45、120天收、派包裹件量
    • 1、7天包裹量用LightGBM做預測;45、120天包裹量用Prophet做預測
    • 設置Prophet中節假日表,支持電商節(如雙11、618女王節等)的預測
    • 搭建疫情包裹件量異常監控模型打點,並加入天氣、疫情數據融入模型與後處理
  • 機器學習模型落地與監控效果
    • 撰寫YAML文件,在Kubeflow上部署模型
    • 透過Tableau製作監控看版,包含:每日模型準確率、各地包裹量等情況

(Key skill: Hive、Presto、Pyspark、Python、Tableau、Kubeflow)

緯創資通 Wistron, AI Engineer, Jan 2018~Aug 2021

  • 工廠作業員離職率預測
    • 每月22號提供HR下個月離職人數,以提前備人,降低招聘成本
    • 負責新增統計與類別特徵,並透過Catboost建,準確率:97.9%
  • 工廠生產異常描述分類
    • 生產中異常發生問題,工程師手動紀錄不良原因,利用深度學習自動分類
    • 哈工大中文RoBERTa預訓練模型分類,共10類,準確率:85%
  • 工廠設備備料預測
    • 工廠產線設備的歷史維修備料量,預測下個月需準備多少備料
    • 將歷史時序領用量做分群(ADI與CV指標),不同群搭配不同模型(XGBoost、Croston、指數平滑、移動平均)預測,準確度平均70%,庫存水位降低30%
  • SPI與SPC優化
    • 利用電路板錫膏印刷體積隨時間各點位變化進行k-means,搭配點位分群結果與SPC監控製程穩定度
    • 搭配機台參數與錫膏體積建立預測模型,建議體積超規格時如何調整,R^2 = 42%,MAPE=5%
  • 產品售後市場失效預測系統
    • 單個零件失效透過右刪失韋伯分配(Right-Censoring Weibull distribution),預測未來每月退回零件
    • 整機售出後未來39個月保固期內,透過動態時間規整(Dynamic Time Warping)預測每月退回整機數量

  • 屏幕白平衡RGB機台調整參數自動推薦
    • 產線屏幕測試需要調整RGB(0~255),使畫面色彩平衡顯示正常
    • MultiOutput Regression與XGBoost搭配GridSearch與Asymmetric Loss
    • 降低測試次數與時間,一次性通過率原先40%提升至90%
(Key skill: Mysql、Python、Tensorflow、Docker、Fastapi、CI/CDPower BI)

其他經歷Others

大碩研究所補習班郭銘慶老師助教

2016 

政大大學部統計學助教

2016 

 參與行政院委託世新民調中心分析環境素養問卷調查分析與建模

2017

Kaggle Expert

2023