Qxrlk5erivdvojb9iocr

柯百翼 Pai-Yi Ko

哈囉~我是柯百翼,也可以叫我 Jack

 我是一個願意往未知領域挑戰及探索的人。
在研究所的兩年中,我喜歡保持好奇心去探索並學習新的事物,我的主要研究領域為機器學習,而機器學習領域也總是有著許多新的活動與知識等著去探索挖掘,這也驅使我能夠不斷的去學習與成長,期許未來自己能往數據分析師、資料科學家的道路邁進。

Job Search :數據分析師、資料科學家
Location  : 新北市,TW

Contact  :0919-256-201、[email protected]

學歷

國立政治大學, 碩士學位, 統計, 2018 ~ 2020, GPA 4.18

  • 碩士論文 : 二元分類的同類別異質性 2019.02 - 2020.06

在機器學習領域上,資料的型態/類別/可讀性...等都是非常重要的因子,然而資料類別上若存在異質性,容易導致預測學習錯誤並誤導研究人員至錯誤方向,而目前社會上大多存在的資料型態仍是以二元類別型態為主,因此本論文中著重以二元分類資料為研究對象,探討資料集上是否存在類別異質性的問題,並引入前人提出的樹狀分類結構以及二元分類模型等方法進行 Problem Shooting

Qrvvwni4toiwm0ftziae

私立東吳大學, 學士學位, 財務工程與精算數學, 2014 ~ 2018, GPA 3.6

Q2wc1ohuduh1xrxw2ae1

工作經歷

ECIM 專案工程師 台灣積體電路股份有限公司    2021.03 - 2021.07

  • 業務內容 :
         1. 工程系統的管理和改進 :
    • 幫助南科與竹科進行防線脫勾,使南科廠區可專心致力於製造該負責技術的產品。 
            2. 大數據分析,KPI追蹤和強化改善 :
    • 改善 GIGAFab 的 50% 防線,增強製造過程中的偵錯能力,提供更加的良好產品。
    • 與IT部門合作解決南科資料傳輸問題,並獨力完成南科兩廠大量資料的上傳,資料用以改善南科製造防線的精準化,精準防線改善約 80%。
            3. 改進系統規劃並完善以構建智能AI系統 : 
    •  與南科 Program Team 合作並針對系統提出 User Requirement Document (URD) 建構完善的自動化輔助系統,預估可減少平時工程師的人力與時間成本至少 20% 以上。 
            4. 負責工程防禦系統管理,Fault Detection Classification (FDC), Interface-A (EDA) :
    • FDC : 即時監控機台異常狀況,並針對異常發出不同程度的警訊,以維持產品良率。
    • EDA : 強化 FDC 系統收集資料清晰度,以達到更精密的機台監控。

Data Science TA @ NCCU & DSP智庫驅動 國立政治大學    2019.09~2020.07

  • 業務內容 :
         由余清祥教授所開設的政大電腦研習營課程,擔任 R / Python / MS SQL 的教學助教,提供學生解題思路 :
    • 主要負責事項: 教育訓練課程:提供 R / Python / MS SQL 題目之解題思路。

R 語言商業分析教學助理 國立政治大學    2019.09~2020.07

  • 業務內容 :
         於商業分析:R / SAS 課程擔任教學助教,在課堂中給予同學在資料上進行商業分析的建議與方向 : 
           主要負責項目 :
    • 1. 給予商業分析建議,訂定分析目標 
    • 2. 教育訓練課程:教授 R、R markdown 的使用,與如何去使用程式進行商業分析。 
    • 3. 給予反饋:批改及檢討作業,提供更適做法

Skills


資料庫

- MS-SQL
- MySQL
- MongoDB

Programming

- Python
- R
- SAS, SAS EG

Microsoft

- PowerPoint
- Excel
- Word
- Outlook

Personal Skills

- Teamwork
- Communication Skills
- Time Management
- Leadership

Language

- 中文 / 閩南語
- 英文 (TOEIC 755)


比賽經歷

國泰大數據競賽

  • 目的:利用數據進行特徵工程及預測分析客戶在三個月後是否購買保險。
  • 資料:百萬筆
  • 組員:4人 (含本人)
  • 時長:3個月
  • 結果:Public 第五名
  • 執掌部分:資料清理、利用Python建構CatBoost模型進行預測建模並分析。

2019 AI新銳領航者競賽

  • 目的: 透過數據對客戶進行探索性資料分析並針對分析結果提出行銷保險建議。
  • 資料:數十萬筆
  • 組員:4人 (含本人)
  • 時長:半個月
  • 結果:初賽
  • 執掌部分:資料清理、利用R語言進行探索性資料分析 提出最終行銷建議。

自傳

【ABOUT ME】 

      您好,我是柯百翼,畢業於政治大學統計研究所,至小受父母從商的影響,在時間管理與信用的方面是特別看重的,這也幫助了我在求學的路走的相對順遂。不管在工作或學習上,我個人對於責任感是非常看重的,使得我很常擔任小組中組長的職位,也很受同學信賴,相信這些特質對將來的工作上,也會有非常大的幫助。 


 【求學歷程】

       在大學的財務與精算數學的相關課程中,有接觸到一些基礎的程式語言(如 R / C++ / VBA) 以及基礎的統計知識,並且當時流行的大數據 Big Data 熱潮,使得我對於程式以及統計學產生了極大的興趣,希望自己可以跟上數據化時代的腳步,因此決定往統計、資料科學等相關領域進行學習。
        進入研究所之後,對於不是本課系出身的我,統計知識以及程式能力都是從基礎打起,因此除了本科系的統計相關課程,為了讓程式能力能夠學習進步,因此會多選擇資訊科系的課程學習各種程式基礎 (R / Python / MySQL / MongoDB 等),並藉由課程學習的機會與同學共同完成相關專案的報告-『臺北市交通事故分析』,從自訂主題、定義問題、整合不同來源的資料庫Raw Data以及結合統計本科系的專業進行資料分析,透過 ''做中學、學中做'' 持續增進自己的數據分析能力。在研究所期間也參與了兩次的大數據分析競賽,如『國泰人壽2019大數據競賽』與『AI新銳領航者競賽』,對數據進行特徵工程與資料視覺化的分析,預測客戶購買商品的可能性以及提出行銷上的商業建議,藉由參賽來增加自己對社會上的議題有更進一步的認識以及體現自己在學習過程中的成果,並增加資料應用上的實戰經驗。 在平常學習的過程中,也有投入其餘的時間進行校內實習-『R 語言商業分析教學助理』與『Data Science TA @ NCCU & DSP 智庫驅動』,作為課程助教幫助課堂上的學生們解決程式問題以及商業分析上的教學輔導,並提出可改善建議,此外碩士論文是以進一步解析數據分類問題為主要方向,透過前人提出的樹狀分類結構與資料分類模型解決一般數據在進行分類上遇到的常態問題,可以更進一步地去提升整體預測分析以及分類的準確率,於論文中使用到的資料領域就包含農業/音樂/天文...等,因此相信此方法模型可延用到各領域。 


 【就業經驗與成果】

      前一段時間任職於台積電的ECIM專案工程師職位,工作的業務內容上主要是直屬負責工程防禦系統的 KPI 追蹤管理以及針對系統提出強化改善的內容-『Fault Detection Classification (FDC) 』與『Interface-A (EDA)』,並根據GIGAFab的現況執行修正專案與處理相關報案議題,在就職期間,我完成了以下的專案內容: 

1. 改善 GIGAFab 的 50% 防線,增強製造過程中的偵錯能力,提供更加的良好產品 

2. 幫助南科與竹科進行防線脫勾,使南科廠區可專心致力於製造該負責技術的產品

3. 與南科 Program Team 合作並針對系統提出 User Requirement Document (URD) 建構完善的自動化輔助系統,預估可減少平時工程師的人力與時間成本至少 20% 以上。

4. 與IT部門合作解決南科資料傳輸問題,並獨力完成南科兩廠大量資料的上傳,資料用以改善南科製造防線的精準化,精準防線改善約 80% 


 【結語與自我期許】

      過去大學的金融相關知識以及研究所的統計概念與程式語言能力,帶給我良好的邏輯分析與實事求是的精神,認真負責是多數人對我工作時的評語,隨和個性是朋友對我的評價,認真與負責是工作長期表現優異的核心,隨和個性是潤滑團隊持續運作的關鍵,如果這是貴公司所需要並欣賞的特質,請給我一個機會,商討成為貴公司團隊之中的一員。

專案

Projects 00 00@2x

資料分析與資料庫應用



在此次專案中,收集了台北市 101 ~ 108 年交通事故資料,並且搭配即時車速流量與即時天氣預報資訊進行資料分析,最終統計出了三個主題:

1. 統計數據圖表

 2. 事故點標記

3. 危險路段排行


Github