洪郁程  Hung Yu Cheng

我是洪郁程,畢業於東海大學應用數學系研究所,我的專長是用數學形式表達問題與解決問題,並且熟悉程式語言python,能夠使用python搭配網路爬蟲或是資料分析等相關技能來解決數學問題,我非常享受解題的過程,未來也希望能結合我的興趣與專業在相關的領域裡深耕

Data Scientist,台北,TW  

[email protected]    (+886) 926-431-611


學經歷

東海大學 應用數學系 碩士,2018 年  9月 - 2019 年  8月

五年一貫生 在學期間擔任系上密碼學助教


畢業論文 : 離散對數問題的探討

 : MATLAB

  • 專精近年區塊鏈技術上金鑰交換技術中的Diffie-Hellman演算法 
  • 論文主要研究Diffie-Hellman演算法中離散對數問題的解法,因其基於同餘運算與對數運算的逆運算的困難還有無窮大的質數,沒有有效的方法可以在多項式時間內快速計算,所以使用開發程式來算出解的方式 
  • 本研究以嬰步巨步、波利格-赫爾曼演算法以及指數計算法三個方法來解問題,然後用MATLAB實現演算法的程式碼,及比較三種方法的計算時間,透過快速冪來開發程式

東海大學 應用數學系 2014 年 9 月 - 2018 年 6 月

  • 大三開始輔系統計系,迴歸分析、抽樣調查
  • 專題 : 離散數學專題 - 圖論應用 , 科學計算專題 - 最佳化與微方 , 生物資訊演算法專題 - 動態規劃

工作經歷

中央研究院 統計所 研究助理 2021 年 2月 - 至今
研究主題為統計時間序列以及機器學習與深度學習的應用
研究內容 : 
1. 電商平台定價推薦演算法開發
  • 研發強化學習演算法,利用MAB問題的解,目標解決電商動態定價以及公平性定價問題
  • 演算法可延伸至各大產業,如 : 廣告投放、遊戲設計、醫療臨床試驗、推薦系統
2. threshold diffusion process 閾值擴散過程 (paper):
  • 為統計時間序列的研究,主要負責演算法程式開發,透過程式改寫提升執行效率,減少約20%的時間,期刊投遞中
3.醫療影像處理 : 
  • 嘗試使用深層學習模型來提取失智症基因組特徵和圖像特徵,以進行聯合分析。使用統計方法促進AI醫療模型,主要負責資料處理跟3D圖像的轉換

課外課程與證照

課程 : 職訓局 - 機器學習與資料分析工程師培訓班 

時數:320小時 智能物聯網開發、網頁工程技術、MySQL資料庫、spark、Hadoop 

課程 : 職訓局 - 產業新尖兵-智慧技術與應用

時數:480小時 實作大數據與資料探勘以及智慧科技應用,爬蟲實作與line bot串接,以python為主學習了selenium、Flask、SQL等套件運用

 證照 : 經濟部工業局 iPAS - 巨量資料分析師 通過

作品與專題


MLB棒球勝率分析

起心動念 : 在培訓班所學做的分析,希望藉由前一年的比賽結果分析下一年的每場比賽組合做勝率分析

方法 : 使用Mysql存取資料Django作為網站框架python作為機器學習模型訓練與爬蟲,參考ELO分級制度對對戰組合雙方進行評分,再由評分當作模型來預測結果以及使用sklearn中的決策樹來訓練模型來預測比賽結果 

結果 : 因為使用的參數不多所以結果不是很精準,但也有6成左右的正確率

改善方向 : 把球員狀態表現加入判斷輸贏的分數之一

技能 : python、爬蟲、決策樹、線性回歸

https://github.com/desmondhka/2019_AIoT_project

Paragraph image 00 00@2x

pokemon go對戰聯盟的ELO積分討論

起心動念 : 希望找出官方對戰的加分方式,能夠判斷該場對戰得失分的多寡,藉由少數資料判斷官方隱藏的數據
方法 : 紀錄每場對戰對手分數,靠著幾十次增減分的紀錄來做計算,找出線性模型中的參數,推測下一輪的分數,以及推測是否每個人有不同的隱藏分數
結果 : 能夠對自己的表現有能夠量化的成績展現

技能 : python、excel、資料清理 

https://forum.gamer.com.tw/C.php?bsn=29659&snA=39370&tnum=1

Paragraph image 00 00@2x
.

全民打棒球遊戲中球員卡數值調整的數據分析預測

起心動念 : 遊戲中有卡片買賣的制度,利用預測下一期球員卡會獲得額外加分的球員來先購買卡片,類似於預測股票哪隻會漲

方法 : 利用網路爬蟲抓取當月中華職棒球員資料,對照遊戲官方所使用的哪幾項球員表現數據例如全壘打的支數以及公布的球員分數,運用線性方程式找出數據的權重參數

結果 : 成功預測,計算出來的方程式能夠套用到下個月使用

技能 : python、numpy、網頁爬蟲

p.s. 非作弊行為

https://github.com/s111100001/BBallGameData-Prediction

Paragraph image 00 00@2x

Covid-19觀測圖表

起心動念 : 經由別人的教學練習google的datastudio

方法 : 使用kaggle裡面整理的Covid-19的資料練習資料視覺化的部分

技能 : datastudio

https://datastudio.google.com/reporting/3c177334-ddf3-4aa7-af7b-48e443c21491

Paragraph image 00 00@2x

自傳

        我是洪郁程,畢業於東海大學應用數學系研究所。國中時看了<美麗境界>這部電影,開始對數學有所嚮往,曾經夢想能夠像劇中的主角一樣有能夠影響世界的研究,平常對數字也有特別的敏感性,所以才選擇了數學系,後來發現數學不單單只是理論上的發展也可以應用到很多地方,是一個影響很多東西的工具,因此希望朝向利用數學解決商業問題的職位,為公司解決數學題。

        大學期間除了本科系的訓練外也接觸了程式跟統計的課程,增加了自己的技能,也因為課堂上的專題跟實作對於程式有了更深的了解,經由這些訓練也對程式有很大的興趣,透過像是數值分析或是科學計算學習利用電腦科學來更快的計算一些精密數字,也有學習生物資訊演算法了解動態規劃或是最佳路徑等應用問題,而在碩班的機器學習與資料探勘課程中讓我確立了畢業後想往資料科學相關的方向發展,也開始利用所學鍛鍊自己,利用做報告跟專案的過程中練習如何定義商業問題。畢業後進入了中研院統計所擔任助理,藉由台灣學術最高殿堂學習最新的理論,例如說深度學習在商品的定價、影像辨識在阿茲海默症的應用...等,了解到相關的資料處理以及數據分析,除此之外我也幫助老師修改論文的演算法,在討論的過程中讓老師發現演算法的程式是可以修改減短的,可以讓程式更快速。

        除了課業上的學習外,在大學期間也曾擔任過微積分的家教以及碩班期間為密碼學的助教,此外也有參加系學會跟社團幹部,系學會中我擔任活動股,主要在處理系上活動還有連結各年級的感情,任內還有辦過跨校的數學系體育競賽,社團部分是風之舞溜冰社,主要在活動的處理以及課程的輔助教學,在參與或是舉辦不同活動的過程中,我不僅培養了更加敏銳的觀察力,也具備領導團隊與溝通的能力,這也讓我在畢業後參與資料工程師培訓班能夠跟其他人在程式上可以好好分工,多了一些專題合作經驗,除此之外也透過網路進修在kaggle跟udemy上修讀機器學習的課程,以及練習各個競賽。

        綜上所述,我認為藉由數學與統計的背景能夠讓我在資料科學的工作上快速進入狀況,為團隊做出貢獻,也能協助爬資料、處理資料、進行統計分析,透過對數字的敏感度來提出問題解決問題,也期許能夠結合不同領域的研究做出更好的結果

        未來我也希望透過精進數據分析相關技能來讓我更好的定義數據問題以及解決問題或是做出決策,也藉由了解市場趨勢以及目標受眾或許能夠做到在問題提出前就發現問題或是提出解決方法,短期內預計在2022年11月考取iPAS的機器學習證照來增進自己

技能


演算法開發

MATLAB 

Python 

R


機器學習與深度學習

random forest

SVM

CNN

KNN


網路爬蟲

Requests

Selenium

BS4

Flask

資料庫

MySQL
PostgreSQL

資料分析

pandas

numpy 

Scikit-learn

PyTorch

TensorFLow

Keras

datastudio