Bncuf8y5ii6lpqisg5go

陳禹彤  Yu-Tung, Chen

財金背景的Data Science愛好者。專長為機器學習、資料分析與視覺化,擁有強大的自學能力。


    |     |       | Taipei,TW       

技能


Data Mining

Python - numpy, pandas , sklearn ,

seaborn , graphviz , streamlit (ML app framework)

SAS (Base) - descriptive statistics , proc tabulate  


Machine Learning

Classification , Regression

Clustering , Association Rule

Data Preprocessing

Feature Engineering

Regularization


Others

MySQL 

git - 版本控管、部署專案 

Heroku - 部署專案

證券商營業員 

ICDL-Data Analysis 

Google Analytics個人認證(GAIQ)


專案 Projects

機器學習 Machine Learning / 資料分析 Data Analysis 

玉山信用卡盜刷偵測 

極度不平衡的資料集,只有1.34%是異常交易。我在feature engineering產出16個新features後使用catboost建出了兩種風格迥異的模型,一種高F1-score達到73%,擁有強力的泛化性,一種經過SMOTE+ENN後有著94%極高的recall,能夠偵測出大多數的盜刷。並使用PCA將其視覺化。

Paragraph image 00 00@2x

信用卡盜刷偵測DEMO 

進一步使用flask部署模型,並搭配bootstrap的樣式使前端頁面更加美觀,讓一般的使用者能用網頁點選來輕鬆運用機器學習模型,也能透過api來得到預測的結果。

Paragraph image 00 00@2x
Paragraph image 01 00@2x

Product Detection   / kaggle

這是一個10GB的大型資料集,分為42種類,所有資料都是實際的蝦皮賣場圖片。

我在多種測試後選擇先將不均勻的資料取樣成為較均勻的資料和做圖像增強, 以及撰寫bat檔將相對應的圖片批次移動,再使用efficientnet做轉移學習,在沒有細調模型的情況下達到近60%的驗證集準確率 。

Ion Switching (離子通道)   / kaggle 

長達500萬列的連續時間序列資料,非常特別的是原資料只有time、signal和要預測的open_channels三個列。

透過產出大量的rolling描述統計量與標準化大幅增加特徵的數量,再使用XGBoost預測結果。

最終在提交測試集後取得了92.7%的好成績。

Paragraph image 00 00@2x

Charles Book Club  

在進行資料預處理跟特徵工程後,我使用了XGBoost模型,再用三種方法向其他同學和教授解釋結果,最後在100人內提交出10人的名單,且成功預測7個人會買“Florence“這本書,是該堂課預測準確率最高的。 

Paragraph image 00 00@2x

分析保險公司之顧客與建立預測模型 

透過SAS EM預測保險公司是否會違約。我們首先使用k-means將各類顧客分為6群,描繪各類顧客的特色,再用Boosting、Random Forest 與 kNN三種演算法分類,並將詳細步驟整理為小論文且上台報告,最終受到同學和教授的高度評價。

Paragraph image 00 00@2x
Paragraph image 01 00@2x

淡江大學防疫施政研究 

我們透過問卷探討性別、年齡、學院別和住宿與否對學校防疫政策的滿意度,將各種統計檢定的結果統整為約30頁的論文報告。 

我負責「學生對於學校各項防疫措施的滿意度」和「各項因素對於學生的影響」的部分,使用SAS進行卡方檢定與簡單線性迴歸來分析問卷結果。


學歷

淡江大學 Tamkung University, 財務金融學系 Department of Banking and Finance, 2016 ~ 2020

程式設計:資料庫、商用程式設計(python)、SAS程式設計、進階SAS程式設計

資料科學:巨量資料探勘、人工智慧概論、社群分析與輿情探勘、應用經濟分析

財務金融:期貨與選擇權、財務工程、經濟數學


特殊經歷 Special Experience

Paragraph image 01 00@2x

微軟一日實習TAI技術助理 , 2020 年 3 月 7 日

有幸在3000人中得到此機會,我和其他厲害的實習生們挑戰在短短的20分鐘內用Azure平台做圖像辨識,最後利用Sway協作小組簡報並輪流上台報告成果,因此快速上手和抗壓的能力很重要。

天財夢想家營隊志工 ,2019 年 7 月 5 日 ~ 13 日

本營隊獲得了暑期社會服務隊特優獎的殊榮。我們教導50位國小高年級生有關於理財的重要性,再透過扮演黑心商店遊樂部使他們親身體驗商業手法的機率陷阱之處,寓教於樂的方式在家長中創造了極佳的口碑。

Paragraph image 00 00@2x
Paragraph image 01 00@2x

音樂遊戲社社長 , 2017 年 9 月~ 2018 年 9 月

●社團負責人:常態社課解說,舉辦比賽和趣味競賽

●計畫呈現:撰寫社團評鑑、成果發表文件與比賽計劃書,設計社博傳單 

●粉絲專頁維護:製作社課主題視覺圖,單篇貼文最高觸及率1300,達粉絲人數2倍

●比賽協辦:與9大校協辦UMSL(大專音遊聯盟),是全台規模最大的音樂遊戲盛事

Powered by CakeResumePowered by CakeResume
Powered by CakeResumePowered by CakeResume