黃昱庭

關貿網路股份有限公司|資料分析師

私立中華大學|資訊管理學系 碩士畢業

1~2年工作經歷|希望職稱:資料科學家、數據分析師、數據工程師、軟體工程師 

我叫黃昱庭,正在尋找以資料科學為職務核⼼能⼒的職涯發展機會,喜歡嘗試和挑戰,對於撰寫程式及數據分析充滿激情與熱忱,每當透過數據分析技巧去開發、設計不同類型的模型,總能帶給我滿滿的成就感。

專長

程式設計


Python、R、C、C++

資料庫 / 分析工具


SQL、Pandas、Tableau、Pyodbc

機器 / 深度學習


Numpy、Scikit-learn、Weka、TensorFlow、Pytorch

網路爬蟲


Selenium、BeautifulSoup

作業系統 / IDEs


Windows、Linux、Pycharm、Visual Studio Jupyter Notebook、Spyder

文書作業軟體


Excel、Word、PowerPoint

工作經歷

資料分析師

關貿網路股份有限公司(2020/4~2022/2)

1.將資料進行前處理及數據清洗。 

2.透過Python程式語言進行網路爬蟲及資料探勘。 

3.使用統計軟體(如SPSS)進行統計檢定及數據分析。 

4.藉由視覺化軟體(如Tableau)進行資料操作及數據視覺化。 

5.透過SQL語言串接不同資料庫進行資料勾稽。 

6.將結果產出分析報告做為回饋及貢獻。 

重要貢獻: 

【人氣電商平台食安風險研析】:透過網路爬蟲與食藥署資料庫勾稽,成功稽查3家業者,為國人食品安全把關。 

【資料不平衡處理方法及效益評估】:評估不同資料不平衡處理方法,改善原有24個產品中分類模型中的14個。

【演算法最佳化參數調整評估】:提供表現更好的參數去建立模型、預測數據,提高模型準確率。 

專案成就

人氣電商平台食安風險研析(2020/11~2020/12)

成功稽查3家可疑業者,為國人食品安全把關

1.透過Python程式語言撰寫網路爬蟲抓取人氣電商平台(MOMO購物網、PChome線上購物等)豆製品相關產品之資料(產品名稱、製造廠、地址等)。

2.將資料進行前處理,去除重複及不合適之資料。

3.與食藥署資料庫進行勾稽比對,找尋潛在風險業者。

4.成功於260家業者中找出3家潛在風險業者,並提供給稽查單位。

5.根據稽查結果回報該3家業者均有違規之情形。

資料不平衡處理方法及效益評估(2021/1~2021/3)

改善原有24個產品中分類模型中的14個

食藥署於2020年導入人工智慧,開始管控邊境進口之產品,因產品檢驗後大多為合格,故採用「等比例放大」及「SMOTE」方法來改善資料不平衡的問題。為了提升模型對於不合格產品之辨別能力,故針對其他資料不平衡方法進行研析。

1.透過Python程式語言撰寫資料不平衡處理方法(Borderline SMOTE、貝氏網路等)。

2.將訓練資料集透過上述方法使其資料平衡至設定之比例(合格與不合格比例7比3等)。

3.平衡後之資料放入機器學習模型。

4.比較不同資料不平衡處理方法之成效。

5.最終24個產品中分類模型中有14個採用新的方法。

演算法最佳化參數調整評估(2022/1~2022/2)

提供表現更好的參數去建立模型、預測數據,提高模型準確率

食藥署於2020年導入人工智慧,開始管控邊境進口之產品,因專案時程問題,故各機器學習模型中所使用之參數均為預設之參數,為了提升模型之準確率,故針對各模型之參數進行研析。

1.透過Python程式語言撰寫機器學習模型(決策樹、隨機森林、羅吉斯迴歸等)。

2.調整各機器學習模型之參數(決策樹之深度、模型迭代次數等)。

3.將訓練資料放入調整參數之機器學習模型。

4.比較不同參數之預測成效。

5.提供表現更好的參數去建立預測模型。

學歷

私立中華大學

資訊管理學系|碩士畢業(2016/9~2018/1)

私立中華大學

資訊管理學系|大學畢業(2012/9~2016/6)

語文能力

中文

聽:精通|說:精通|讀:精通|寫:精通

英文

聽:略懂|說:略懂|讀:略懂|寫:略懂

自傳

【關於我】 

我叫黃昱庭,喜歡嘗試和挑戰,對於撰寫程式及數據分析充滿激情與熱忱,每當透過數據分析技巧去開發、設計不同類型的模型,總能帶給我滿滿的成就感。 


【第一份工作 資料分析師】 

任職於關貿網路股份有限公司並駐點於食藥署,主要工作內容是負責數據處理、清洗、整合、分類、視覺化及建立機器學習模型。數據分析的前期需要運用SQL、Python去處理,而後期會透過視覺化軟體(Tableau)製作淺而易懂的各種圖表並整理成分析報告作為貢獻。

 

※重要貢獻: 

(1)人氣電商平台食安風險研析:成功稽查3家可疑業者,為國人食品安全把關 

透過Python撰寫網路爬蟲抓取人氣電商平台之資料,接著利用SQL與食藥署資料庫進行勾稽比對,最後成功於260家業者中找出3家潛在風險業者。 


(2)資料不平衡處理方法及效益評估:改善原有24個產品中分類模型中的14個 

食藥署於2020年導入人工智慧,開始管控邊境進口之產品,因產品檢驗後大多為合格,故採用「等比例放大」及「SMOTE」方法來改善資料不平衡的問題。為了提升模型對於不合格產品之辨別能力,故針對其他資料不平衡方法進行研析(Borderline SMOTE、貝氏網路等),最終24個產品中分類模型中有14個採用新的方法。

 

(3)演算法最佳化參數調整評估:提供表現更好的參數建立模型,提高模型準確率 

透過Python撰寫機器學習模型(決策樹、隨機森林、羅吉斯迴歸等)並持續調整各項參數,接著比較不同參數之預測成效,最後提供表現更好的參數去建立預測模型。 


(4)設計簡單使用之統計檢定軟體:提供簡易方便的軟體供同仁使用 

於食藥署駐點期間,除了要負責計畫專案的工作,也需要針對國內外食品進行數據分析,撰寫報告時經常會使用統計檢定,而署內同仁並非都擅長程式撰寫或使用統計軟體(SPSS),因此我設計了一個簡單方便的軟體供同仁使用,只需要透過讀取檔案即可完成所有的檢定。 


【在學期間】 

於2018年1月提前取得中華大學資訊管理學系碩士學位,在碩士班的求學過程中主要探討Python、SQL、機器學習及數據分析。因為對於數據分析的熱忱,在撰寫論文時,將身心障礙患者之相關訊息透過Python及Scikit-learn來建立機器學習模型(如支援向量機、決策樹及單純貝氏),並將最後預測患者表現情況之結果作為貢獻。 


※特殊事蹟: 

(1)獲得研討會特優論文獎:

在完成論文撰寫後,我參加了2017年第七屆全國資訊管理前瞻技術研討會,與來自全國各校的學生相互交流及學習經驗,最後從中獲得了該屆研討會的特優論文獎。 


(2)透過數據分析提升招生率: 

就讀碩士班一年級期間,我申請了校內校務研究中心的實習工作,工作內容透過SQL撈取來自全國各地不同縣市及背景的學生資料,並把資料進行處理,接著將資料輸入至數據分析軟體(Weka)進行預測分析,最後提出相關招生策略。 


(3)衛生福利部大數據計畫專案: 

在碩士班教授的推薦下,我參與2017年的衛生福利部計畫專案,為了進行數據分析,首先我將資料進行前處理,但由於資料量過於龐大,使用數據分析軟體(Weka)無法有效率的完成需求,因此我選擇透過我的專長及在數據分析中主流的Python來建立機器學習模型,並完成計畫案之需求。 


透過這些學經歷,我決定尋找與Python程式設計或數據分析相關的工作,而我的優勢在於擁有Python、SQL、機器學習及數據分析的背景及經歷,透過其背景以及配合本身積極學習且勇於嘗試的學習態度,我相信能讓我勝任工作職務,也希望貴公司能給予一面試機會,謝謝。

證照

ERP規劃師 、ERP軟體應用師、OCE(Oracle Database SQL Certified Expert)、食藥署巨量資料分析專業訓練及格證書