關貿網路股份有限公司|資料分析師
私立中華大學|資訊管理學系 碩士畢業
1~2年工作經歷|希望職稱:資料科學家、數據分析師、數據工程師、軟體工程師
我叫黃昱庭,正在尋找以資料科學為職務核⼼能⼒的職涯發展機會,喜歡嘗試和挑戰,對於撰寫程式及數據分析充滿激情與熱忱,每當透過數據分析技巧去開發、設計不同類型的模型,總能帶給我滿滿的成就感。
Python、R、C、C++
SQL、Pandas、Tableau、Pyodbc
Numpy、Scikit-learn、Weka、TensorFlow、Pytorch
Selenium、BeautifulSoup
Windows、Linux、Pycharm、Visual Studio 、Jupyter Notebook、Spyder
Excel、Word、PowerPoint
1.將資料進行前處理及數據清洗。
2.透過Python程式語言進行網路爬蟲及資料探勘。
3.使用統計軟體(如SPSS)進行統計檢定及數據分析。
4.藉由視覺化軟體(如Tableau)進行資料操作及數據視覺化。
5.透過SQL語言串接不同資料庫進行資料勾稽。
6.將結果產出分析報告做為回饋及貢獻。
重要貢獻:
【人氣電商平台食安風險研析】:透過網路爬蟲與食藥署資料庫勾稽,成功稽查3家業者,為國人食品安全把關。
【資料不平衡處理方法及效益評估】:評估不同資料不平衡處理方法,改善原有24個產品中分類模型中的14個。
【演算法最佳化參數調整評估】:提供表現更好的參數去建立模型、預測數據,提高模型準確率。
成功稽查3家可疑業者,為國人食品安全把關
1.透過Python程式語言撰寫網路爬蟲抓取人氣電商平台(MOMO購物網、PChome線上購物等)豆製品相關產品之資料(產品名稱、製造廠、地址等)。
2.將資料進行前處理,去除重複及不合適之資料。
3.與食藥署資料庫進行勾稽比對,找尋潛在風險業者。
4.成功於260家業者中找出3家潛在風險業者,並提供給稽查單位。
5.根據稽查結果回報該3家業者均有違規之情形。
改善原有24個產品中分類模型中的14個
食藥署於2020年導入人工智慧,開始管控邊境進口之產品,因產品檢驗後大多為合格,故採用「等比例放大」及「SMOTE」方法來改善資料不平衡的問題。為了提升模型對於不合格產品之辨別能力,故針對其他資料不平衡方法進行研析。
1.透過Python程式語言撰寫資料不平衡處理方法(Borderline SMOTE、貝氏網路等)。
2.將訓練資料集透過上述方法使其資料平衡至設定之比例(合格與不合格比例7比3等)。
3.平衡後之資料放入機器學習模型。
4.比較不同資料不平衡處理方法之成效。
5.最終24個產品中分類模型中有14個採用新的方法。
提供表現更好的參數去建立模型、預測數據,提高模型準確率
食藥署於2020年導入人工智慧,開始管控邊境進口之產品,因專案時程問題,故各機器學習模型中所使用之參數均為預設之參數,為了提升模型之準確率,故針對各模型之參數進行研析。
1.透過Python程式語言撰寫機器學習模型(決策樹、隨機森林、羅吉斯迴歸等)。
2.調整各機器學習模型之參數(決策樹之深度、模型迭代次數等)。
3.將訓練資料放入調整參數之機器學習模型。
4.比較不同參數之預測成效。
5.提供表現更好的參數去建立預測模型。
私立中華大學
中文
英文
關貿網路股份有限公司|資料分析師
私立中華大學|資訊管理學系 碩士畢業
1~2年工作經歷|希望職稱:資料科學家、數據分析師、數據工程師、軟體工程師
我叫黃昱庭,正在尋找以資料科學為職務核⼼能⼒的職涯發展機會,喜歡嘗試和挑戰,對於撰寫程式及數據分析充滿激情與熱忱,每當透過數據分析技巧去開發、設計不同類型的模型,總能帶給我滿滿的成就感。
Python、R、C、C++
SQL、Pandas、Tableau、Pyodbc
Numpy、Scikit-learn、Weka、TensorFlow、Pytorch
Selenium、BeautifulSoup
Windows、Linux、Pycharm、Visual Studio 、Jupyter Notebook、Spyder
Excel、Word、PowerPoint
1.將資料進行前處理及數據清洗。
2.透過Python程式語言進行網路爬蟲及資料探勘。
3.使用統計軟體(如SPSS)進行統計檢定及數據分析。
4.藉由視覺化軟體(如Tableau)進行資料操作及數據視覺化。
5.透過SQL語言串接不同資料庫進行資料勾稽。
6.將結果產出分析報告做為回饋及貢獻。
重要貢獻:
【人氣電商平台食安風險研析】:透過網路爬蟲與食藥署資料庫勾稽,成功稽查3家業者,為國人食品安全把關。
【資料不平衡處理方法及效益評估】:評估不同資料不平衡處理方法,改善原有24個產品中分類模型中的14個。
【演算法最佳化參數調整評估】:提供表現更好的參數去建立模型、預測數據,提高模型準確率。
成功稽查3家可疑業者,為國人食品安全把關
1.透過Python程式語言撰寫網路爬蟲抓取人氣電商平台(MOMO購物網、PChome線上購物等)豆製品相關產品之資料(產品名稱、製造廠、地址等)。
2.將資料進行前處理,去除重複及不合適之資料。
3.與食藥署資料庫進行勾稽比對,找尋潛在風險業者。
4.成功於260家業者中找出3家潛在風險業者,並提供給稽查單位。
5.根據稽查結果回報該3家業者均有違規之情形。
改善原有24個產品中分類模型中的14個
食藥署於2020年導入人工智慧,開始管控邊境進口之產品,因產品檢驗後大多為合格,故採用「等比例放大」及「SMOTE」方法來改善資料不平衡的問題。為了提升模型對於不合格產品之辨別能力,故針對其他資料不平衡方法進行研析。
1.透過Python程式語言撰寫資料不平衡處理方法(Borderline SMOTE、貝氏網路等)。
2.將訓練資料集透過上述方法使其資料平衡至設定之比例(合格與不合格比例7比3等)。
3.平衡後之資料放入機器學習模型。
4.比較不同資料不平衡處理方法之成效。
5.最終24個產品中分類模型中有14個採用新的方法。
提供表現更好的參數去建立模型、預測數據,提高模型準確率
食藥署於2020年導入人工智慧,開始管控邊境進口之產品,因專案時程問題,故各機器學習模型中所使用之參數均為預設之參數,為了提升模型之準確率,故針對各模型之參數進行研析。
1.透過Python程式語言撰寫機器學習模型(決策樹、隨機森林、羅吉斯迴歸等)。
2.調整各機器學習模型之參數(決策樹之深度、模型迭代次數等)。
3.將訓練資料放入調整參數之機器學習模型。
4.比較不同參數之預測成效。
5.提供表現更好的參數去建立預測模型。
私立中華大學
中文
英文