畢業於輔仁大學,持有雙學位,分別為理學士主修餐旅管理學系,以及工商管理學士主修統計資訊學系,並於2018年獲得書卷獎,總平均92.81/100.00,包含多門餐旅管理學系以及統計資訊學系的重點科目。
[分析經驗]
運用大數據分析以及統計方法,對我國旅遊景點描述進行中文文本分析、結合多個機器學習演算法建構景點推薦系統,旅客只需點選幾張圖片,此系統便可以快速推薦潛在偏好的旅遊景點。此研究從超過800組競爭團隊脫穎而出,獲得全國冠軍。
[教學經驗]
擔任資料採礦(Data Mining)助教,協助學生使用軟體操作多項機器學習方法,以及指導如何解釋分析後的數據、提取資訊。
+ 886 910 713 852
- 指導學生資料採礦的概念原理。
- 協助學生操作WEKA(資料採礦常用軟體)。
- 指導學生如何解釋分析後的數據、從中擷取有用的資訊。
- 批改多項機器學習方法的作業,包含: 決策樹、關聯分析、階層式分群、K-Means分群…等。
- 參加全國大專院校資訊應用服務創新競賽,超過800組競爭團隊中獲得Open data組第一名。
- 構思專題演算法,其中結合機器學習的非監督學習演算法: Latent Dirichlet Allocation (LDA)和K-Means Clustering
將全台3987景點分群,驗證後其Precision高達74%。
- 使用Python將景點描述做Jieba中文斷詞以及LDA建模。
- 使用PHP和MYSQL實作K-Means Clustering演算法,建立圖片景點推薦系統。
- 在GCP上建立LAMP的Web Server並架設本系統。
- 訓練以Elo Rating System (等級分制度)演算法排行圖片美觀的模型,其與大眾實際喜好達中度相關。
- 使用混淆矩陣(Confusion Matrix)計算精確率(Prescision) 74%、召回率(Recall) 67%、F-Measure 68%驗證分群效果。
- 設計以電子音樂為主題的資料庫,並繪製ERD(個體關係圖)。
- 使用SQL語法在Oracle建立電子音樂資料庫。
- 運用SQL指令查找資訊,如: 關聯子查詢、多個關聯表查詢...等。
輔仁大學 統計資訊學系 2014-09 ~ 2019-01
輔仁大學 餐旅管理學系 2014-09 ~ 2019-01
Berkeley@UCLite Business Administration and Innovation Program 2019-07 ~ 2019-07
統計軟體 R, WEKA, SPSS, SAS
程式語言 VBA, PHP, SQL, Java, Python, JavaScript
英語檢定測驗 TOEFL IBT:102 (2019), TOEIC: 825 (2013)
優勝, 統計資訊系學生專題研究比賽 輔仁大學 2018-12
書卷獎 (班上排名前3%) 輔仁大學 2018-04
佳作, 程式競賽乙組 Python 輔仁大學 2017-09
使用者僅需點選幾張圖片,本系統便可快速從大量景點中客製化推薦使用者偏好的景點。此研究使用政府開放資料集,囊括我國所有旅遊景點的名稱與介紹,配合Instagram中的照片,並透過創新的演算法將景點依不同類型分群供使用者依圖片挑選,同時也減少挑選景點時需要花費大量時間的問題。經由驗證,此系統有效性PR值為72,表示在10個系統推薦的景點中,平均第3個就是使用者喜歡的景點。
- 2018 經濟部工業局全國大專校院資訊應用服務創新競賽 Open Data組 第1名
- 2018 經濟部工業局全國大專校院資訊應用服務創新競賽 資訊應用組 第2名
- 輔仁大學統計資訊系 專題研究比賽 優勝
影片介紹: https://www.youtube.com/watch?v=Hjomt424dHA&feature=youtu.be
程式碼: https://github.com/mengtientsai/PictureYourWay
畢業於輔仁大學,持有雙學位,分別為理學士主修餐旅管理學系,以及工商管理學士主修統計資訊學系,並於2018年獲得書卷獎,總平均92.81/100.00,包含多門餐旅管理學系以及統計資訊學系的重點科目。
[分析經驗]
運用大數據分析以及統計方法,對我國旅遊景點描述進行中文文本分析、結合多個機器學習演算法建構景點推薦系統,旅客只需點選幾張圖片,此系統便可以快速推薦潛在偏好的旅遊景點。此研究從超過800組競爭團隊脫穎而出,獲得全國冠軍。
[教學經驗]
擔任資料採礦(Data Mining)助教,協助學生使用軟體操作多項機器學習方法,以及指導如何解釋分析後的數據、提取資訊。
+ 886 910 713 852
- 指導學生資料採礦的概念原理。
- 協助學生操作WEKA(資料採礦常用軟體)。
- 指導學生如何解釋分析後的數據、從中擷取有用的資訊。
- 批改多項機器學習方法的作業,包含: 決策樹、關聯分析、階層式分群、K-Means分群…等。
- 參加全國大專院校資訊應用服務創新競賽,超過800組競爭團隊中獲得Open data組第一名。
- 構思專題演算法,其中結合機器學習的非監督學習演算法: Latent Dirichlet Allocation (LDA)和K-Means Clustering
將全台3987景點分群,驗證後其Precision高達74%。
- 使用Python將景點描述做Jieba中文斷詞以及LDA建模。
- 使用PHP和MYSQL實作K-Means Clustering演算法,建立圖片景點推薦系統。
- 在GCP上建立LAMP的Web Server並架設本系統。
- 訓練以Elo Rating System (等級分制度)演算法排行圖片美觀的模型,其與大眾實際喜好達中度相關。
- 使用混淆矩陣(Confusion Matrix)計算精確率(Prescision) 74%、召回率(Recall) 67%、F-Measure 68%驗證分群效果。
- 設計以電子音樂為主題的資料庫,並繪製ERD(個體關係圖)。
- 使用SQL語法在Oracle建立電子音樂資料庫。
- 運用SQL指令查找資訊,如: 關聯子查詢、多個關聯表查詢...等。
輔仁大學 統計資訊學系 2014-09 ~ 2019-01
輔仁大學 餐旅管理學系 2014-09 ~ 2019-01
Berkeley@UCLite Business Administration and Innovation Program 2019-07 ~ 2019-07
統計軟體 R, WEKA, SPSS, SAS
程式語言 VBA, PHP, SQL, Java, Python, JavaScript
英語檢定測驗 TOEFL IBT:102 (2019), TOEIC: 825 (2013)
優勝, 統計資訊系學生專題研究比賽 輔仁大學 2018-12
書卷獎 (班上排名前3%) 輔仁大學 2018-04
佳作, 程式競賽乙組 Python 輔仁大學 2017-09
使用者僅需點選幾張圖片,本系統便可快速從大量景點中客製化推薦使用者偏好的景點。此研究使用政府開放資料集,囊括我國所有旅遊景點的名稱與介紹,配合Instagram中的照片,並透過創新的演算法將景點依不同類型分群供使用者依圖片挑選,同時也減少挑選景點時需要花費大量時間的問題。經由驗證,此系統有效性PR值為72,表示在10個系統推薦的景點中,平均第3個就是使用者喜歡的景點。
- 2018 經濟部工業局全國大專校院資訊應用服務創新競賽 Open Data組 第1名
- 2018 經濟部工業局全國大專校院資訊應用服務創新競賽 資訊應用組 第2名
- 輔仁大學統計資訊系 專題研究比賽 優勝
影片介紹: https://www.youtube.com/watch?v=Hjomt424dHA&feature=youtu.be
程式碼: https://github.com/mengtientsai/PictureYourWay