我是毛郁舜,畢業於中山大學 電機系-網路多媒體組,研讀的專業是人工智慧,我發表過兩篇期刊論文,分別是推薦系統和時間序列預測的相關論文。目前於中冠資訊公司的技術開發處擔任工程師。負責行情預測、新聞分析和新聞爬蟲,並維護AI模型管理系統的功能。 行情預測和新聞分析:運用pandas清洗新聞數據、運用sklearn建立前置處理流程、運用Pytorch建立模型、開發演算法分析新聞趨勢。 新聞爬蟲:運用Scrapy建立爬蟲專案,結合BeautifulSoup解析回應的網頁內容,使用Pandas清洗數據,最後使用SQLAlchemy將資料寫入資料庫。 維護系統:運用Angular新增前端畫面和功能,撰寫Java新增RESTful API,使前端能調用AI模型相關資訊,如調用次數、訓練次數、驗證失敗次數等相關資訊。
2022-至今
2018 - 2021
2016 - 2016
2014 - 2018
1. 新聞爬蟲
通過Scrapy建立爬蟲專專案,其中Scrapy包含spider、item、itemloader、middleware、pipelines、setting。
2.行情預測
事前領域內的專家已將新聞完成標記,並決定以分類任務的形式來訓練模型。前期研究發現BERT結構優於其他語言模型,將此結構定調為主要的embedding layer,並配合機器學習的模型來預測。
3.新聞分析
首先通過中研院的開源軟體ckiptagger來斷詞,再由我設計的取詞演算法從文章中取出關鍵字詞,其中關鍵字詞是依據領域內專家知識所構築的辭庫,最後得出文章中前十名出現最多的鋼鐵品項漲跌詞組。可有效幫助使用者了解現今鋼鐵行情的變化。
內容涉及智財權只能簡單概述。
一般預測系統將所有輸入變數餵至模型中,我們使用皮爾森相關係數來衡量目標變數和輸入變數的相關性,從中挑選相關性高的變數輸入至模型,此方法可以避免過度擬合且提升預測效果。我們提出的混合深度類神經網路包括擴張卷積(Dilated Convolution)和雙向GRU(Gated Recurrent Unit)從數據中學習局部特徵和時間特徵。此外,注意力結構允許模型專注於重要的特徵,使預測更加準確。 我們的方法和近期的空氣品質預測方法相比,預測效果明顯優於其他方法。
此篇論文發表於國際期刊Springer-Applied Intelligence (第一作者)URL:https://link.springer.com/article/10.1007/s10489-022-04191-y
協同過濾方法無法有效處理資料稀疏性和擴展性,導致預測效果和效率低落。以往推薦系統是基於user-item rating matrix 來進行評分,然而我們通過Word2Vec將評論中的關鍵字轉換為詞向量,再將詞向量和評分矩陣一起納入考量,以此作為推薦系統的基礎,可以有效改善預測效果。自建構分群法(I-SCC)同時找出user之間的關聯性和item 之間的關聯性,分群結果可以有效看出推間的脈絡, A物品和B物品同時被購買時(獲得同一位user評價),意味著高機率兩物品會被分為同一群。主成分分析(PCA)用來降低評分矩陣的維度,提高推薦系統的預測效率。 最後依據分群結果和降維的評分矩陣來導出用戶的偏好。 實驗顯示此方法優於分群方法和舊有方法。
此篇論文發表於國際期刊MDPI-applied science.(第二作者) URL:https://www.mdpi.com/2076-3417/10/7/2540
1. 國立中山大學與高雄醫學大學合作研究計畫-整合神經檢查、生化分析、認知功能及腦部電位技術於阿茲海默症患者智能減退之預測性研究
2.環保署/科技部空氣汙染防制科技研究合作計劃-動態模糊類神經網路於汙染源對空氣品質影響之研究與實作
我是毛郁舜,畢業於中山大學 電機系-網路多媒體組。
研究所期間: 我協助學長研究推薦系統,過程中研讀很多畢業學長的論文,如Neuro Fuzzy應用於空氣汙染預測、自建構分群演算法和推薦系統結合分群演算法等論文,這些論文使我獲益良多,也讓推薦系統的研究進展快速,後來幫助學長研究出以客戶評論為輸入因子的推薦系統,最後也發表至國際期刊MDPI applied science。 我發表過三篇會議論文,第一篇:以大量數據訓練卷積類神經網路,最後依此模型預測未來一小時的PM2.5濃度。第二篇:首先經由相關性分析(皮爾森係數)找出與預測目標強相關的輸入變數,被選中的變數視為輸入變數(模型輸入),最後建立LSTMs來預測未來數小時PM2,5濃度。 第三篇:首先找出強相關變數並視為輸入變數,最後建立CNN-LSTM雙通道網路來預測未來數小時PM2.5濃度。為了改善前面模型的缺點,我在模型中融入Residual Block來避免過度擬合、利用Attention Layer來評斷特徵的重要程度、結合Huber Loss提升預測效能,這也是我碩士論文的最大亮點,最後碩士論文也成功發表於國際期刊Springer Applied Intelligence。
目前於中冠資訊公司的技術開發處擔任工程師。負責行情預測、新聞分析和新聞爬蟲,並維護AI模型管理系統的功能。 行情預測和新聞分析:運用pandas清洗新聞數據、運用sklearn建立前置處理流程、運用Pytorch建立模型、開發演算法分析新聞趨勢。 新聞爬蟲:運用Scrapy建立爬蟲專案,結合BeautifulSoup解析回應的網頁內容,使用Pandas清洗數據,最後使用SQLAlchemy將資料寫入資料庫。 維護系統:運用Angular新增前端畫面和功能,撰寫Java新增RESTful API,使前端能調用AI模型相關資訊,如調用次數、訓練次數、驗證失敗次數等相關資訊。
我是毛郁舜,畢業於中山大學 電機系-網路多媒體組,研讀的專業是人工智慧,我發表過兩篇期刊論文,分別是推薦系統和時間序列預測的相關論文。目前於中冠資訊公司的技術開發處擔任工程師。負責行情預測、新聞分析和新聞爬蟲,並維護AI模型管理系統的功能。 行情預測和新聞分析:運用pandas清洗新聞數據、運用sklearn建立前置處理流程、運用Pytorch建立模型、開發演算法分析新聞趨勢。 新聞爬蟲:運用Scrapy建立爬蟲專案,結合BeautifulSoup解析回應的網頁內容,使用Pandas清洗數據,最後使用SQLAlchemy將資料寫入資料庫。 維護系統:運用Angular新增前端畫面和功能,撰寫Java新增RESTful API,使前端能調用AI模型相關資訊,如調用次數、訓練次數、驗證失敗次數等相關資訊。
2022-至今
2018 - 2021
2016 - 2016
2014 - 2018
1. 新聞爬蟲
通過Scrapy建立爬蟲專專案,其中Scrapy包含spider、item、itemloader、middleware、pipelines、setting。
2.行情預測
事前領域內的專家已將新聞完成標記,並決定以分類任務的形式來訓練模型。前期研究發現BERT結構優於其他語言模型,將此結構定調為主要的embedding layer,並配合機器學習的模型來預測。
3.新聞分析
首先通過中研院的開源軟體ckiptagger來斷詞,再由我設計的取詞演算法從文章中取出關鍵字詞,其中關鍵字詞是依據領域內專家知識所構築的辭庫,最後得出文章中前十名出現最多的鋼鐵品項漲跌詞組。可有效幫助使用者了解現今鋼鐵行情的變化。
內容涉及智財權只能簡單概述。
一般預測系統將所有輸入變數餵至模型中,我們使用皮爾森相關係數來衡量目標變數和輸入變數的相關性,從中挑選相關性高的變數輸入至模型,此方法可以避免過度擬合且提升預測效果。我們提出的混合深度類神經網路包括擴張卷積(Dilated Convolution)和雙向GRU(Gated Recurrent Unit)從數據中學習局部特徵和時間特徵。此外,注意力結構允許模型專注於重要的特徵,使預測更加準確。 我們的方法和近期的空氣品質預測方法相比,預測效果明顯優於其他方法。
此篇論文發表於國際期刊Springer-Applied Intelligence (第一作者)URL:https://link.springer.com/article/10.1007/s10489-022-04191-y
協同過濾方法無法有效處理資料稀疏性和擴展性,導致預測效果和效率低落。以往推薦系統是基於user-item rating matrix 來進行評分,然而我們通過Word2Vec將評論中的關鍵字轉換為詞向量,再將詞向量和評分矩陣一起納入考量,以此作為推薦系統的基礎,可以有效改善預測效果。自建構分群法(I-SCC)同時找出user之間的關聯性和item 之間的關聯性,分群結果可以有效看出推間的脈絡, A物品和B物品同時被購買時(獲得同一位user評價),意味著高機率兩物品會被分為同一群。主成分分析(PCA)用來降低評分矩陣的維度,提高推薦系統的預測效率。 最後依據分群結果和降維的評分矩陣來導出用戶的偏好。 實驗顯示此方法優於分群方法和舊有方法。
此篇論文發表於國際期刊MDPI-applied science.(第二作者) URL:https://www.mdpi.com/2076-3417/10/7/2540
1. 國立中山大學與高雄醫學大學合作研究計畫-整合神經檢查、生化分析、認知功能及腦部電位技術於阿茲海默症患者智能減退之預測性研究
2.環保署/科技部空氣汙染防制科技研究合作計劃-動態模糊類神經網路於汙染源對空氣品質影響之研究與實作
我是毛郁舜,畢業於中山大學 電機系-網路多媒體組。
研究所期間: 我協助學長研究推薦系統,過程中研讀很多畢業學長的論文,如Neuro Fuzzy應用於空氣汙染預測、自建構分群演算法和推薦系統結合分群演算法等論文,這些論文使我獲益良多,也讓推薦系統的研究進展快速,後來幫助學長研究出以客戶評論為輸入因子的推薦系統,最後也發表至國際期刊MDPI applied science。 我發表過三篇會議論文,第一篇:以大量數據訓練卷積類神經網路,最後依此模型預測未來一小時的PM2.5濃度。第二篇:首先經由相關性分析(皮爾森係數)找出與預測目標強相關的輸入變數,被選中的變數視為輸入變數(模型輸入),最後建立LSTMs來預測未來數小時PM2,5濃度。 第三篇:首先找出強相關變數並視為輸入變數,最後建立CNN-LSTM雙通道網路來預測未來數小時PM2.5濃度。為了改善前面模型的缺點,我在模型中融入Residual Block來避免過度擬合、利用Attention Layer來評斷特徵的重要程度、結合Huber Loss提升預測效能,這也是我碩士論文的最大亮點,最後碩士論文也成功發表於國際期刊Springer Applied Intelligence。
目前於中冠資訊公司的技術開發處擔任工程師。負責行情預測、新聞分析和新聞爬蟲,並維護AI模型管理系統的功能。 行情預測和新聞分析:運用pandas清洗新聞數據、運用sklearn建立前置處理流程、運用Pytorch建立模型、開發演算法分析新聞趨勢。 新聞爬蟲:運用Scrapy建立爬蟲專案,結合BeautifulSoup解析回應的網頁內容,使用Pandas清洗數據,最後使用SQLAlchemy將資料寫入資料庫。 維護系統:運用Angular新增前端畫面和功能,撰寫Java新增RESTful API,使前端能調用AI模型相關資訊,如調用次數、訓練次數、驗證失敗次數等相關資訊。