Nov 2022 - Present
————On-site Data Scientist————
客製推薦系統 - Two Tower模型: 建立客製化的Two Tower推薦
模型,提升推薦系統的準確度
優化推薦系統 - DeepFM模型: 修改並重新訓練DeepFM模型,通過細節調整和數據分析,顯著提高模型性能
重組Google Cloud Platform上的數據管線: 優化在Google Cloud Platform上的數據處理流程,提升數據處理效率和可靠性
開發文本挖掘算法: 新詞發現、詞彙分割清理、TextRank等文本挖掘技術,以支援業務需求和數據分析
語言模型與詞嵌入應用: 運用CKIP、fastText、Word2Vec、DeepCTR等工具處理語句分解
————Remote Crawler Engineer————
Python爬蟲: 負責設計及優化爬蟲策略,提高數據爬取效率
Database管理: 管理MySQL和MongoDB數,保證data的完整性和可靠性
維護異步Golang API: 負責Golang API的維護工作,提升系統性能
————Other————
設計和開發用於學術論文比對的系統
DeepAR模型與Timeseries資料處理