Hi, 我是黃堉真。 資管碩畢,軟體工程師,有5年以上coding經驗,python專業。
具獨立解決問題能力,喜歡學習並創新,做事熱忱用心,擅溝通。
樂觀開朗喜歡幫助別人,希望有機會可以互相交流,學習。
NLP Engineer / Data Scientist / Machine Learning Engineer
城市,TW
[email protected]
• 爬蟲工作實作
• 機器學習模型使用
• 資料分析可視化
• 使⽤開源程式碼,透過Flask web api對接
• 以web進⾏⼈機介⾯建置及前、後 端程式撰寫。
• 以物件導向基礎建立系統架構。
• MVC架構及部屬與MySQL資料對應撈取
• SQL語言進行資料庫及資料表新增修改
1. flask web 部署
2. 資料視覺化處理並分析提出報告
3. 與客戶討論專案,並推動專案進行
4. python 工具研發
5. 模型訓練並優化
授課教學(帶領20位小三小四孩童了解程式邏輯,使用APP Inventor 工具)
1. 使用 PHP Laravel MVC架構
2. 使用git 版本控制及更新
3. 透過Ubutu系統架設伺服器並維護
從事資訊系統、伺服器、網路系統、電子郵件、資料庫等維護工作,並協助解決產品使用之相關技術問題。
在學期間研究NLP相關論文,Python工具擅長,對於NLP model及Alogrithm 有相當的理論經驗。
並專精於爬蟲工具,資料前處理、資料清理等工作。
1.擷取文本資料
2.進行jieba斷詞
3.找出各詞彙頻率
4.找出各詞彙形容詞比率
5.透過特徵詞建立模型
Step1:將候選特徵詞一一輸入模型 Step2:計算顯著值
Step 3:取顯著值前n個作為新候選特徵詞組
Step 4:以新候選特徵詞組重複執行Step2及Step3
1.使用jieba斷詞評論文件
2.使用斷詞後文件建立word2vec模型
3.將模型以視覺化顯示
1.進入agoda網站並找尋評論頁面
2.開始Selenium紀錄動作
3.使用python進行抓取網頁內容
4.將爬取存入陣列
5.將陣列輸出為csv檔
1.透過Dcard提供的api網址透過requests回傳資料
2.檢視資料結構
3.將資料轉換成DataFrame
4.使用DataFrame輸出為excel
1.透過各五種演算法取出特徵詞
2.使用TF-IDF計算個特徵詞權重
3.再依據各特徵詞權重進行分類