Cdm3wie5df93cjlztmr6

許桓瑜

在大學時期很沉迷於資訊科學的世界。在碩士期間更專研於資料科學方面知識,希望能在資料分析一展長才。在學期間亦協助多門資料科學的課程助教與協助大學部學弟妹完成畢業專題。

畢業後工作方面多從事資料工程相關工作,例如資料收集、清洗、存取等,也協助機械學習模型的開發與應用,幫助專案能更順利的完成。

技能 Skills


程式語言

- Python (中等)



資料庫

- Redis

- MySql

- MongoDB


版本控制

- git

其他

- Linux (CentOS)

- Hadoop ecosystem

- Tableau


擅長領域

- Deep Learning

- Machine Learning

- Data Engineering

- Web Crawler

工作經歷

聯合智網股份有限公司,數據工程師,2020 年 6 月 - 現今

任職於聯合智網股份有限公司, 主要進行以下工作: 

(1) 機械學習模型建置

  開發多個特定產業之文本情緒分析模型,準確度皆在80%以上。

 ● 配合產業資料特性來優化中文斷詞演算法,以提升斷詞精確度。

 ● 開發多個特定產業之文本情緒分析模型,準確度皆在80%以上。

 

(2) 爬蟲開發與維護 

 ● 協助開發多個網站的多執行緒爬蟲程式並維運,爬取的網站如Dcard、PTT等等,並設計一系列自動化處理流程,並協助移植到GCP上並與其他google服務串接,並每週定時產生營運所需之報表。

 ● 協助以python重構並優化多個大型購物網站爬蟲如Momo、PChome等。  

(3) 協助維運與優化現有機械學習模型與DMP系統

 ● 協助整合數十隻自動化排程程式,簡化流程並降低人力維護成本。

 ● 維護各部門定期需要的資料,開發相關的自動化資料擷取與清洗程式。 

 ● 專案資料庫規劃與管理。

 ● 協助重構多個舊有Spark程式,並移植於GCP運作。   


易勝資訊股份有限公司,資料工程師,2018 年 11 月 - 2020 年 03 月

任職於易勝資訊公司,被派駐至資策會服創所金融科技中心服務。 主要進行以下工作: 

(1)資料分析工作協助

 ● 為協助信評模型資料標記,開發新聞文本分類標記模型、短文本標記模型等,準確度皆在90%以上。 

 ● 協助調研國內外論文,並協助將多項應用技術加入至信評分析的模型中,如Graph Embedding等等。

 ● 協助使用Tableau將資料視覺化並挖掘客戶相關需求以協助提案。

(2) 爬蟲開發與維護 

 ● 協助開發多個網站的爬蟲程式並維運如法源網、司法院判決書網站等等。

(3) 資料維運

 ● 維護與廠商合作資料並與計畫產出資料結合,並設計清洗與整合流程,協助廠商溝通異常資料問題。 

 ● 開發相關的自動化資料擷取與清洗程式。 

 ● 專案資料庫規劃與管理。

國立台北護理健康大學,研究助理,2015 年 07 月 - 2018 年 06 月

(1) 校務研究(IR)專案-績效雲平台之規劃與推動 (2015/07 - 2016/06) 

協助調研國內外相關案例:調研國內外關於校務績效視覺化之案例與工具。 

協助製作Tableau:協助製作Tableau相關教學文件。

(2) 科技研發投入與產出績效之視覺化分析-以遠距照護領域為例 (2016/09 - 2017/08) 

● 爬蟲製作與規劃:以python協助抓取計畫所需之政府計畫資料等。

● 資料清洗與資料庫規劃:以python撰寫資料清洗與存取程式、規劃各資料源的資料表。

● 演算法撰寫:協助以關聯規則產生各領域關鍵字的關聯分析。

(3) 植基於身份識別之社群媒體情感分析 - 以乳癌篩檢為例 (2017/09 - 2018/08) 

● 爬蟲製作與規劃:以python協助抓取計畫所需之社群媒體資料,如PTT、EYNY論壇等等。 

● 資料標記:以python撰寫輔助資料標記之程式。

● 資料清洗與資料庫規劃:以python撰寫資料清洗與存取程式、規劃各資料源的資料表。 

● 演算法撰寫:協助以SVM、樸素貝葉斯、集成學習等演算法來撰寫社群網路身分之分類器,準確度約70%。

學歷/在學成就

國立臺北護理健康大學,資訊管理所,碩士,2016 年 9 月 - 2018 年 6 月

畢業論文題目:以集成學習為基礎之猝睡症預測模型 

●猝睡症是嗜睡症的一種,臨床診斷上須透過睡眠多項檢驗、多段入睡測試等輔以其他多項工具進行診斷,而目前大多數與猝睡症有關之研究皆只採用部分或是特定的檢測工具進行分析,並無針對多種量測資料進行整合分析的研究,本研究主要探討對於需要多樣臨床測驗之疾病能否採用機械學習來整合並成為輔助醫生臨床診斷的工具。

●本研究與長庚醫院兒童心智科合作,共收集了約十種與猝睡症相關之量測、問卷資料,並以集成學習為基礎進行分類猝睡症I型與猝睡症II型的模型建構,在每一種不同的資料集皆進行了支援向量機、決策樹、類神經網路、最近鄰居法、樸素貝葉斯等五種分類器的訓練與參數調校,並以最佳的模型參數來訓練個別資料集的分類器,並以集成學習為基礎整合個別資料的分類器並建立混合模型。


在學期間曾擔任資訊科學概論、巨量資料分析研討課程之助教,協助架設課程所需之Hadoop Ecosystem與數據分析之教材設計與製作。

 在學期間亦協助同實驗室的大學部同學完成實務專題發表,擅長整合工作,目前協助完成之專題作品有以下幾件:

。國際疫情大數據分析 (資料視覺化應用) 

。幼兒疫苗接種之數據分析 (文字探勘應用)

。管管藥 (聊天機械人應用) 

電影推薦機械人 (聊天機械人應用) 

。健身顧問聊天機械人 (聊天機械人應用) 

。梅德森藥事助理 (聊天機械人應用) 

。寶可一家親 (聊天機械人應用)

國立臺北護理健康大學,資訊管理系,2012 年 9 月 - 2016 年 6 月

畢業專題題目:熱門議題分析系統

●因應網路社群媒體逐漸發達,網路社群的輿論分析逐漸取代傳統的問卷調查,因此才設計了本系統,系統架構主要是透過自動化的爬蟲系統每天收集新聞資料並存入hadoop與SQL裡面,並可依照使用者需求進行特定議題得輿情分析。


在學作品與參與專案

                                                                                                                                                                                                                                                         
Paragraph image 01 00@2x

熱門議題分析系統

使用PHP部署自動化爬蟲,並透過自動化的爬蟲系統每天收集新聞資料並存入hadoop與SQL裡面,並可依照使用者需求進行特定議題得輿情分析。

科技研發投入與產出績效之視覺化分析─以遠距照護領域為例

主要內容為收集政府的公開資料(學術計劃、專利、學術論文)並作各個對應的績效產出分析,並以視覺化之方式呈現,個人負責之部分為資料之收集與清洗,如自動化爬蟲程式收取碩博士論文之資料以及清洗智財局提供的專利資料等,還有部分分析如關聯規則的程式撰寫。

Paragraph image 00 00@2x
Paragraph image 01 00@2x

社群媒體之幼兒流感疫苗聲量分析

本研究主要探討家長對幼兒接種流感疫苗的意願情形,想透過社群網路家長們的意願與政府實際的施打率作研究。主要架構為收集網路社群媒體與流感疫苗相關之文章,並用文字探勘的技術分析網路上大家討論關於流感疫苗的趨勢,並提供文字雲、情感分析等等供使用者參考。

這是在研究所期間協助大學部同學完成的畢業專題,個人主要協作部分是爬蟲程式指導、文字探勘分析程式建構、網站系統建置等等。

國際疫情擴散視覺化系統

本研究之主要目的為透過政府即時公佈的開放資料加以分析,用視覺化的方式呈現,來警示使用者。主要架構收集航班資料與疾管署的各國法定傳染病通報,用以建立一個疾病擴散視覺化的系統。 

此作品也是於研究所期間協助完成之畢業專題,個人協作部分為爬蟲程式撰寫指導、系統架構設計、視覺化技術指導等等項目。

Paragraph image 00 00@2x
Paragraph image 01 00@2x

推電影—電影的推薦機器人

網路的便利造就資訊過載,也造就我們對社群軟體的依賴。為了讓使用者可以快速取得所要的資訊,利用電影網站抓取的相關資訊,經由整理後放入電影推薦系統中,透過即時通訊軟體所發展出的聊天機器人當作使用者介面,提供使用者快速且人性化的介面。

個人協助其中多樣部分,包含聊天機械人架構設計、語意邏輯設計、語意辨識設計等等。

藥物資訊聊天機器人─管管藥

透過聊天機器人讓使用者能快速了解手邊藥品資訊,且能定期推播用藥知識,提升用藥的衛教與增加知識獲得的管道,並改善忘記用藥情形。本研究主題針對「聊天機器人」領域、「用藥」領域之相關學位論文、「食品藥物管理署」、「社群討論」相關資訊為研究範圍,主因民眾錯誤的用藥知識、資訊取得管道的不足,而利用聊天機器人之特性來解決大眾普遍忙碌之餘能獲得用藥相關資訊。

此專題個人協助其中部分程式架構的設計,包含聊天機械人架構設計、語意邏輯設計、資料庫設計、解決方案提供等等。

Paragraph image 00 00@2x

工作參與專案

                                                                                                                                                                                                                                                         
Paragraph image 01 00@2x

推電影—電影的推薦機器人

網路的便利造就資訊過載,也造就我們對社群軟體的依賴。為了讓使用者可以快速取得所要的資訊,利用電影網站抓取的相關資訊,經由整理後放入電影推薦系統中,透過即時通訊軟體所發展出的聊天機器人當作使用者介面,提供使用者快速且人性化的介面。

個人協助其中多樣部分,包含聊天機械人架構設計、語意邏輯設計、語意辨識設計等等。

藥物資訊聊天機器人─管管藥

透過聊天機器人讓使用者能快速了解手邊藥品資訊,且能定期推播用藥知識,提升用藥的衛教與增加知識獲得的管道,並改善忘記用藥情形。本研究主題針對「聊天機器人」領域、「用藥」領域之相關學位論文、「食品藥物管理署」、「社群討論」相關資訊為研究範圍,主因民眾錯誤的用藥知識、資訊取得管道的不足,而利用聊天機器人之特性來解決大眾普遍忙碌之餘能獲得用藥相關資訊。

此專題個人協助其中部分程式架構的設計,包含聊天機械人架構設計、語意邏輯設計、資料庫設計、解決方案提供等等。

Paragraph image 00 00@2x

工作之餘的小興趣

                                                                                                                                                                                                                                                         
Paragraph image 01 00@2x

守宮娘雨玥的記事手帳-企劃

因興趣是飼養一些爬蟲類,於是結合了幾位有相同興趣的朋友,經營了一個守宮擬人化的粉專,在這團隊裡面我是擔任企劃的角色,負責粉專的日常社群經營與企劃構想,在這過程中得到了許多,例如如何與多位不同領域的人合作溝通、如何經營社群媒體等等寶貴經驗。

守宮網站資訊系統

因興趣是飼養一些爬蟲類,進而想用所學建構一個屬於自己的網站,用來分享相關知識及交流一些自己繁殖的個體,這是大學時期第一個從網站規劃到後台建置、資料庫設計、系統上線等皆為自己獨立研究完成的作品,對我而言別具意義。

Paragraph image 00 00@2x
Powered by CakeResumePowered by CakeResume