莊予堯  Yu-Yao Chuang

畢業於中山醫學大學營養系,目前剛結業於資策會Data Engineer 資料分析師班,熟悉Python、ETL、Mysql,能使用Git作版本控制,並能架構大數據平台,如Hadoop、Spark、ELK。於大數據專題期間,利用python及Celery爬取狗種照片,建立狗種照片辨識模型,並透過Flask架設網站,提供客戶來幫他們找到遺失狗。希望能將專業知識與做事態度學以致⽤,未來職業能朝Data Engineer及Data analyst發展。

phone :  0934297067

email :    [email protected]

github  : https://github.com/tobias8069

專題簡報:  https://goo.gl/otfaiW

專題影片:  https://goo.gl/H4LyhT

Profile 04 00@2x eb0e2fdb6b9448002be791a92293d0e3ae2d393bce3bb23c2ba1a0e8661253ed

專業技能


程式能力及語言能力

程式: Python

作業系統: linux、docker、git

英文: Toeic 765分,能進行日常對話


資料分析能力

分析: 資料探勘、機械學習、深度學習


大數據平台架構能力

資料庫: Mysql、MongoDB、ELK

分散式運算: Spark、 AWS 

學歷

中壢資策會            Data Engineer 資料分析師班畢業                                       2017/10 - 2018/4 

製作專題<狗狗智慧搜尋>提供用戶3大功能,以文找文、以圖找圖、主動推薦文章,詳情上方連結專題簡報及影片共1:30
  • 以文找文: 利用狗狗論壇的文章評論,用機械學習分析出會員的興趣行為,用Elasticsearch當搜尋引擎,進而客製化推薦文章
  • 以圖找圖: 利用深度學習建立狗種辨識的模型,辨識狗種以做遺失狗查詢
  • 主動推薦文章: 利用協同過濾,分析狗狗論壇文章,主動推薦相似的文章    
  • 搭建Spark架構,加速網站遺失狗找尋功能的效率
  • AWS環境建置,建立EC2, VPC及Secret Group, 在雲端上線網頁

中山醫學大學         營養學系學士畢業                                                                    2012/9 - 2015/6

工作實習經歷

朴子醫院營養室 實習生,                                                                                        2014/7 - 2014/9

  • 與病⼈溝通進行⾝理評估,並與如護理師、醫師、照護員等進⾏門診合作,共同進⾏討論
  • 設計飲食問卷,分析住院病人飲食習慣,以改善供餐品質

課外經歷

微客國際海外志⼯-泰北滿樂福                                                           2013/2/1 - 2013/2/14

2013的寒假,為了增廣⾃⼰的國際視野,我參加了在泰國北部的國際志⼯,藉由與當地居民相處,學習與不同文化交流之能力,從中深化自身思考能力與人生觀
  • 規劃中文教程,對當地的⼩學⽣教中文及團康活動
  • 期間在戒毒村⽣活,與泰國、中國等地的戒毒弟兄交流經驗

中山醫學大學護理站志工                                                                           2012/9 - 2012/12

  • 協助來院病人方向引導,順利就醫
  • 協助護士幫病人測量血壓、院內輪椅借用及病房關懷

自我簡介

轉領域動機

我畢業於營養系,在醫院營養師實習過程中,接觸到大量各種病人的資料和飲食習慣,對於要如何運用這些大數據產生了興趣,可是在當時我並不會任何分析能力。為了讓我擁有處理大數據的能力,我前往資策會資料分析師班學習大數據技術。


資策會學習及應用Data Enginner能力      

資策會專題題目為狗狗智慧搜尋,透過狗狗論壇為資料來源,分析文章輿論,建置關於狗狗資訊的平台,並提供消費者三大功能,1.遺失狗照片辨識2.以關鍵字找文章3.主動推薦文章。 我負責的部分為遺失狗照片辨識及AWS及Spark環境搭建,主要負責內容為:

Web Crawler:  

使用Python、Beautifulsoup、selenium技術從Imagenet及Instagram爬取狗種圖片約5萬多張作為狗種辨識資料來源。

從全國推廣動物認領養平台,用Celery技術每天自動爬取遺失狗資料及照片,總共約5500筆資料,並把資料放進MongoDB。


ETL

從MongoDB取出rawData,用Python、Numpy、Pandas把大量遺失狗資料做清理、貼標,放進Mysql。


Sql及Nosql資料庫搭建:

建立Mysql及MongoDB作為raw data 的存取資料庫。

建立Elasticsearch,把分析過的資料放進去建立Index當作全文搜尋引擎。


資料分析及建模:

CNN,KNN,SVM等Machine Learning技術,建立可以辨識常見16種狗種的模型,並新建立少見品種的辨識,如台灣土狗,準確率80%。
搭建Spark平行化運算平台, 用KNN及Cosine Similarity找出與遺失狗最像的照片前5名供消費者辨識。

AWS 雲端網站搭建 :

 申請AWS帳號,搭建EC2、VPC,把在local端建立好的程式包裝成Docker,並部屬到AWS上建一個完整的網頁伺服器。


跨文化溝通及團隊合作能⼒:            

除了在資策會學習專業技術外,我在求學過程中,還有三件事情分別培養我具備團隊精神與互助合作能⼒外, 及學習到與⼈良性溝通以及分⼯明確的重要性。  

1.  學⽣時期: 我在2013年寒假時20位來⾃各⼤學的志⼯前往泰國北部作國際志⼯,與戒毒弟兄相處,並在晚上時前往當地⼩學陪伴⼩學⽣及教中文。  

2.  醫院實習: 在營養室實習,不僅跟營養師學習專業知識,還跟醫院各職業合作,如護⼠、醫⽣,業務等,並學到如何與病⼈良性溝通,得到病⼈的⽣理狀況。  

3.  資策會時期:  跟來⾃各不同領域的專業⼈⼠,共同進⾏專題,了解如何跟不同專業背景的⼈討論合作,並統整意⾒。