鍾育修

目前任職於台灣大哥大資料分析技術處,主要負責CEM系統建置與維運。在目前職位中,除了使用Hadoop以及Spark進行資料ETL,並且有應用Tableau進行資料視覺化

Data Engineer相關
Taipei,TW
[email protected]

0911-577-406

Profile 06 00@2x 1eefad8fbe6a673df05fbf5e2852a74aa9d79ca70552a626532fa30bd71725f3

技能


Python

使用過numpy、pandas以及scikit-learn進行資料處理、機器學習,以及使用selenium、BeautifulSoup進行網路爬蟲。


Shell Script

使用shell script在server上建立

排程,並搭配排程工具如oozie、jenkis進行自動化排程


Java

使用過Java編寫資料處理流程,針對大量資料(兩千多萬筆以上)驗證資料處理邏輯是否正確

Tableau

管理及維護Tableau報表系統,也有使用公開資料製作一些圖表,例如高速公路流量統計圖表


Hadoop

有架設hadoop以及開發相關經歷,有用過Impala及Spark開發資料處理流程


經歷

台灣大哥大-資料分析技術處,2016 年 6月 - 至今

在台灣大哥大的CEM團隊,主要負責了以下的工作:

  • 針對資料處理邏輯進行驗證
  • 對應用程式進行測試
  • 利用公司內部資料,進行不同需求的模組開發

配天自動控制,2013 年 9 月 - 2015 年 12 月

配天自動控制是工業電控的工作室,在這邊主要是負責以下的工作:
  • 電路圖規劃
  • PLC程式撰寫
  • 工業配線


Garmin-SQA,2012 年 7 月 - 2013 年 9 月

在Garmin的SQA團隊中,有經手過幾種不同的產品線。

  • 針對產品spec,建立test case
  • 安排測試,並回報測試結果
  • 針對已上市產品VOC進行驗證並回報

新竹市政府交通處,2011 年 12 月 - 2012 年 6月

在新竹市政府主要是從事交通相關業務:

  • 都市計畫審議
  • 道路設計規劃

我的簡歷

        我是鍾育修,大學就讀於國立交通大學運輸科技與管理學系。大學畢業退伍之後第一份工作是在新竹市政府交通處擔任交通計畫評估人員。因為跟大學主修相關,所以這份工作在一個月內就上手並可以獨立作業,這份工作讓我學習如何改善自己與人的應對進退。因為是短期職務代理,七個月後我進入了人生職場學校的第二間公司-Garmin。
  

        來到Garmin從事的是SQA(軟體測試)相關工作,一開始在進Garmin時對程式沒有太多了解,但是在跟其他部門的RD合作之後,也慢慢的開始接觸並了解一些程式設計上的名詞,進而慢慢產生興趣開始自己上網去學習簡單的程式設計,例如註冊Coursera以及codecademy的課程,一堂堂的課程跟作業讓我對程式不再感覺抗拒或無趣。
  

        2013年9月是我的職場生涯的一次重大轉折:哥哥在三月的時候接下了爸爸朋友的自動控制工作室,而我在考慮過後也決定加入他的團隊。在傳統機械產業的兩年多中,因為看到很多廠商對資訊的潛在價值並沒有太多的了解,這讓我開始思考如何將這些資料取出並從中發揮潛在的價值,在查了很多資料之後,我決定來參加資策會的巨量資料分析就業養成班。
  

        為了能更快跟上進度,在參加資策會之前我先在Coursera上了一些html、css、javascript的課程,而這也順利幫助我更快的進入我的學習軌道。JAVA課程讓我對程式的應用有更多的可能性:在上完課之後我試著用JAVA搭配SQLite寫出了一個可以自動下載台北市政府公開資料內有關市區各路段路況的爬蟲程式。Linux還有hadoop ecosystem系統是課程中另一個重點,除了課程中hadoop系統專題,我也額外利用周末的時間以raspberry pi為基礎架設了一個自己的hadoop系統,並用來處理一些從網路上取得的公開資料。期末的專題我選擇的主題是中華職棒的一些進階數據計算,在這個主題中,我主要負責的部分是一開始的資料清理,還有從文字紀錄檔中計算守備局數。在專題中讓我深刻的了解到在分析之前,除了資料清理的重要性之外,良好的資料基礎建設也是相當重要的,在後續分析上可以減少很多不必要的負擔。
 

          在資策會課程結訓之後,我加入了台灣大哥大的CEM專案團隊。這是一個新的專案,主要是蒐集用戶的電信資料加以分析後協助公司內部單位使用。在專案的過程中,除了針對廠商開發的程式進行功能以及資料驗證之外,我也依據系統收容的資料進行了一些額外的開發,例如收集參數建立模型進行活動名單預測,以及規畫並建立LBS簡訊推播模組。在台灣大哥大的這段時間,除了工作需要之外,我也花了很多時間學習新的技能:像是為了分析系統產生的log,在找了一些資料之後,我也開始嘗試用ELK(Elasticsearch、Logstash、Kibana)分析log並將資料視覺化。此外,我也開始試著從Udemy等線上學習資源去尋找有關深度學習相關的課程,以及參加社群上的機器學習社團,讓自己除了工作之外,在社群上也可以多認識一些同好並增加自己的技能及人脈。

Powered by CakeResumePowered by CakeResume
Powered by CakeResumePowered by CakeResume