以成為資料科學家為目標的學習計畫

一個非本科系生,甚至非理工出生學生如我,若需要在研究所兩年的時間生產出資料科學領域相關論文並養成相關職能,必須目標明確、盡早決定題目並且及早準備好相關領域知識。

Profile 04 00@2x eb0e2fdb6b9448002be791a92293d0e3ae2d393bce3bb23c2ba1a0e8661253ed

Profile 03 00@2x 0f8539d7f013fd11030f4f7a7b97caf8c2dc5732bc61cba71764f3365c568794

為什麼念研究所?

我雖然是設計背景,但出社會後我發現自己非常喜歡數學和程式語言,也覺得設計這一行的路也愈來愈險峻。在擔任網站經理工作中開始喜歡上數據分析的領域,甚至上了機器學習的相關課程。但我漸漸發現自己不足,希望能在研究所重新把基礎打好,並且學習到做學問的能力。未來希望能夠轉業或在歐洲深造。

Profile 03 00@2x 0f8539d7f013fd11030f4f7a7b97caf8c2dc5732bc61cba71764f3365c568794

為什麼想進暨南國際大學資訊工程碩士班?

我原先念研究所的目標是機器人研究,但要成為機器人工程師,需要更多物理和數學基礎,非本科系的我在短時間恐怕無法跟上,考量自身能力跟興趣後,決定以資料科學為碩士主要領域,並以五年後能夠在機器人領域從事資料分析工具或機器人開發為目標。暨大資工所有資料科學的相關課程包含機器學習、資料探勘甚至AI金融交易這種應用層面的課程,也選修得到機器人和人機介面的相關課程,一面深耕知識,一面累積專業,較符合我的需求。

核心學習內容


數學技能

1.線性代數

許多資料科學家用矩陣在思考統計或機器學習模型,也會用矩陣去想實際的資料。


2.微積分

要了解資料分析模型,微積分是必備工具。


3.機率與統計

機率論是處理「隨機性」最有效的工具,幾乎所有的資料分析方法都是建立在機率論的理論框架。另外,滿多統計方法跟架構被高度應用,如迴歸分析。


數據分析技能

1.機器學習

強調的是建置一個完整的體系或演算機制來幫助電腦或系統自我學習,進而達到預測效果不斷提升的過程。


2.資料探勘

強調的找到一個最合適的方法或演算機制,產生出最符合目標的預測以及解讀我們為什麼要運用這些方法。


3.統計分析

強調解釋這些資料或是驗證預期的假設是否屬實,偏向於產生模型以勾勒並形容資料的過程。


程式語言及工具

1.Python

函式庫豐富,常用來處理資料採礦和機器學習,廣泛並具相當彈性。


2.R語言

可以從複雜的資料集中篩選需要的資料,從複雜的模型函數中操作資料,方便資料視覺化的工作。


3.Hadoop

具有處理海量資料的優勢,能解決檔案存放、系統擴張、資料處理及備份等問題,被廣泛應用於大數據儲存和大數據分析,成為大數據的主流技術。

學習概況與策略

Paragraph image 01 00@2x 1a3881c875a7a1fb1e859435ef9363b5ddf36f4e73d1ad63a1a0af69f2a9f745

程式語言

我主要學習程式語言的管道是Codecademy,目前完整學完的課程是PHP,和Git。而先前為了準備考試,我自習了演算法與資料結構。接下來我將優先學習Python及及網路爬蟲實作。

Paragraph image 01 00@2x 1a3881c875a7a1fb1e859435ef9363b5ddf36f4e73d1ad63a1a0af69f2a9f745

數學

先前在準備研究所考試則已經研讀過線性代數及離散數學。

我將在今年優先在Khanacademy平台上學完機率與統計,在入學前學完微積分並加強線性代數。並有相關產出如短文、短片,和筆記,增進數理的基礎內功。

Paragraph image 01 00@2x 1a3881c875a7a1fb1e859435ef9363b5ddf36f4e73d1ad63a1a0af69f2a9f745

數據分析

在數據分析的領域,我會的是Google的分析工具,包含Analytics,以及可以管理代碼的Tag manager和新發表的視覺化工具data studio。我在發表台中市志工媒合平台的相關數據分析時,都是使用data studio(如左圖)。接下來我將學習如何使用python做數據清理及機器學習等進階技能。

克服非本科系弱點的學習/勞動方法


深度工作Deep work

「深度工作力」Cal Newport所提出的概念,指專注於高認知需求任務而不分心的能力。在深度工作的模式下,腦神經傳導效率將會增快,能幫助專業的提升。在我的規劃中,我在第一年將主要專注學習,盡量修課,及大量閱讀。第二年則專注於論文,並磨練寫作能力。


一個人的Scrum

Scrum這個敏捷開發方法,一般而言需要至少有4-6人才可以執行。資深工程師Alex Andrews提出了Scrum Of One的概念,並身體力行,這也是我平常工作的方法。我將遵循其三大精神進行研究所的學業:1.遞交成果給他人;2.量化成果;3.自我反饋與修正。


費曼學習法

《精準學習》一書裡,作者特別推廣以教為學的概念,也就是費曼學習法。要教別人前,知識必須在腦中經歷input及output的過程。在這個概念下,我會以寫文章或做短片的方式整理我所學習過的概念,加深大腦裡知識的印象與鏈結。

Paragraph image 06 00@2x 87e77cbcc732097bbd3c1ea0cc62ddde26e5adb1eceee8497e66e58206763cfd
Paragraph image 06 01@2x 13ec779ca27733557a5d2830d84049bfdfc54edd6ade36ee5766eea97298cf4a
Paragraph image 06 02@2x 3081b368fb6b38d988063c1300041f0c2b0cb92aae2fac6f55abc21c8e235124

Paragraph image 01 00@2x 1a3881c875a7a1fb1e859435ef9363b5ddf36f4e73d1ad63a1a0af69f2a9f745

每季規劃

以兩年為修業年限,在入學前、寒暑假及就學的四個學期,

進行初步的修課及論文研究進度規劃。若有延遲,預計仍在2020年離開學校。

第一季,2017 年 11 月 - 2018 年 2 月(寒假)

上課:微積分、機率與統計、微分方程、多變量微積分(Khanacademy);

自修:線性代數(book: Linear Algebra Done Right)

程式語言:Python 3 、嘗試實作一個專案

Experiences 00 00@2x 504900dc09d82f711fdb54cf5763251cab5193a844856da978b2b8f3907ecd5a

第二季,2018 年 3 月 - 2018 年 5 月(第一學期)

論文研究: 認識研究主題、學習文獻回顧、 透過主題文獻回顧掌握各研究子題的關聯 

(若實驗室已給定主題,則以該主題為主)

修課:必修及兩門選修

Experiences 00 01@2x 6daa47d1df70d315f129dcecdd562003831581c4cdd8f9c819aa22d4a24ae150

第三季,2018 年 6 月 - 2018 年 8 月(暑假)

論文研究: 尋找在論文中創新與突破的機會、決定論文題目與研究範圍、

自修:線性代數(book: Linear Algebra Done wrong)

Experiences 00 02@2x d08cb731546334ac3e784c5845e368719bba256a127be86e720a634d798b8bb9

第四季,2018 年 9 月 - 2018 年 11 月(第二學期)

論文研究: 文獻回顧與各流派分析、彙整批判的原則與相對優缺點

修課:必修及兩門選修

Experiences 00 03@2x b381b81be12ffb5207e31257bd24e9606aef09c63c7e710fcd513da5ffd4e913

第五季,2018 年 12 月 - 2019 年 2 月(寒假)

論文研究:發展創新的策略與研究構想、規劃研究架構與程序、產出研究計畫書

Experiences 00 03@2x b381b81be12ffb5207e31257bd24e9606aef09c63c7e710fcd513da5ffd4e913

第六季,2019 年 3 月 - 2019 年 5 月(第三學期)

論文研究:完成理論發展、蒐集相關證據、調整假說(顧及知識的系統性、客觀性、嚴謹性)

修課:三門選修

Experiences 00 03@2x b381b81be12ffb5207e31257bd24e9606aef09c63c7e710fcd513da5ffd4e913

第七季,2019 年 6 月 - 2019 年 8 月(暑假)

論文研究:評估研究成果、設計示範案例、論文開始撰寫

職涯:留意申請歐洲的Internal PhD事宜

Experiences 00 03@2x b381b81be12ffb5207e31257bd24e9606aef09c63c7e710fcd513da5ffd4e913

第八季,2019 年 9 月 - 2019 年 11 月(第四學期)

論文研究:一門選修,論文口試、修改論文草稿、完稿
修課:一門選修

職涯:提出PhD申請或求職

Experiences 00 03@2x b381b81be12ffb5207e31257bd24e9606aef09c63c7e710fcd513da5ffd4e913