資料科學是近年來最夯的工作之一,尤其金融、科技產業更積極找尋資料科學、數據分析相關人才,《哈佛商業評論》更稱資料科學家是「21 世紀最性感的工作」,年薪還至少上看百萬!

如果想踏進資料科學的領域,要從哪些自學資源下手?又該去哪裡找資料科學家的工作?接下來就分別以「自學資源:線上課程」、「自學資源:推薦書單」和「求職管道」三大重點介紹,或許可以讓你在成為資料科學家的路上有一些指引。

資料科學自學資源 1:線上課程

1. Introduction to Data Science

講師:Data Hawk Tech 資料科學諮詢公司

平台:Udemy

費用:約台幣 370 元(根據平台優惠活動價格可能不一)

課程時長:3 小時

如同課程標題敘述的,這是一堂資料科學的「入門」課程,所以會全面、概要性地講述,也簡單涵蓋了 Python 和 R ,但不會非常深入。因此推薦給想試試水溫、了解資料科學可以應用在哪些領域、總共包含哪些範疇的人。

2. Data Science A-Z:Real-Life Data Science Exercises Included

講師:Kirill Eremenko

平台:Udemy

費用:約台幣 370 元(根據平台優惠活動價格可能不一)

課程時長:21 小時

這門課涵蓋了資料科學的各個項目,課程中也會提供實際的例子幫助學生理解,總體的課程評分非常高,有 4.6/5 顆星。

不過要注意的是,這門課等於是從 0 到 1 、手把手地帶你認識資料科學的世界,考慮到上課學生的 coding 能力可能不太一致,這門課並沒有使用 Python 或 R,而是用了 gretl、Tableau、Excel 等工具,避免學生陷入不會程式的困境。這堂課最主要的目的,還是著重在幫助學生建立資料科學的架構。

3. Data Science and Machine Learning Bootcamp with R

講師:Jose Portilla

平台:Udemy

費用:約台幣 370 元(根據平台優惠活動價格可能不一)

課程時長: 18 小時

以 R 為主要語言的課程,將會涵括資料科學、機器學習和資料視覺化,可以同時當作學習 R 和資料科學的入門。

4. CS109 Data Science

講師:Pavlos Protopapas, Kevin Rader, Mark Glickman, Chris Tanner, Joe Blitzstein, Hanspeter Pfister, Verena Kaynig-Fittkau

平台:哈佛大學

費用:免費

課程時長:約 12 週

這堂是哈佛大學的公開課程,完全免費,而且所有影片都是在哈佛大學的課堂上實錄的;以Python 為主的資料科學課程,每個科目都很深入、紮實,大約需要 12 週的時間學習。

如果你對用 Python 處理資料科學有興趣,希望完整的深入學習,而且時間上也有餘裕的話,就可以考慮這堂課。

5. Introduction to Data Analytics for Business

講師:University of Colorado Boulder

平台:Coursera

費用:免費試聽、高階內容需付費

課程時長:約 11 小時

這堂課偏重 SQL,以實際業務應用為主,比較少視覺化的內容;想精進資料庫模式的建立、資料存取控制,可以參考這門課程。 

6. Data Science Essentials

講師:Microsoft

平台:edX

費用:免費(完課證書需額外支付 99 美元)

課程時長:18-24 小時(每週 3-4 小時,共 6 周)

這堂課是基於 R 、Python 和 Azure ML 等工具,介紹資料處理流程、資料視覺化及入門的機器學習,全面涵蓋了資料科學可能會碰到的所有面向,而且都會談到一定的深度。

除了上述海外的線上資源,台灣也有許多資料科學的中文資源可以學習,例如線上課程平台 Hahow ,就有提供豐富的資料科學課程,有興趣可以自行搜尋參考,選擇適合自己的課程學習。

資料科學自學資源 2:推薦書單

1. Data Science from Scratch 中文版:用 Python 學資料科學

這本書是由一位 Google 的軟體工程師所撰寫,介紹用 Python 進行資料開發的主流工具庫,包括 IPython, Pandas, Scikit-Learn 等等。需要具備一些程式設計的基礎,會探討如何處理各種數據資料,以及靈活運用貝氏、決策術、神經網路等等模型,也會幫助建立資料庫的相關知識。

2. 高效率資料分析:使用Python

這本書適合想要用 Python 做資料分析的初學者,就算沒有程式經驗,也可以跟著書中的教學一步步上手,讓你學會用 Python 自動處理與分析各種格式的資料,還有透過 Python 模組去分組資料、產生統計結果等等。

3. Probability for the enthusiastic beginner

如果想從零開始認識統計,這一本書會是很好的入門,包含所有的統計基礎內容,像是貝葉斯定理、期望值、偏差、機率分佈及回歸分析等等,循序漸進跟著書中學習,會獲得非常紮實的統計背景知識。

4. Think Stats 

中文版:《統計思維:程序員數學之概率統計》

講解概率統計的入門書,作者會說明如何用程式來理解統計學,透過案例研究,介紹數據分析的流程——收集數據、生成統計、發現模式、驗證假設等等。強調實際應用的技巧,很適合有程式基礎的人進行跨界學習。

5. Think Bayes

中文版:《貝葉斯思維:統計建模的 Python 學習法》

大部分與貝葉斯統計有關的書,都是以數學為主要脈絡;而這本書特別的地方就在於,是用Python 來入門介紹,適合有一點程式和統計基礎的人。

和上一本書的作者相同,一樣從現實生活中會遇到的問題下手,協助讀者建立建模決策的方法論、替具體問題建立數學模型,再一步步優化或驗證模型。

求職管道:學會了技術,又該如何找到資料科學工作?

1. 新創媒合平台

由於資料科學算是近幾年新興的工作職缺,所以建議從新創媒合平台去搜尋職缺;如果已經有鎖定特定產業的數據科學家,也可以直接在目標企業的官網求職區投遞履歷,順便觀察公司的網路形象,以及對職位、候選人的細節描述和能力要求。

另外想提醒的是,透過這些新型態的求職管道應徵,就盡量不要使用除桶人力銀行的制式履歷,而是針對各家公司的需求撰寫,客製化能傳達自己能力的履歷,才有較高的機率獲得面試機會。

對資料科學、數據分析的工作有興趣嗎?點這裡看更多職缺

2. 獵人頭公司

如果你已經在業界工作 3、5 年,有一定的資歷和戰績實力,也累積了一些作品和人脈,這時候獵頭通常會主動找來。產業界前幾名的企業 HR 通常都和獵頭公司有交流,當企業在徵求資深或高階人選時,也經常會透過獵頭公司搜尋。所以如果你還是年輕的資料科學家,透過專案累積實力、參與交流聚會拓展人脈,都是可以努力的方向。

3. 網路社群

對大企業來說,如果要從網路社群搜尋人才,十之八九會透過 LinkedIn ,特別是有海外人才需求的企業、科技、新創企業等,所以平時別忘了經營自己的 LinkedIn 帳號,如果有一些產業界的大神幫你背書,對 HR 來說是十分有可信度的。

另外,參加聚會、社團,也一定會接收到許多職缺的資訊,像是台灣就有 Data Science 資料科學Data Science Meetup 台灣資料科學社群等臉書社團,加入後除了技術交流分享,還可以經常獲得許多資訊、培養人脈,不論是新人資料科學家,想要慢慢培養經驗,或者是有資歷的資料科學高手,想開拓眼界、認識更多神人,都很適合透過網路社群達到效果。

希望大家都能透過這些資源,找到最適合自己的學習和求職管道,成功朝資料科學家的路上邁進!

延伸閱讀

資料科學夯什麼?一窺 Mastercard 分析顧問、新創 Migo Data Lead 到哈佛 PhD 的精彩職涯!(上)

資料科學夯什麼?一窺 Mastercard 分析顧問、新創 Migo Data Lead 到哈佛 PhD 的精彩職涯!(下)