資料科學家要有哪些技能?精選 11 門資料科學自學資源、求職管道

資料科學是近年來最夯的工作之一,尤其金融、科技產業更積極找尋資料科學、數據分析的相關人才,《哈佛商業評論》更稱資料科學家是「21 世紀最性感的工作」,年薪還至少上看百萬!

如果想踏進資料科學的領域,要具備哪些技能,該從哪些自學資源下手?想成為資料科學家又該去哪裡找工作呢?接下來就分別以資料科學的「自學資源:線上課程」、「自學資源:推薦書單」和「求職管道」三大重點介紹,讓你把資料科學的技能樹點好點滿!

資料科學自學資源 1:線上課程

1. Introduction to Data Science

講師:Data Hawk Tech 資料科學諮詢公司

平台:Udemy

費用:約台幣 370 元(根據平台優惠活動價格可能不一)

課程時長:3 小時

如同課程標題敘述的,這是一堂資料科學的「入門」課程,所以會全面、概要性地講述,也簡單涵蓋了 Python 和 R ,但不會非常深入。因此推薦給想試試水溫、了解資料科學可以應用在哪些領域、總共包含哪些範疇的人。

2. Data Science A-Z:Real-Life Data Science Exercises Included

講師:Kirill Eremenko

平台:Udemy

費用:約台幣 370 元(根據平台優惠活動價格可能不一)

課程時長:21 小時

這門課涵蓋了資料科學的各個項目,課程中也會提供實際的例子幫助學生理解,總體的課程評分非常高,有 4.6/5 顆星。

不過要注意的是,這門課等於是從 0 到 1 、手把手地帶你認識資料科學的世界,考慮到上課學生的 coding 能力可能不太一致,這門課並沒有使用 Python 或 R,而是用了 gretl、Tableau、Excel 等工具,避免學生在學習資料科學時陷入不會程式的困境。這堂課最主要的目的,還是著重在幫助學生建立資料科學的架構。

3. Data Science and Machine Learning Bootcamp with R

講師:Jose Portilla

平台:Udemy

費用:約台幣 370 元(根據平台優惠活動價格可能不一)

課程時長: 18 小時

這堂是以 R 為主要語言的資料科學課程,將會涵括資料科學、機器學習和資料視覺化,可以同時當作學習 R 和資料科學的入門。

4. CS109 Data Science

講師:Pavlos Protopapas, Kevin Rader, Mark Glickman, Chris Tanner, Joe Blitzstein, Hanspeter Pfister, Verena Kaynig-Fittkau

平台:哈佛大學

費用:免費

課程時長:約 12 週

這是哈佛大學的公開課程,完全免費,而且所有影片都是在哈佛大學的課堂上實錄的;是一門以 Python 為主的資料科學課程,每個科目都很深入、紮實,大約需要 12 週的時間學習。

如果你對使用 Python 處理資料科學有興趣,希望完整地學習,而且時間上也有餘裕的話,可以考慮這堂課去打好資料科學的基礎。

5. Introduction to Data Analytics for Business

講師:University of Colorado Boulder

平台:Coursera

費用:免費試聽、高階內容需付費

課程時長:約 11 小時

這堂課偏重 SQL,以資料科學的實際業務應用為主,比較少視覺化的內容;如果你想精進資料科學領域中的資料庫模式建立、資料存取控制,就可以參考這門課程。 

6. Data Science Essentials

講師:Microsoft

平台:edX

費用:免費(完課證書需額外支付 99 美元)

課程時長:18-24 小時(每週 3-4 小時,共 6 周)

這堂資料科學課程是基於 R 、Python 和 Azure ML 等工具,介紹資料處理流程、資料視覺化以及入門的機器學習,全面涵蓋了資料科學可能會碰到的所有面向,而且都會談到一定的深度。

除了我們介紹的這些海外線上資源之外,台灣也有許多資料科學的中文資源可以學習,例如線上課程平台 Hahow ,就有提供豐富的資料科學課程,有興趣可以自行搜尋參考,選擇適合自己的課程學習。

資料科學自學資源 2:推薦書單

1. Data Science from Scratch 中文版:用 Python 學資料科學

這本書是由一位 Google 的軟體工程師所撰寫,介紹用 Python 進行資料開發的主流工具庫,包括 IPython, Pandas, Scikit-Learn 等等。想透過這本書學習資料科學的話,需要具備一些程式設計的基礎,會探討如何處理各種數據資料,以及靈活運用貝氏、決策術、神經網路等等模型,也會幫助建立資料庫的相關知識。

2. 高效率資料分析:使用 Python

這本書適合想要用 Python 做資料分析的初學者,就算沒有程式經驗,也可以跟著書中的教學一步步上手,讓你學會用 Python 自動處理與分析各種格式的資料,還有透過 Python 模組去分組資料、產生統計結果等等。

3. Probability for the enthusiastic beginner

如果想從零開始認識統計,這一本書會是很好的入門,它包含了所有的統計基礎內容,像是貝葉斯定理、期望值、偏差、機率分佈及回歸分析等等,循序漸進跟著書中學習,會獲得非常紮實的統計背景知識,對於理解資料科學有頗實際的幫助。

4. Think Stats 

中文版:《統計思維:程序員數學之概率統計》

講解概率統計的入門書,作者會說明如何用程式來理解統計學,透過案例研究,介紹數據分析的流程——收集數據、生成統計、發現模式、驗證假設等等。強調實際應用的技巧,很適合有程式基礎的人進行跨界學習。

5. Think Bayes

中文版:《貝葉斯思維:統計建模的 Python 學習法》

大部分與貝葉斯統計有關的書,都是以數學為主要脈絡;而這本書特別的地方就在於,是用 Python 來入門介紹,適合有一點程式和統計基礎的人。

和上一本書的作者相同,一樣從現實生活中會遇到的問題下手,協助讀者建立建模決策的方法論、替具體問題建立數學模型,再一步步優化或驗證模型,當中運用到的邏輯思維也和資料科學家的工作重疊,可以學到紮實的方法論。

求職管道:有了資料科學的技能,又該如何找到資料科學家的工作呢?

1. 新創媒合平台

想成為資料科學家要去哪裡找工作呢?由於資料科學是近幾年新興的工作職缺,所以建議從新創媒合平台去搜尋資料科學的職缺;如果已經有鎖定特定產業的資料科學家,也可以直接在目標企業的官網求職區投遞履歷,順便觀察公司的網路形象,以及對職位、候選人的細節描述和能力要求。

另外想提醒的是,透過這些新型態的求職管道應徵,就盡量不要使用傳統人力銀行的制式履歷,而是針對各家公司的需求撰寫,客製化傳達自己在資料科學、數據分析能力的履歷,才有較高的機率獲得面試機會。

對資料科學、數據分析的工作有興趣嗎?點這裡看更多職缺

2. 獵人頭公司

如果你是在業界工作 3、5 年的資料科學家,有一定的資歷和戰績實力,也累積了一些作品和人脈,這時候獵頭通常會主動找來。產業界前幾名的企業 HR 通常都和獵頭公司有交流,當企業在徵求資深或高階人選時,也經常會透過獵頭公司搜尋。所以如果你還是年輕的資料科學家,透過專案累積實力、參與交流聚會拓展人脈,都是可以經營的求職方向。

3. 網路社群

對大企業來說,如果要從網路社群搜尋人才,十之八九會透過 LinkedIn ,特別是有海外人才需求的企業、科技新創企業等,所以平時別忘了經營自己的 LinkedIn 帳號,如果有一些產業界的大神替你的資料科學技能背書,對 HR 來說是十分有可信度的。

另外,參加聚會、社團,也一定會接收到許多職缺的資訊,像是台灣就有 Data Science 資料科學Data Science Meetup 台灣資料科學社群等臉書社團,加入後除了技術交流分享,還可以經常獲得許多資訊、培養人脈,不論是新手資料科學家,想要慢慢培養經驗,或者是有資歷的資料科學高手,想開拓眼界、認識更多神人,都很適合透過網路社群達到效果。

希望大家都能透過這些資源,找到最適合自己的學習和求職管道,成功朝資料科學家的路上邁進!

延伸閱讀

資料科學夯什麼?一窺 Mastercard 分析顧問、新創 Migo Data Lead 到哈佛 PhD 的精彩職涯!(上)

資料科學夯什麼?一窺 Mastercard 分析顧問、新創 Migo Data Lead 到哈佛 PhD 的精彩職涯!(下)

想成為 Data Scientist?日本樂天資料科學家 Marcus 的 Amazon 經驗與跨領域歷程

Resume Builder

Build your resume only in minutes!

More Articles you might be interested in

Latest relevant articles
Interview Skills
3월 11일 2024

【自介範例】吸引人的面試自我介紹怎麼說?4 技巧完美活用自我介紹

面試時的自我介紹要說什麼?怎樣的自我介紹才夠吸引人?自我介紹該包含哪些內容?有沒有成功的面試自我介紹範例或範文模板可以參考呢? CakeResume 統整了面試時自我介紹的 3 步驟、4 技巧與適合 6 類型求職者的自我介紹範例,一起輕鬆完成吸引人的自我介紹內容吧!