Edfgsmhrp4krocuwric3

劉律奇(Leo)

畢業於輔仁大學統計資訊學系,於台灣析數資訊股份有限公司實習5月,和其他純統計系的學生不同,除了機率、數理統計等課程,因學校教導關係我還具備Python、R、Java等程式撰寫之能力,同時也熟悉以下SAS、SPSS、Knime、JMP等統計軟體,曾於外系學習Hadoop、Spark等概念。在大學期間成功修畢大數據產業智慧學分學程,同時,在系上課程中獲得了所有課程模組,取得,財務金融模組、資料決策模組、市場行銷模組、品質決策模組、健康醫學模組證書。

城市,TW
E-mail:[email protected]


學歷

輔仁大學 統計資訊學系(學士畢業),2016 年 9 月 - 2020 年 6 月

於修業期間成功取得財務金融模組、資料決策模組、市場行銷模組、品質決策模組、健康醫學模組證書。

輔仁大學 大數據產業學分學程(修畢),2019年 9 月 - 2020 年 6 月

新莊高中 一般生(畢業),2013年 9 月 - 2016 年 7 月

技能


Python、R、Java、Hadoop、統計分析、機器學習、NLP分析、財務金融管理、資料決策管理、市場行銷、品質決策

工作經歷  台灣析數股份有限公司(數據實習生)

銀行金融商品分析,2016 年 5 月 - 至今

由基本屬性及交易紀錄的去識別化行為資料,希望結合群眾智慧,預測顧客在之後的30天與某銀行有哪些金融商品的往來,除了基本客戶資訊,還對時間做切割作為新的特徵,使用 XGB模型結合SHAP來對於模型進行視覺化,且篩選出模型對於金融商品的往來的重要特徵,正確率為99.91%、召回率為31%。

PPT輿論分析,2015 年 2 月 - 2016 年 5 月

利用爬蟲搜集PPT八卦版上的所有文章,針對文章做CKIP斷詞,利用斷詞結果製作詞向量,並且進行PCA和SVD降維以計算文章重要程度。針對不同的重要時間點進行分析,於總統大選期間,判斷出中國、八卦、國民黨……等詞彙。

API 模型部署,2014 年 1 月 - 2015 年 2 月

將模型訓練完成後,需要將模型部署,模型才有可能開始製造實際的商業利益。其中利用FLASK建立WEB API將模型串接至不同的工作環境。

大學專案

畢業專題_誰才是最後贏家—以資料探勘預測誰能吃雞

如何掌握遊戲中的致勝因子,一直是許多玩家所想了解的,甚至遊戲公司本身也需要知道這方面的資訊,以用於遊戲商品的體驗改進。因此本研究利用將Kaggle中的「絕地求生」資料集為為例,透過AWS所提供的EMR建立Hadoop以處理龐大的遊戲數據,利用各種機器學習在資料中建模,以預測勝利者,並在其中探索獲勝的關鍵因素。最終,利用關鍵因素成功提高測試玩家遊戲勝率5%。

金融大數據_某股票新聞稿分析

每日的新聞和股市中每個投資者息息相關,但新聞究竟是怎麼樣的影響股市,是經常被討論的重要課題。研究中利用Python爬取2020金元大新聞稿,並按照2020股價趨勢分類,將分類完畢的文章,分別利用CKIP斷詞,計算TF-IDF分離出重要詞彙後,進行PCA降維,作為新變數混入舊有羅吉斯迴歸模型,從原先預測股票正確率65%提升至73%。

資料探勘_機車使用者分析

利用政府開放資料集中調查的各個機車使用者資料配合,在使用python配合WEKA做出各種分析,首先,針對機車使用者做Hierarchical Clustering,對分群結果進行分析,對於各類使用者的評論做Jieba斷詞,並對於斷詞做出關聯分析篩選出最能代表各類使用者的字詞。

巨量資料概論_電影推薦系統

影音串流網站Netflix根據你看過的影集及電影給你專屬化推薦,讓你不必煩惱如何選片。研究利用MovieLens電影推薦服務的資料庫,模擬個人的專屬化推薦電影。利用AWS中的EC2服務一步步建立HADOOP並且配合SPARK來幫助我處理這些電影資料並使用CRAT建立模型,推薦適合的電影給予不同的使用者。

離散資料分析_應用羅吉斯迴歸於心臟病診斷預測預測

心血管疾病被列為全球十大死因之一,尤其「冠狀動脈心臟病」是最常見的疾病,由於許多症狀而導致冠狀動脈供血無法滿足心肌新陳代謝所需的血量而發生心肌缺血或梗塞的疾病,而在本研究中蒐集了303位急診室病患的資料,將最後的診斷結果作為目標變數,其他17個變量作為解釋變數,並互相比較結果。使用R作為資料分析的工具,分析各個變數之間的相關性分析、撰寫鄉變數之間的解釋,建立羅吉斯迴歸模型,正確率達模型正確率為87.7%。

時間序列分析_巨峰葡萄價格預測

台灣葡萄以內銷為主,銷售方式小包裝直銷消費者與直銷生鮮超市為主,若是能準確預測葡萄月平均價格,便能夠控制種植面積等成本。針對這項理由,研究使用2017~2019年的巨峰葡萄月均價格做為模擬資料,利用SAS建立時間序列模型MAIAR,以預測巨峰葡萄月平均價格,該時間序列模型Mape為12.33%。

課外生活的自我進修

崇德志工社

在大學一年級報告時,教授曾經說我口語上的表達需要加強,因此在大學一年級時,我加入了崇德志工這個大家庭中,一起和眾多的學長姊做志工。我認同崇德志工的理念,當我今天有能力能夠照顧好自己的同時,也可以伸出手去幫助那些需要的人,像是著名歌曲 one day MV 中所拍的,幫助別人最後會發現其實在幫助自己。我在加入崇德志工社後,擔任讀經班帶讀導師,一邊帶領小朋友做活動時一邊鍛鍊自己的口語表達能力。

教育部數位學伴計畫

在大學二年級時,為了繼續加強自己的口語能力,參加了輔仁大學的遠距教學計畫,在這個計畫中我被分配到了教育部的計畫底下。我每周需要準備教材給我的高中小學伴,我像學校的老師一樣有著進度壓力,我們可以很輕鬆的上課,透過這樣的機會我學習到和學生溝通的技巧。

新文林補習班

在三年時候我進入了新文林補習班擔任數理老師,課程之餘還要和家長溝通,銷售課程給其他家長。雖說職位只是老師,但學到的更多應對進退的觀念。我本身是一個積極、認真的人,從一開始的甚麼都不會,到成為資深的老師,在這裡我學習到和顧客的銷售技巧,並且培養耐心,我能夠獨立的帶好整間補習班,也讓我有很好的抗壓性。

大學課程安排

院系核心---培養基礎商學的基本能力,數學工具

微積分、統計學、經濟學、會計學、行銷管理、企業管理概論、資訊概論。

統計專業課程---培養機率統計背景的深厚基礎

數理統計學、統計推論、生物統計、醫學統計、線性代數、迴歸分析、無母數統計、多變量分析、實驗設計、時間序列分析、離散資料分析、抽樣調查、統計軟體應用。

資訊課程---建立與實務連接的資訊能力,有助於提高實際分析的效率

金融大數據、程式設計、進階程式設計、資料庫管理、巨量資料概論、資料採礦、管理資訊系統。

Powered by CakeResumePowered by CakeResume