梁貿淞  Song Liang

目前任職於台灣之星大數據科學家,負責單門號抬價續約推薦模型電信代收信用模型。平時透過訪談釐清需求,Python分析數據及建模、Tableau資料視覺化、SQL處理資料及自動化流程;能獨立完成資料探勘分析、機器學習模型開發,專案的自動化開發


我畢業自國立中央大學數學系,修習統計資料科學質化分析等課程,喜歡理解抽象問題思考數據脈絡;善於定義問題,樂於溝通交流平時透過網路精進機器學習、深度學習、NLP等技能,自許成為兼具縝密邏輯豐富創造力資料科學人才

Email:[email protected]

技能


程式語言

- Python

- SQL

- R


資料庫

- MSSQL

- MariaDB

- DBeaver


套件

- Pandas、Numpy

- Scikit-learn

- Matplotlib、Seaborn

- TensorFlow、Keras


其他

- ETL Tool│Trinity 

- 視覺化Tool│Tableau

相關經歷

大數據科學家│ 台灣之星 (2021.10 ~ )

單門號抬價續約推薦模型
- 獨立完成規劃與開發,包含釐清需求、資料探勘、模型開發及自動化,進行多部門的溝通及交流
- 由資料蒐集、特徵處理、視覺化,到模型開發、參數調整,處理不平衡資料,上線自動化流程開發;最終成交率提高4倍,並取代需求單位的既有機制。(Python、MSSQL、Trinity)
- 每月成效追蹤採取自動化報表產出,並搭配視覺化工具以利呈現成效。(Tableau、Trinity、Python)

例行排程維運、資料探勘
- 電信代收信用模型,包含信用風險模型、最適額度模型。(Python、MSSQL、Trinity)

政府網站統計分析師│ 清華大學創新與分析研究中心 (2021.05 ~ 2021.09)

全國中小學教職員及學生資源網
團隊為建置全國中小學使用的行政流程電子化系統,包含教職員人力資源系統、中小學學生資源系統。

我負責處理教育部需求報表及資源系統報表開發(30份),優化既有報表運算速度(15~20%),自動化處理例行性填報任務,發掘資源系統報表錯誤及修正(5份)。能獨立完成需求分析,與user討論需求、定義問題。

個人專案│機器學習、深度學習、資料分析

影像降維度分析
大學時獨立跟老師研究數理統計專題。以R進行隨機模擬實驗,將2筆高維度且不成對的資料,由基底向量投影,降低維度保持資料的最大變異;套用ARIMA中的AR(1)模型,以log-likelihood test進行分析,比較組間獨立、組間關聯、組內關聯不同的情況。 

統計資料分析及數據建模 
以NLSY79資料庫,透過推論統計、檢定方法、EDA,分析教育程度跟收入的影響,得到性別及教育水平、智力測驗成績的關聯性。(50人課堂最高分)

深度學習圖像辨識
以深度學習RNN中的LSTM演算法,分析圖片分類問題(Cifar10),嘗試多種結構提升正確率。結果發現以正規化處理資料,能有效降低資料的複雜度且提升準確度。(PCA、Conv2D+MaxPooling、 Normalization)