劉建笙 Morris Liu

Machine Learning Engineer     

  Taipei, Taiwan             [email protected]           0939355640

工作經歷

機器學習工程師  •  OneAD 果實夥伴 (AdTech)

2023/07 - Present  @ 台灣台北

於廣告科技公司的大數據部門負責機器學習開發、模型維護

  • 深入研究並開發混合型深度學習演算法,包括貝式算法混合DeepFM以及Causal Inference混合AFM等,並進行A/B Test,成功地提高了文字型廣告的停留時間達到30%增長,並且使點擊率提升達到20%,以滿足客戶的KPI要求。
  • 運用網路社群演算法,例如Louvain,重新設計用戶跨裝置辨識模型,實現跨裝置識別的準確性,以應對Cookieless環境,並實現更精準的廣告投放策略。
  • 進行Google Analytics的實證性研究,並建立客戶報表需求模型,重點關注廣告相關的KPI。同時,深入研究Google Analytics與我司廣告日誌(advertising log)之間的差異,以改進資料庫設計,以更好地滿足客戶的需求。
  • 建立和運營Google Cloud Platform相關平台,包括Dataproc和Compute Engine,同時改進團隊的Code Review流程,以實現專案自動化訓練並推送至Airflow。此外,我在團隊內創立了讀書會,建立了知識分享平台和資料庫,以促進知識共享和協作。

技能:SQL,Spark,Python,Google Cloud Platform,Git,ML Flow,Google Analytics,BigQuery,Linux

數據分析工程師  •  HelloFresh (德商跨國獨角獸公司)

2022/03 - 2023/01  @ 德國柏林

於行銷數據部門擔任全職實習生 (一週40小時)

  • 運用機器學習和時間序列算法,包括LSTM和Prophet,成功開發並部署了行銷轉化率模型。同時,應用數據探勘方法,如K-means和回歸分析,進行特徵工程。此項工作針對集團的18個市場建立模型,實現了廣告預算節省達10%。
  • 運用BigQuery處理海量數據,以優化廣告相關指標,包括CAC、CTR和CPM。同時,將處理後的數據輸出至資料庫,進行ETL,並建立Materialized View,以提供方便的報表提取和使用。
  • 與內部行銷團隊以及外部行銷夥伴(Google, Meta) 緊密合作,共同設計並執行A/B測試和地理測試,以優化行銷策略。成功為行銷團隊提供深入的網路行銷分析,使西歐市場的轉化率提高了10%。同時,運用Google Clean Room進行DV360、Youtube和Google Ads的成效分析,並提出最佳化方案,最終成功降低了廣告投放成本達10%,並減少了顧客重疊率15%。
  • 與產品分析部門緊密合作,共同開發了全新的顧客轉化旅程的Tableau儀表板,從零開始建立。這個儀表板協助行銷部門以KPI導向的方式深入了解集團內20多個國家不同網路行銷渠道的表現情況。此儀表板獲得行銷資深總監的好評。

技能:SQL,Python,Tableau,BigQuery,Spark,Airflow,Jira,Confluence,Google Suite,Git,GitHub

數據分析科學家  •  ZEW - Leibniz Centre for European Economic Research (歐洲經濟研究中心)

2021/08 - 2022/01  @ 德國曼海姆

於市場動態部門擔任數據科學實習生(一週20-25小時)

  • 運用OCR和文本探勘(Text Mining)技術,從中國政府社會信用數據的非結構化文本圖像中提取有價值的信息。解析的數據被轉換為可編輯的文件,實現了自動化程序的開發。該程式能有效地識別文件格式,無需手動干預即可提取文字。
  • 設計並實施網絡爬蟲程序,自動從10多個在線資源中獲取每日經濟和金融數據。之後,將這些數據經過預處理,以便研究團隊創建經濟模型。
  • 與經濟學家和IT團隊合作,進行特定數據分析請求,並在R&D市場動態方面提供多份報告,供研究使用。

技能:Python,Power BI,STATA,Excel

軟體工程師  • 神達電腦(漢達精密)

2018/07 - 2018/08  @ 中國江蘇昆山

於資訊創新開發中心擔任全職實習生 (一週40小時)

  • 通過定義高效的工作流程,簡化了基於Web的旅行申報系統的開發。通過訪問超過10名用戶進行全面的系統分析和設計。最終,流程被簡化,時間效率顯著提高了25%。
  • 開發基於網絡的會議安排系統的後端程式。利用C# .NET框架編寫系統代碼,並結合了微信API以提升功能性。
  • 維護數據庫,利用SQL和PL/SQL進行操作。積極監控和檢查數據管道,確保運營順暢並及時處理必要更改。

學歷

碩士  •  數據科學 | 商業電腦科學  •  Universität Mannheim 曼海姆大學

2020/09 - 2023/01  @ 德國曼海姆

  • 論文:運用新冠肺炎期間的破壞性時間序列進行後疫情時期的時間序列預測   
  • 研討論文:運用人工智慧方法解決供應鏈中需求不確定性的問題
  • 工作坊:與SAP合作的敏捷開發方法

交換學期  •  商業工程  •  Universität Bayreuth 拜羅伊特大學

2019/10 - 2020/03  @ 德國拜羅伊特

  • 於德國拜羅伊特大學交換一學期

學士  •  資訊管理學系 | 企業管理學系  •  Chung Yuan Christian University 中原大學

2015/09 - 2020/01  @ 台灣桃園

  • 畢業專案:運用CNN模型開發應用於服務業場域的臉部微笑偵測系統
  • 社團系學會會長、吉他社活動部

相關專案

推薦系統 - 基於Netflix Prize 資料的混合推薦系統 (Hybrid Recommendation System with BERT)    

  • 從多個資料源進行資料融合、配對以及資料探索。其中方法包含了在Java環境中運用MapForce進行XML資料處理。為了增加資料配對的準確性,運用了預先定義的框架去配對多個資料源,並計算其距離。
  • 創建了基於內容、協同過濾的基本模型。並且依照其演算法增建基於KNN with Means、SVD、NMF等演算法的模型。
  • 融入深度學習Deep Learning的BERT模型以增加推薦系統的相關度。

技能:推薦系統、深度學習、機器學習、KNN with Means、SVD

 文字探勘 Text Mining - 手機產品在網路論壇上的銷售分析

  • 使用了網路爬蟲技術,從10個線上論壇中獲得了10萬條以上的數據行,實現了數據ETL(提取、轉換、加載)處理和可視化,並應用了文本探勘技術,分析了顧客評論,以了解智能手機產業的競爭對手分析。
  • 使用相關性分析建立了數據挖掘模型,以了解智慧型手機和充電器之間的相關性;使用聚類分析分析了客戶分群;使用決策樹分析了客戶特徵;使用回歸分析進行銷售預測。

技能:文字探勘、機器學習、beautiful soup、NLTK、NLP

解決破壞性的時間序列的預測   

  • 運用Prophet, SARIMA, Holt-Winters以及SIR模型進行時間序列預測,並利用統計方法,如高斯函數,進行異常值處理
  • 研究最佳的特徵篩選方法,以使模型能適應遭破壞的時間序列。如使用隨機森林以及統計方法,如Chi-square以及Information Gain等,並進行實測。

技能:時間序列、scikit-learn、statsmodel、機器學習、prophet

技能

  • 數據分析與數據科學: Python, SQL(BigQuery), Tableau, Machine Learning (Clustering, Classification, Time Series Forecasting, Statistical Modelling), Git, GitHub
  • 程式:Python, SQL, C#, Java, HTML5, CSS