蘇敬閎 (Arvis Su)

[email protected]

0953-302-806

大猩猩科技 - AI Software Engineer

Gorilla Technology AI Software Engineer

  • 5年以上資料分析建模經驗 
  • 5年 Python 軟體開發經驗 
  • 熟悉程式語言:Python, Spark, NoSQL and SQL 
  • 大猩猩科技 Gorilla Technology : AI Software Engineer

  • 中國信託:資料科學家 
  • 資訊工業策進會資安所 : 資料分析工程師
  • 熟悉自然語言處理、Tabular Data 以及推薦系統相關模型建立 
  • Kaggler : Competition Expert (4 銀牌、1 銅)
  • T-Brain 玉山銀行盜刷偵測競賽 7th
  • T-Brain 永豐AI GO競賽-攻房戰 16th

     


工作經歷


四月 2022 - Present

AI Software Engineer 

大猩猩科技 Gorilla Technology 

主要負責如下

1.論文研讀:研讀資安相關論文,並落地運用於公司產品

2.軟體開發:機器學習、深度學習模型演算法開發、效能優化 

3.成效監控:透過MLOPS,自動化監控模型成效與模型疊代機制 

4.與專案管理部門、產品開發技術部門配合,提升ML產品易用性

5.LLM大型語言模型開發 : 建立生成式模型運用於網頁信任度評分與回饋  


[相關ML、DL模型產品開發] 

1.  惡意程式偵測模型

2.  日誌異常檢測並對應於MITRE ATT&CK 

3.  使用者行為異常檢測 

4.  加密網路封包類別辨識 

5.  MLOPS規劃與實踐 

6.  LLM模型開發與部屬


十月 2020 - 四月2022

Data Scientist

中國信託商業銀行

1. 協作溝通:與業務單位、BA 討論業務需求、目標變數、模型前導測試、模型使用教學 

2. 模型研發:研讀業界實際落地應用的論文,並將其運用於行內 

3. 模型成效與指標定義 

4. 系統架構設計 : 開發金融產品需求與推薦系統模型 

5. 新人帶領 :協助新人科內業務了解、定義目標變數、模型開發與成效計算 


[相關ML、DL模型產品開發]

1. 建立行內第一個推薦引擎產品 

2. 個人化優惠推薦模型

3. 個人化金融產品推薦模型

4. 每日推薦模型成效報表產出 



八月 2018 - 十月 2020

Machine Learning Engineer

資策會

主要負責如下

  • 協作溝通:
    • 與負責後端架構協作,將研發成果部署Docker Image並導入至指定系統
    • 技術轉移與指導教學
  • 資料蒐集:
    • 開發爬蟲程式,爬取一般網站與暗網資安情資,並將其結果導入資料庫
  • 模型研發業務:
    • 研讀資安相關論文並將其技術落地應用於實際資安場景
    • 所內科專計畫分項負責人,研究企劃撰寫、論文研究與研討會發表
    • 制定目標變數與模型衡量指標
  • 系統開發
    • 開發簡易 Flask API
  • 新人面試:
    • 參與主管面試,協助篩選是否合適團隊成員,詢問相關分析技術與過往經歷


[相關ML、DL模型產品開發] 

1. 社群平台假帳號鑑識

2. 惡意程式家族分類

3. Active Learning 惡意程式分類

4. 資安論文發表ICACT 2020

Malware Family Classification using Active Learning byLearning 

5. 鑑別社群貼文是否為資安相關內容

6. 財團法人電信技術中心 - 多標籤垃圾郵件分類模組開發

[資料蒐集相關開發] 

暗網爬蟲及一般明網爬蟲模組開發 


Honors | Awards

2023 Data Scinece Competition 

1. Feedback Prize - Predicting Effective Arguments (NLP LLM 銀牌) 排名前4% (21/1571)

2. Kaggle - LLM Science Exam (NLP LLM 銅牌) 排名前10% (21/1571)

3. T-Brain - 永豐AI GO競賽-攻房戰  預測房價 排名前2% (16th) 

Google QUEST Q&A Labeling 

(銀牌) 排名前2% (21/1571)

參與Kaggle Google所舉辦的NLP競賽,使用LSTM與客製化BERT模型架構,並於最後取得21名佳績,

https://www.kaggle.com/c/google-quest-challenge

Feedback Prize - Predicting Effective Arguments

(銀牌) Solo排名前4% (70/1557)

透過Deberta + LGBM 2 Stage NLP Model 

完成Solo競賽並排名前4%

Jigsaw Unintended Bias in Toxicity Classification 

(銀牌) 排名前3% (74/3165)


參與Kaggle Jiasaw所舉辦的NLP競賽,預測於發文內容中是否有惡意言論傾向,如辱罵、歧視等等言語.

使用LSTM與BERT模型,並於最後取得74名佳績,

https://www.kaggle.com/c/jigsaw-unintended-bias-in-toxicity-classification

Riiid Answer Correctness Prediction

 (銀牌) 排名前2% (37/3395)


參與Kaggle Riiid所舉辦的知識追蹤競賽,使用Tree-Based Model與Transformer模型,並於最後取得37名佳績

https://www.kaggle.com/c/riiid-test-answer-prediction

ESUN Fraud detection competition : 

排名前1% 7/1366


參與玉山所舉辦的盜刷偵測競賽,於最後取得第七名佳績

https://tbrain.trendmicro.com.tw/Competitions/Details/10

中信優惠推薦引擎得獎

2022 Retail Banker International Asia Trailblazers Awards : Highly Commended Achievement - Best Use of Technology in Advertising / Marketing Strategy

一張含有 標誌 的圖片 <br />自動產生的描述


一張含有 文字 的圖片 <br />自動產生的描述