K0sgyyktwuczgkabqxfw

曾柏諺

目前於中國信託擔任IT,主要負責開發AIONE系統的支票辨識服務DevOps和SRE。

過往工作範疇為AI演算法,曾協助完成很多專案。其中包含面板瑕疵檢測、藍芽室內定位、新北市科技執法等專案。也曾負責規劃利用docker容器做推論系統開發,並與前後端系統串接的工作。

此外,我利用閒暇之餘為咖啡廳架設營運網站,撰寫綠界信用卡功能以及自動化部屬,即將於年底上線啟用。最後,為加強kubernates能力,規劃於今年考CKAD證照。

DevOps, SRE

工作經歷

 CTBC Bank, IT 工程師  2022年4月 ~ 現在

1. 支票辨識服務系統,包含開發與維運相關,預計年底將導入全台152家分行 

2. 模型自動化訓練流程,更新模型權重 

成效:預估一年節省4000萬(10個FTE) 

3. 採購DGX H100 Station中,預計部署Lama2 LLM model

 神通資科, 機器學習工程師  2021年4月 - 2021年12月

新北市科技執法專案: 

1. 偵測環保人員所錄製亂丟垃圾的檢舉影片,其中包含行人與騎車丟垃圾兩種 

2. 騎車的部分需包含車牌辨識功能

太和光, 資料科學家 2020年2月 - 2021年4月

1. 藍芽室內定位,利用AI取代相較傳統的三角定位,來因應beacon訊號在環境之中的改變 2. 撰寫測試工具及實驗,並且參與相關產品開發和客戶專案

 中強光電, 資料科學家 2018年9月 - 2020年2月

1. 負責面板、導光板、PCB板的AOI檢測 

2. 於導光板專案中申請了一篇專利(模型訓練方法與電子裝置),致力於能夠透過將機台自動做調整作為目標。

技能


語言

python

R


深度學習框架

tensorflow

pytorch 

keras


容器與系統架構

Docker

k8s

學歷

國立台北大學 電機工程學系 (2016年 6 月畢業)

專題 建構情緒分析系統 - 以車電產業為例
:

國立交通大學 工業工程與管理學系研究所 (2018 年 8 月畢業)

碩士論文:ECG Classification with Siamese Network 基於孿生學習網路之心電圖分類

論文1. 以Word2vec與卷積神經網路實現嘲諷句偵測

發表於第二十六屆南區統計研討會

論文2. On Feature Combination for Sentiment Classification

投稿於IEEE Intelligent Systems

論文3. ECG Classification with Convolutional Neural Networks    

接受於2018 GCEAS Global Conference on Engineering and Applied Science

專案

支票辨識服務系統架構

1. 審票服務流程: 分行行員收件,透過ESB打到文件辨識平台(AICHK-PLT),再將影像傳到審票服務處(AICHK)做辨識

2. CI/CD:程式碼與模型權重檔包在base Image,再將其deploy到機器上

3. 模型產製: 文件辨識平台(AICHK-PLT)會搜集資料,並且做完預標記。修正標記後,即可啟動自動化訓練來替換舊版模型。

M+通知 \ EFK \ Grafana

手機M+告警服務,包含GPU使用量告警、timeout錯誤以及每日交易數量統計。

利用filebeat蒐集log後parsing,透過UUID、traceID等index資訊查看票據交易的問題。

監控每一個pod所使用的cpu core及記憶體用量。在pod重啟的狀況,也能觀察前一個pod所發生的問題。


Paragraph image 01 00@2x

新北市科技執法專案

此專案目的為環保人員所錄製亂丟垃圾的影片,需要協助使用者方便找出事件當下照片以及擷取該段違規影片,以利寫入檢舉系統。其中較為困難的部分是環保局委託的各廠商的攝影機畫質皆不同,並且由於是偷拍性質,所以角度、曝光、焦距都不好,也因此資料集需要慎選。
  1. 利用Efficientdet模型做物件辨識,將行人以及騎車亂丟垃圾的物件做label,訓練完成的影像如右圖顯示。
  2. 除此之外,在物件辨識也加入擷取車牌的任務,再將其加入CRNN模型來辨識車牌內容。

論文及side project

Paragraph image 01 00@2x 1a3881c875a7a1fb1e859435ef9363b5ddf36f4e73d1ad63a1a0af69f2a9f745

ECG Classification with Siamese Network

在目前醫療上來說brugada病例非常少,因此要拿來做深度學習非常困難。本實驗希望能夠在緊急狀況送到醫院前,醫生就能先行了解為何種症狀,以減少不必要的準備時間。 

        1. 將醫院的原始資料做整理,並且撈出重要資訊 

        2. Siamese network把資料成對搭配來增加資料集數量          

        3. 利用ResNet模型,抽取12導程的特徵,並且透過歐式距離來區分正常及患者

        4. 重新squeeze資料,驗證是否真實是在導程V2可以發生此現象

        5. 達到Sensitivity 0.790、Specificity 0.740、AUC 0.763

Side Project - SIIM-ACR Pneumothorax Segmentation

此為2019年Kaggle競賽中,需要利用segmentation來偵測氣胸,並且時間大約花了兩周可以得到dice score為0.609。

        1. 將X光片與run-length-encoded (RLE) masks轉換後的ground truth做比對 

        2. 利用Resnet-50 Unet + CBAM來做為架構

        3. 預測出來的圖片用erosion & dilation的方法做修飾 (主要為去除雜訊)



Paragraph image 00 00@2x

Side Project - ifang&iqt 方思微特

此side project目的為協助朋友家開咖啡廳,為了客製化蛋糕訂製方便而架設的。

以下有幾個功能:前端官網、後台管理、後端及資料庫、LinePay、綠界信用卡

自動化部屬上述微服務,並規劃未來以k8s管理,監控各服務的使用量,除此之外還會加入GA,研究廣告投放及顧客喜愛的推薦商品。