T4gt9tfnwxtbgxyujxvl

蔡睿庭

生在資訊爆炸科技時代,我認為程式設計與資料分析是這世代所需具備的能力。目前會使用Python模組進行資料分析、機器學習與深度學習架構。


任職於信諾科技,在公司擔任自然語意分析NLP技術的研發,包含中文斷詞、文本特徵提取、文章主題分析、文章自動標籤、關聯文章計算、詞關聯脈絡分析等技術。


我認為人生每個階段的經歷都可作為未來面對挑戰時的基礎,會繼續增進自己撰寫程式的能力,不斷吸收新知,希望能為公司建立更好的服務產品,利用人工智慧對公司與社會有更多的貢獻。


1994.08.08

軟體工程師

mobile : 0975-207-915
email    : [email protected]

學歷

國立交通大學, 碩士學位, 土木工程, 2016 ~ 2018

論文名稱:台北北門磚造古蹟受地震力反應與破壞之探討

  • 發現問題解決問題的能力
  • 學習新的知識新的技術

  因為指導教授開明的態度,讓我自行決定論文研究方向。在老師的指導下,歸納出研究目的、研究方法及對結果的討論。撰寫論文過程中學習如何發現問題,找尋問題的解決方法及合理的科學理論以驗證結果,處理實驗數據時也接觸了資料分析,發現在資料處理上Python是一個相當好的程式語言,而開始接觸學寫程式。

  此外,因指導教授熱衷於機器學習的仿生演算法,同研究室也做相關研究,開始認識機器學習。曾修過線性代數、作業研究及工程數學,讓我在閱讀演算法論文時,能依循讀過的理論作為基礎理解意義。

University@2x

國立交通大學, 學士學位, 土木工程, 2012 ~ 2016


University@2x

技能


程式語言

主要程式語言
  • Python
    • 資料處理
Numpy, Pandas, Matplotlib

資料庫
  • MySQL
  • MongoDB

人工智慧

  • 機器學習

scikit-learn, Regression, Classification
  • 深度學習

Tensorflow, DNN, CNN
  • 自然語意分析

nltk, jieba,TF-IDF, N-GRAM, LUIS
  • NLP應用

    • 文章特徵提取
    • 文章主題分類
    • 關聯推薦
    • QA機器人

其他能力

  • 網路爬蟲
  • Git版本管理
  • Line Bot

工作經歷

信諾科技, 資料工程師, Apr 2020 - 至今

公司第一位找來研發NLP技術的工程師,目前正在整合公司的自然語意分析技術,將不同工具透過Python實現,並與系統工程師合作,建立技術平台

  • 技術研發
  1. 切詞計算
    • 了解Jieba技術,並訂定參數權重的設定規則,使切詞結果更為準確,以利後續分析
  2. 文章代表詞計算
    • 利用演算法算出這一批文本中,每一篇文章各自有代表性的詞
  3. 詞關聯脈絡分析
    • 9358篇食品文章做為研究對象之母體,分析文中的詞與詞在多層疊代後的關聯脈絡 
  4. 自動標籤
    • 在一特定專業領域中,找出文章代表詞最相關之使用者自訂的標籤詞
  5. 文章主題分類
    • 演算法自動將文章依照主題分群
  6. 時間區間內文本主題趨勢
    • 研究時間區間內累積之特定專業領域文本,找出論文主題變化及自動標籤結果的趨勢變化
    • 長 篇文本:使用成大論文資料庫中849篇環工領域論文(出版年區間為20年)作為對象分析
  • 專案成果
  1. 公共污水處理廠營運評鑑計畫  Oct 2020 - Mar 2021
    • 短 篇文本:4391筆評鑑意見,利用NLP技術自動給予文本標籤,其標籤讓使用者定義
  2. 土壤及地下水技術推廣平台計畫 Apr 2021 - 至今
    • 中長篇文本:238篇模廠報告作為分析文本,四個不同主題定義個別主題標籤(共55個標籤)演算法分析過後,讓每一篇報告針對這四種主題個別自動標籤


NLP應用技術

詞關聯脈絡分析

可以分析一批文本中,多個詞的關聯詞,並用圖示顯示出多層疊代的詞關聯圖

Paragraph image 04 00@2x
Paragraph image 04 01@2x

 培訓 

  • 資策會AI人工智慧應用開發就業養成班 Oct 2019-Mar 2020

  為了能更加認識如何撰寫程式以實現人工智慧,報名上課時間超過600小時的課程,對統計與機率理論在演算法上更認識,並轉換成程式碼。學習使用Numpy、Pandas進行資料前處理。透過機器學習、深度學習做特徵分析,對資料進行分群分類,應用至物件辨識、語意分析等。另外還學習基礎網頁前後端與資料庫使用,可將AI服務架設於網頁上與客戶連結。

  結業專題為「Smart Fit Sports」,使用技術如下: 

  1. Line Bot串聯LUIS語意分析連結用戶與服務端,分析用戶輸入資訊。
  2. OpenPose影像偵測,可以對於人體節點進行動作抓取
    • 動作檢查正確與否,給予回饋 
    • 偵測出一組訓練總共做了幾下
  3. 使用YOLO、Azure Custom Vision、VGG16三個不同模型對於網球選手與網球的位置抓取。
  4. 將產品服務架設在網頁上,並通過即時串流傳遞影像資訊。

  我負責的部分為架設Line BotLUIS語意分析、及YOLO影像識別訓練,成果簡介如履歷後方所介紹。這次培訓是我接觸程式設計的開始,也讓我在網路上找尋資源自學時更能適應。目前增進自己能力的方式如下

  • 業界舉辦之機器學習 百日馬拉松-讓自己對資料處理與機器學習有完整練習
  • edX-Havard CS50線上課程-對程式撰寫有更通盤的認識
  • Coursera-Neural Networks and Deep Learning-已完成課程50%,神經網路與深度學習操作
  期待自己能在人工智慧的領域上貢獻出我的熱忱與能力,為公司產生更好的AI服務。

AI應用實例

Paragraph image 05 00@2x
Paragraph image 05 01@2x

YOLO影像辨識

將網球比賽的影像分割成照片作為資料集(約13000張),並將要辨識的動作標記過後,訓練YOLO辨識不同動作。



模型對於正反拍的識別成果: 

  • 正手拍 Precision:90% Recall:74% 
  • 反手拍 Precision:77% Recall:91% 

 可由上述結果得知模型對比賽中 

  • 預測正拍的精準度高。
  • 真實的反手拍可抓取的比例較高。

Line Bot串聯LUIS語意分析

使用LUIS語意分析判斷用戶的意圖,並在Line Bot上給予適當的回覆與功能選擇。

例如當使用者輸入:「今天想去健身」、「可以教我棒式嗎」為「健身」意圖;

輸入「我有問題」、「你們工程師是誰」為「客服」意圖,再給予客戶相對應的資訊。

Paragraph image 00 00@2x

語言能力


中文:母語

英文:TOEIC 790 聽/精通、 說/普通 、讀/精通、 寫/普通

Powered by CakeResumePowered by CakeResume