李東宏 Dong-Hong Lee

喜愛思考、熱愛挑戰、永不放棄

我是一名喜歡思考、用程式解決問題的工程師。

先後曾在台積電擔任過設備工程師與製程工程師、以及在中科院擔任過PLC程式設計工程師、目前則在鉅芯科技擔任AI工程師。

在台積電工作的經歷，讓我學到最多的是如何將每一件看似小事的事做到最好，如何細心以及專注於每一塊可能忽略的細節，唯有將每個細節用心做到最好，才是一名工程師該有的素養。我在擔任設備工程師及製程工程師的時候，最重要的就是如何盡己所能的將設備機台維護到完美，連一顆螺絲釘要鎖到多緊、磅數需要多少都是我們所關心的，唯有如此才能確保晶圓經過自家設備機台時的良率能夠維持一定的水準。

在中科院工作的經歷，讓我學到最多的是如何規劃及設計出國家級的潛艦，我從零開始學習如何應用PLC程式設計，設計與規劃潛艦上電機電子設備的控制。由於從小到大學習新事物的速度一直都還算快速，尤其在台積電時還曾受到主管稱讚學習能力優秀且新事物的適應力快速，因此應用在學期間所學到的電子學、自動控制等理論知識並搭配PLC程式設計，讓我很快就能自己負責規劃與設計潛艦中四大系統中的其中一個，在新聞上看到的IPMS系統中，四大系統的其中之一就是我所負責設計的。

目前在鉅芯科技擔任AI工程師負責晶圓瑕疵分類(ADC)系統，主要提供Deep learning在影像辨識上，幫助半導體廠能夠用最少的人力達到最高的效率在提升半導體良率上，目前我個人所負責完成的專案如下:

應用OCR引擎於辨識wafer ID的系統，主要將圖片透過傳統影像辨識的處理，將特徵強化再透過OCR引擎訓練模型並預測，負責完成的部分包含傳統影像處理、data label、model training、predict and test。
於公司現有的晶圓瑕疵分類系統上，提出將預測結果的分數經由投票機制搭配加權級距的方式處理，可以有效提升系統實際於產品線上應用的準確度約5%。
於公司現有的晶圓瑕疵分類系統上，分析資料平衡的機制，改善部分平衡的方式，可以在不影響準確度的前提下加速系統運行的速度。
應用SOLOv2模型在半導體的測試上，檢測探針於晶圓上的測試狀態，我所設計的系統由於只需要精準預測出晶圓上pad物件的目標，就能夠搭配傳統影像辨識的後處理達到高準確度，目前我所測試得到的準確度約有80%，而這是在訓練資料量只有19張的條件下，而測試的資料量約132張所達到的準確度。
應用XGBoost模型在半導體良率預測上，根據機台Recipe作為資料集，並預測晶圓良率，在75筆資料中所建立的model，其誤差平均在15左右。

我在Coursera上修習吳恩達教授的Deep learning，學習類神經網路，在自學的這段期間所完成的Python專案有:

手刻Perceptron Learning Algorithm(PLA).
手刻Optimizers function配合GIF圖觀察求解最佳解的軌跡.
手刻2 layer NN model辨識貓咪圖片.
使用Random forest在Kaggle上的競賽.
IMBD2020 全國智慧製造大數據競賽, 使用Random forest預測填補缺值並用類神經網絡預測結果。

秉持著永不放棄的精神、強烈的自我要求及良好的團隊合作與溝通能力，讓我能快速適應新環境，也能在高壓與快節奏的工作環境中完成任務。

我喜歡思考、熱愛挑戰的工作並樂於分享使自己與團隊更進步。

1990, Hsinchu，TW 0931-790-923
[email protected]

工作經歷

鉅芯科技, AI工程師, Apr 2021 ~ 現在

晶圓瑕疵分類(ADC)系統架構
應用OCR引擎辨識wafer ID.
於InceptionV3模型輸出後採用投票機制，並提升模型分類wafer defect的準確度.
分析並改善資料平衡上data augmentation的方法，優化系統架構.
應用SOLOv2於wafer探針狀態，根據物件偵測的實例分割判斷探針位置及狀態.

中山科學研究院-資通所, PLC工程師, Apr 2019 ~ 現在

參與計畫的研擬，包含選用PLC軟體程式、硬體RTU等模組設備
使用PLC進行電機電子等元件設備的系統程式開發
測試並確認能與其他子系統進行邏輯控制
執行設備的採購案
利用Python強大的資料處理能力將PLC所需的訊號點位進行編碼，總共針對25個子系統，近3000個訊號點位進行編碼，同時減輕其他同事的工作量，將電腦就能完成的事情交由程式解決，讓工程師可以專注於其他更重要的工作上。

台積電, 設備工程師與製程工程師, Feb 2017 ~ Jul 2018

提高產線製程的良率，解決產線製程不良品發生的問題。
解決因不良品導致停止運作的機檯。
提出機台保養的手法，提升機台效率，降低機台保養次數。
掌控機檯製造狀況，避免不良品的發生，在同期新進人員中，以最快的學習速度以及最少的犯錯率，快速掌握與認識將所負責的製程機台。
利用Excel以及公司各種圖表繪製工具繪圖並觀察產品各種量測的結果，追蹤預防或即時發現與解決Defect的產生。

專長

• Tensorflow及Pytorch

• Convolution Neural Network(CNN)

• Neural Network

• SOLOv2使用經驗

• OCR使用經驗

專案

• 手刻Perceptron Learning Algorithm(PLA)

• 手刻Optimizers function配合GIF圖觀察求解最佳解的軌跡

• 手刻2 layer NN model辨識貓咪圖片

• IMBD2020 全國智慧製造大數據競賽, 使用Random forest預測填補缺值並用類神經網絡預測結果

學歷

國立交通大學, 碩士學位, 聲音科技學程, 電機與控制, 2014 ~ 2017

畢業論文 基於語音命令之家用機器人任務學習設計

Android, Hidden Markov Model, Voice recognition

透過使用者一個簡單的語音命令即可以使機器人執行一連串的動作以完成任務。機器人將不再需要使用者逐一下達語音命令，而是可以由使用者的一個語音命令就能夠透過任務學習系統的運算串聯起整個任務的流程並且逐步完成任務。
利用Matlab建立兩個序列，並透過HMM演算法的方式，給定隱含狀態值與可觀察值之間的權重，可以根據先前的狀態決定當下的命令任務為何。
利用Google助理進行使用者的語音辨識，並透過Socket的方式將辨識結果傳至機器人端進行任務選擇。
搭配機器人身上的Kinect進行物體的辨識並透過手臂進行物體抓取。
搭配機器人身上的雷射建立環境地圖並且辨識與避開障礙物。

擅長的科目

電子學、電路學、工程數學、自動控制。

競賽

IRHOCS 2014 國際機器人實作競賽第二名

機器人必須持球並且辨識籃框位置與射籃，以及將籃球傳給隊員，讓隊員能夠上籃得分，機器人在移動的過程中必須避開障礙物，才能完成比賽。

參與LabVIEW程式開發，個人負責的是辨識好籃框後決定與籃框的距離，以及避開障礙物之後決定好要傳球給隊員的距離。
籃球機器人在整個比賽中，透過雷射測距能夠避開障礙物，同時利用Kinect辨識籃框位置，最後在機械手臂的部分利用槓桿原理的方式將籃球投出。

IMBD 2020 全國智慧製造大數據競賽

針對鑽孔機機台各項參數進行結果的預測。

利用Random forest進行缺值的預測並填補。
利用類神經網絡進行結果的預測。
預測指標Loss:0.02, R2_score 0.55, Accuracy score:0.80

Kaggle競賽

Enron Fraud Dataset 安隆公司詐欺案

安隆公司曾是一間能源公司，2001 年破產前是世界上最大的電力、天然氣及電信公司之一。擁有上千億資產的公司於 2002 年竟然在短短幾周內宣告破產，才揭露其財報在多年以來均是造假的醜聞。在本資料集中你將會扮演偵探的角色，透過高層經理人內部的 mail 來往的情報以及薪資、股票等財務特徵，訓練出一個機器學習模型來幫忙你找到可疑的詐欺犯罪者是誰!

我的Kaggle競賽ID是GaprsGG，在此次的Kaggle競賽中得到最佳的預測分數為0.821。
我使用的演算法為Random Forest，選擇建立150顆決策樹，每顆決策樹最大的深度設定為7，這是我在實驗過程中找到最佳的參數。
在特徵工程中，除了基本的補缺值外，我將所有參數均視覺化，分別是直方圖、箱型圖以及散佈圖等等，另外還特別將訓練集中的犯罪者以及無罪者個別繪製散佈圖，原因是我想利用視覺化的方式快速找到每一個特徵資料的關係為何，可以方便我決定如何利用這些特徵值。
利用feature_importances_的方式列出各個特徵值的重要性，最後我將重要性最薄弱的三個特徵值刪除，這樣的方式成功讓我的預測準確性上升約0.02。