Profile 03 00@2x

陳明傑

我畢業於淡江大學資訊工程系, 研究方向為人工智慧、數據分析、網頁後端,也有此領域的相關作品,而我擅長的程式語言為 Python 和 C ,並將其運用在資料分析與網頁爬蟲上

Data Engineer , AI Engineer , Backend Engineer
Taipei City,Taiwan
[email protected]



經歷

2019年4月 ~ 目前

Freelancer (Python 工程師)


University@2x

2018年11月 ~ 2019年3月

陸軍後備司令部,二兵,義務役四個月


University@2x

2015年9月 ~ 2018年6月

淡江大學,資工系,學士學位


University@2x

2013年9月 ~ 2015年6月

虎尾科技大學,電機系,肄業(轉學)


University@2x

2010年9月 ~ 2013年6月

台中高工,高職學位,控制科


University@2x

技能


Programming

  • Good:
    • Python 3
    • C
  • Moderate:
    • SQL
    • HTML/CSS
  • Basic:
    • JavaScript
    • PHP


Tool

  • Shell/Bash
  • Git/Git flow
  • Visual Studio Code
  • jupyter notebook
Language
       
       Chinese
       English


專案


企業監控軟體系統建置

透過pyqt5 (C++ Qt),自行開發桌面應用軟體,監控辦公室設備,監控部份會直接調用 windows 內建 API,以達到效能最大化(相較於使用套件,大幅降低系統負載),並結合 QThread (Qt 內建多線程),即時發出警示通知,並透過

requests 相關套件,可串接相關API (

Line, Discord, telegram....) ,進行訊息

通報功能

Paragraph image 04 00@2x
Paragraph image 04 01@2x

深度學習物件辨識、追蹤

這是一個政府的案子,透過建立 tensorflow-gpu keras 版本的 yolov3 模型去辨識出特定類別的物件,並利用 vgg-16 來計算不同frame物件之間的相似度,進而達到即時追蹤的效果 ,而這邊會用 vgg16 而不是 opencv 來 track 主要是因為影像本身每秒 frame 數過少,frame 之間的物件距離變動過大,後來改用 vgg16 發現其實精準度還算ok,不過對 gpu 硬體的需求增加不少

Paragraph image 04 00@2x
Paragraph image 04 01@2x

機器學習化工水槽預測警報系統

在有限的軟硬體限制下,透過建置多元線性回歸預測系統,省去耗時的神經網路模型建置,並同時保有相當高的預測精準度,並透過 python 對 raw data 進行正規化處理,同時連線工廠的 docker Hana資料庫,將預測數據即時回填至資料庫,再對數據進行分析預測,當預測結果超過設定之上下限時,系統即時發出警報

Paragraph image 04 00@2x
Paragraph image 04 01@2x

物聯網語音辨識搜索引擎

透過按壓藍芽按鈕來啟動程式,並調用google 語音辨識服務,再將辨識出的字詞透過斷詞系統、辨識系統找出關鍵字,可直接透過使用者念出的章節找出相關內容,也能透過模糊搜索(演算法),找出與關鍵字相關的內容,並依相關度將搜尋結果依序排列。

另外,前端頁面是透過 bottle.py framework  渲染出前端 Html/CSS 畫面


Paragraph image 04 00@2x
Paragraph image 04 01@2x

客製化聊天機器人API

透過 TFIDF  算法將 Jieba (英語的話是 NLTK ) ,將斷詞好的對答集進行關鍵字預處理 ,再透過自己設計的推薦算法,依相似度排序出排行榜,找出最適合的回答,並透過 Flask 設計 web 後端 API ,將回傳結果給網頁前端

Paragraph image 04 00@2x
Paragraph image 04 01@2x

異步 多線程/協程

客製化爬蟲

asyncio (異步) 以及 multi-Thread/processing 爬蟲程式。


先透過 asyncio library 做出大量請求,並設定 requests 等候時間,再透過 multiprocessing 一次把抓下來的文件透過 bs4、Regular expression 找出 html 內我需要的相關資料,來達到爬蟲執行時間的最大效率化

Paragraph image 04 00@2x
Paragraph image 04 01@2x

臉書粉專觸擊率預測 

這是一個開源專案


(1) 利用 Lifetime Post organic reach、Link Clicks,來預測這個粉絲專業的 Lifetime Post Organic Impressions 是多少?


(2) 我使用了 Multiple Linear Regression 來建立模型,其中r_squared 高達 0.98389,資料與模型的相關性非常高

Paragraph image 04 00@2x
Paragraph image 04 01@2x

大專院校休學預測系統

這是一個開源專案


(1) 利用 學生總人數、學期內新增辦理休學人數,來預測這間學校在學期結束後這間學校學期結束後的休學率是否會超過台灣全部學校休學率的總平均,經測試準確率達八成


(2) 可以根據 1.學生總人數 2.學期內新增辦理 休學人數 3.學期結束總辦理休學人數 來判斷學校為公立一般大學還是公立科技大學 其中科技大學判斷準確率達100%  

Paragraph image 04 00@2x
Paragraph image 04 01@2x
Powered by CakeResumePowered by CakeResume