吳易東頭像

吳易東

清華大學資工系 碩士二年級,自然語言處理實驗室成員。近一年內改善文法改錯 (GEC) 系統,並曾在 IEEE 發表 Poster,也曾獲得梅竹黑客松冠軍。

技能


C / C++

進入資工領域所學的第一種語言,寫過 Thread Programming、Socket Programming 等等,對低階程式語言非常熟悉。


Python

目前最常使用的程式語言,使用 NLTK 、spaCy 做斷詞、詞性分析;使用 multiprocessing、PySpark 做平行運算加速處理。


Neural Network

PyTorch:LSTM、Transformer...。

TensorFlow:LSTM、Bi-LSTM...。


Django

參加梅竹黑客松期間,使用 DJango 建立後端資料庫管理系統、架設 API 供前端呼叫。


SQL 

MySQL:架設會員系統。

PostgreSQL:建立詞彙查詢資料庫。

SQLite:Django 搭配 SQLite 做開發。


巨量資料處理 

使用 PySpark、multiprocessing、parallel 做平行運算來處理 NLP 的大量資料。


自然語言處理 (NLP)

自然語言處理實驗室的成員,修過資訊檢索課程,致力於改善自動文法改錯。未來計畫開發英語學習輔助機器人。


數據分析 

自然語言需要處理大量資料,用各種演算法統計分析數據,如 TF-IDF、Mutual Information、Transformer 等模型。

 程式技能:C、C++、Python、Django、PyTorch、TensorFlow、PHP、MySQL、PostgreSQL、SQLite、HTML、CSS、JavaScript、R 

學歷

國立清華大學,資訊工程學系,碩士,2019 ~

  • 自然語言處理實驗室成員
  • IEEE BIG DATA 2019 Poster [P313]
  • 開發實驗室系統,詞彙查詢加入文法改錯規則
  • 使用 LINE-Bot、LIFF 開發 LINE 找外快
University@2x

國立台灣大學,資訊工程學系,學士,2015 ~ 2019

  • 自然語言處理實驗室專題生
  • 深度學習預測 ETF 走勢

University@2x

比賽

 2020 梅竹黑客松 黑客組 (LINE 組) 冠軍

作品

Projects 00 00@2x

LINE 找外快

梅竹黑客松作品,希望彌補及整合現有各大平台的不足。使用 Django、Vue.js、LINE-Bot、LIFF 等技術建構的產品。

作品連結
Projects 00 00@2x

IEEE Poster

IEEE BIG DATA 2019 Poster,是當時已知最大的 GEC Data,產生的資料能供訓練 GEC Model。

作品連結
Projects 00 00@2x

ETF Prices Prediction

學士班專題成果,使用 LSTM、AutoEncoder 建構 Model,預測未來一週 ETF 指數。

作品連結
Projects 00 00@2x

匿名聊天室

旨在練習註冊成為會員後,系統隨機配對會員,即時更新兩人聊天動態。使用 PHP、Javascript 及基本的 HTML、CSS 打造。

作品連結
Projects 00 00@2x

NLP 專題 1

SemEval Task3:Query 分類,我們使用 TFIDF、Word Vector 等 Features 進行分類訓練。

作品連結
Projects 00 00@2x

NLP 專題 2

Relation Extraction:給定 Tokens,判斷兩者之之間的關聯性,我們使用 POS Tag、NER 等 Features 進行判斷。

作品連結
Powered by CakeResumePowered by CakeResume