Developed the State-Of-The-Art algorithms and designed the architecture to fulfill the product's requirements.
Design architecture, generate our own datasets, model quantization, and enhance performance (including improving response time to milliseconds, model size, precision and accuracy).
Concerning speech separation, enhancement, speaker recognition, and speech recognition, which improve the quality of voice, integrate with name entity recognition, classification, similarity, correction, and machine reading comprehension, and improve the user experience to make the robots understand the human meaning.
Cyber-security: focused on malware, blockchain vulnerability analysis and cryptocurrency ranking
Presented at Defcon, RuxCon, OWASP Appsec, HITCON and Career: Machine Learning Expert. (link)
AI: Speech Processing, Natural Language Processing, and Computer Vision.
Defending Taiwan, Fighting the Pandemic with Technology. (link)
NVIDIA Developer: AI Improves the Frequency and Quality of Mobile App Notifications (link).
規劃設計及建置公司機器學習(ML)/深度學習(DL)之產品架構的演算法模型、需求分析、技術流程 (含AutoML與MLOps),研發品質與版本控管及發展輪廓和藍圖
開發服務型機器人、AI智能助理、惡意廣告與騷擾電話識別等圖像、自然語言處理及語音處理等機器學習(ML)/深度學習(DL)之產品
Career - 十大熱門人才系列報導: 機器學習專家
科技抗疫: 提高聲紋辨識正確率,添防疫新利器
Android 及區塊鏈威脅分析(R2-D2)、加密貨幣分析和App廣告彈窗推薦系統(C-3PO)
Defcon, RuxCon, OWASP Appsec, HITCON
https://www.twman.org/research/R2D2
https://www.twman.org/research/C3PO
語音訊號處理:建置提升服務型機器人的語音互動體驗API服務。
https://www.twman.org/AI/ASR
聲紋識別:藉開源aishell數據,整合SincNet模型及Kaldi,優化模型與數據集,提供API容器,提升聲紋辨識準確度從0.88提升至0.94,用於家用型服務機器人;報導於國網中心科技抗疫。
https://www.twman.org/AI/ASR/SpeakerRecognition
語音去噪:藉由aishell以及ESC-50和FSDnoisy18k等開源語音數據,以FACEBOOK的denoiser和DEMUCS為模型基礎,針對其中的TasNet及Conv-TasNet做優化(包含串流及多通道),提升STOI並將模型由73.4MB量化至9MB,CPU推論API由0.2秒加速至0.08秒。
https://www.twman.org/AI/ASR/SpeechEnhancement
語音分割:優化需要透過中間狀態傳遞資訊的RNN/CNN模型的分離效果,並整合sudo-rm自監督模型採multi-resoultion feature 的下採樣與重採樣,使用depth-wise convolutions於wsj0-2mix數據優化,並新增修正各種語音重疊長度,模型由11MB量化至3MB,CPU推論API由2.4秒加速至0.27秒。
https://www.twman.org/AI/ASR/SpeechSeparation
自然語言處理:建置提升服務型機器人對自然語言的語義理解API服務容器。
https://www.twman.org/AI/NLP
機器閱讀理解:透過翻譯SQuAD 1.0和2.0以及新增DRCD等數據集,重新優化原始bert模型,並且開發自有數據標註工具,用來解決服務型機器人需要關鍵字及正規表示式問題,建置API服務容器提升推論速度與準確度;將結果EM提升為 0.828,F1提升為0.899。
https://www.twman.org/AI/NLP/MRC
文本糾錯:基於ConvSeq2Seq及bert,並以pkuseg取代jieba,整合NER,優化模型與數據集,建置提升API推論容器速度與識別效果(EM: 0.7624,F1: 0.948)。
https://www.twman.org/AI/NLP/Correction
命名實體識別:整合拼音及分類機制,並採用ChineseAnnotator重新標註服務型機器人需求之商場等相關數據集,建置容器提升API推論容器速度與準確度(F1: 0.84)。
https://www.twman.org/AI/NLP/NER
文本相似度:基於TextCNN優化模型與數據集,建置容器提升API推論容器速度與語音服務問答準確度。
https://www.twman.org/AI/NLP/Similarity
文本分類:基於bert取代騰訊詞向量,優化模型與數據集及提升商場品牌識別分類準確度。
https://www.twman.org/AI/NLP/Classification
#Security #軟體工程系統開發 #系統架構分析規劃 #軟體整合測試 #問題追蹤處理(Bug tracking) #自動化系統設計整合