Master’s Degree・
資訊科學與工程研究所 2019 - 2021
Description
碩士學位專於研究各種人工智慧演算法,以深度學習(Deep Learning)與強化式學習(Reinforcement Learning)為主。演算法包含但不限於:Google DeepMind 的 Zero 系列演算法、DQN 系列、PPO 等等。實作經驗則包含:開發 AlphaZero、MuZero 等軟體框架。
碩論為「應用 MuZero 演算法於隨機性遊戲的環境上」。
會的深度學習庫:PyTorch、TensorFlow、Haiku
相關比賽紀錄:
ICGA Computer Olympiad 的 Surakarta 棋項目獲得銀牌、
TAAI CUP Computer Game 的 Surakarta 棋項目獲得銀牌。