工具:BIOVIA Pipeline Pilot
檢驗方式
1. 獲取本次模擬需要的核苷酸結構資料(sense strand)
- Blocker
- Forward primer
- Reverse primer
- Template
2. 利用實驗所指定的溫度進行不同組別的分子動態模擬實驗。
3. 分子動態模擬所產生的結構檔將再分析構型穩定性以及作用力穩定度。
4. 機器學習(主要負責部分)
- 將動態分子模擬結果,區分為對照組與實驗組(80% training/20% test)
- 做資料清理,整理成機器學習所需表格
- 選擇模型交叉驗證的方式,分別有三種交叉驗證的方式,分別為
- Holdout cross validation
- K-fold cross validation
- Leave one out cross validation ,根據結果我們發現 2. K-fold cross validation 測試出來的ROC分數最高,故選擇此交叉驗證的方法。
- 選擇訓練模型的三種演算法,分別為
- Deep Neural Net
- RP Forest (RPF)
- eXtreme Gradient Boosting
- 透過的ROC分數我們發現DNN分數最低,故不考慮使用DNN。而RPForest 與XGBoost兩者分數十分接近, 故後續RPForest 與XGBoost皆會拿來用做模型訓練。
- 接著我們透過刪減變數及調整參數來優化模型
- Prediction 用前面訓練好之模型進行數據的預測