KNN(K-nearest neighbors)_NBA

ByAlex Chen
Risk Analyst
1.最後有回頭改資料,因為發現有一個選手位置資料為PF- C,為了讓confusion matrix維度對稱 (5*5),故將其改 為PF,這邊不改為C是觀察資料內容,該選手比較偏PF。 2.另外因為資料格式為tibble,因此在最後套用KNN模型時, 參數的格式需要轉乘一致,否則無法執行。 3.SF這個位置有10個人被分為PF,表示這位置的選手很多事 PF兼打SF,所以正確率比較低。 4.C, PG分類的就比較明顯,畢竟中鋒主要就是在低位;而 PG就是在高位所以差異性大。 5.最終得到正確率52%剛好過半,因為將所有籃球數據作為 分類依據,後續可探討作變數維度降低,如:主成分分析 、 降低變數間影響,以便提高分類正確性,畢竟解釋變數有太 多相關性的因子。
Alex Chen
Published: August 17, 2020
NBA
KNN
R
More from Alex Chen
卡方齊一性檢定
聚合式階層分群(Hierarchical clustering)
PCA_NBA球員數據降維度
雙變量卜瓦松分佈
切割式分群(Partitional Clustering )
kNN_NBA球員位置(201819球季)
chat placeholder

Build Your Professional Network

Click icon on the company page or under talent search engine to start the conversation.