KNN(K-nearest neighbors)

ByAlex Chen
Risk Analyst
a.KNN分類演算法是一個基於實例的演算法,特徵樣本的好 壞和樣本當中分類的數量影響分類結果準度,若A類數量大 於B分類,可預期K個最近距離鄰居高機率分類為A,分類 失去準度。 b.優點為簡單不需要輸入資料假設,對於異常值不敏感,缺點 為計算量大,非常耗時且占記憶體空間大。 c.可探討的議題有「參數K值如何選取」,如:資料數的平方 根、「如何提升效能」。 d.此次針對公司客戶船型,為驗證KNN分類模型背後精神, 僅挑選20筆資料實作,經由confusion matrixe觀察得到 66.7%的準確率,顯示有效將船型分類。
Alex Chen
Published: August 17, 2020
Ships
KNN
R
More from Alex Chen
卡方齊一性檢定
KNN(K-nearest neighbors)_NBA
聚合式階層分群(Hierarchical clustering)
PCA_NBA球員數據降維度
雙變量卜瓦松分佈
切割式分群(Partitional Clustering )
chat placeholder

Build Your Professional Network

Click icon on the company page or under talent search engine to start the conversation.