寫在前頭
你會從這篇文章看到:
- 使用R軟體執行主成份分析(Principal Components Analysis, PCA)減少資料維度。
但無法從這裡得到:
- 嚴謹又完整的PCA教學內容。
單刀直入砍維度
情境:假設有一個m╳n的資料集,因n個屬性太多,該如何縮減?(為快速說明,就使用100╳2的資料集,縮減為100╳1)
總結
PCA的優點是將用k維的向量來代表n維空間的資料點,可以節省儲存空間,加速演算法計算,但值得注意的地方,該如何降低維度才能保留資料特性,這又是另一個討論議題,就先擱著囉!
參考資料
- Tan, Steinbach, Kumar, ”Introduction to Data Mining”,2005
沒有留言:
張貼留言