2013年2月23日 星期六

PCA for Reduce Dimensions


寫在前頭
你會從這篇文章看到:

  • 使用R軟體執行主成份分析(Principal Components Analysis, PCA)減少資料維度。


但無法從這裡得到:

  • 嚴謹又完整的PCA教學內容。


單刀直入砍維度
情境:假設有一個m╳n的資料集,因n個屬性太多,該如何縮減?(為快速說明,就使用100╳2的資料集,縮減為100╳1)

總結
PCA的優點是將用k維的向量來代表n維空間的資料點,可以節省儲存空間,加速演算法計算,但值得注意的地方,該如何降低維度才能保留資料特性,這又是另一個討論議題,就先擱著囉!

參考資料

  1. Tan, Steinbach, Kumar, ”Introduction to Data Mining”,2005

沒有留言:

張貼留言