2016-04-06 73 views
0

PCA'yı anlamaya çalışıyorum. 3 boyutlu veri kümem var, iki PCA modeli, biri 2 bileşenli, diğeri 3 bileşenli yaptım. Ancak, her iki PCA modeli için açıklanan varyans oranının neden aynı olduğunu anlamıyorum. Kullandığınız veri her iki model için aynı isePCA: Farklı sayıda bileşen için aynı açıklanan varyans oranı

Model with 2 components: [ 0.60792494 0.31234679] 
Model with 3 components: [ 0.60792494 0.31234679 0.07972828] 
+0

http://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html bulunamadı piton, kullandığınız

Eğer (bu dahil eğer sorunuz için daha kurulacağını) sklearn.decomposition.PCA kullandığınız varsayalım, dokümantasyon sözü : Explanation_variance_ratio_: array, [n_components] Seçilen bileşenlerin her biri tarafından açıklanan varyans yüzdesi. Eğer n-komponentler ayarlanmamışsa, tüm bileşenler saklanır ve açıklanan varyansların toplamı 1.0'a eşittir. Temel olarak PCA, veri kümesinin kapsadığı alanı oluşturan tüm temel işlevleri bulmaktır. Her bileşen her bir temel ile ilişkilendirir. – triiiiista

cevap

2

, o zaman, açıklanan varyans oranı sizin durumda 1 olarak özetlemek gerekir olası tüm bileşenleri kullanmak vardı ilk iki bileşen ~ 91% açıklamak varyasyonun Her bir PCA bileşeni öncekilere ortogonal olduğu için, eklediğiniz tüm ek bileşenler sadece henüz açıklanmamış olan varyansı açıklayacaktır. Böylece, 3 bileşenli modelin ilk 2 bileşeni, 2 bileşenli modelle aynı miktarı açıklayacak ve 3. bileşen, ilave% 8'lik bir varyasyonu açıklayacaktır. Belki de iyi bir sezgisel tanıtım ve örnekler

İlgili konular