«pca» etiketlenmiş sorular

Temel bileşen analizi (PCA) doğrusal boyutsallık azaltma tekniğidir. Çok değişkenli bir veri kümesini olabildiğince fazla bilgi (varyans) koruyan daha küçük bir yapılandırılmış değişken grubuna indirger. Temel bileşenler olarak adlandırılan bu değişkenler, giriş değişkenlerinin doğrusal kombinasyonlarıdır.


3
Özellik sayısını azaltabildiğimizde neden öğrenme algoritmalarını hızlandırmak için PCA kullanıyoruz?
Bir makine öğrenimi dersinde, PCA'nın ( Temel Bileşen Analizi ) yaygın bir kullanımının diğer makine öğrenimi algoritmalarını hızlandırmak olduğunu öğrendim . Örneğin, bir lojistik regresyon modeli geliştirdiğinizi düşünün. İ için 1'den n'ye kadar bir eğitim setiniz ve x vektörünüzün boyutu çok büyükse (diyelim bir boyutlar), PCA'yı kullanarak daha küçük bir …


4
AIC (veya BIC) kullanarak PCA modeli seçimi
Bir PCA'da çıkarılacak uygun sayıda faktörü seçmek için Akaike Bilgi Ölçütünü (AIC) kullanmak istiyorum. Tek sorun, parametre sayısını nasıl belirleyeceğimi bilmiyorum. Bir matrisi düşünün , burada değişken sayısını ve gözlem sayısını temsil eder , öyle ki . Kovaryans matrisi simetrik olduğundan, maksimum olasılık tahmini AIC'deki parametre sayısını eşit olarak ayarlayabilir …

2
PCA ve rastgele ormanlar
Yakın zamanda Kaggle yarışması için, eğitim setim için daha sonra rastgele bir orman sınıflandırıcısını eğitmek için kullanılacak 10 ek özellik tanımladım. PCA'yı yeni özelliklerle veri kümesinde çalıştırmaya karar verdim, birbirleriyle nasıl karşılaştırıldıklarını görmek için. Varyansın ~% 98'inin birinci bileşen (ilk özvektör) tarafından taşındığını buldum. Daha sonra sınıflandırıcıyı birçok kez eğittim, …

5
Küme analizi için değişken seçimi yapmak için PCA kullanabilir miyim?
Bir küme analizi yapabilmek için değişken sayısını azaltmalıyım. Değişkenlerim güçlü bir şekilde ilişkilidir, bu yüzden bir Faktör Analizi PCA (temel bileşen analizi) yapmayı düşündüm . Ancak, elde edilen puanları kullanırsam, kümelerim tam olarak doğru değildir (literatürdeki önceki sınıflandırmalara kıyasla). Soru: Her bileşen / faktör için en büyük yüke sahip değişkenleri …

2
Faktör analizindeki ilk faktörleri en üst düzeye çıkarır?
Ana bileşenler analizinde, ilk ana bileşenleri maksimum varyansa sahip dikey yönlerdir. Başka bir deyişle, birinci ana bileşen maksimum varyansın yönü olarak seçilir, ikinci temel bileşen maksimum varyansla birinciye dik olan yön olarak seçilir, vb.kkkkkkk Faktör Analizi için de benzer bir yorum var mı? Örneğin, ilk faktörlerinin orijinal korelasyon matrisinin diyagonal …

2
Regresyon değişkenlerini seçmek için temel bileşenler analizi nasıl kullanılır?
Şu anda modellemede kullanılacak değişkenleri seçmek için temel bileşenler analizini kullanıyorum. Şu anda, deneylerimde A, B ve C ölçümleri yapıyorum - Gerçekten bilmek istiyorum: Daha az ölçüm yapabilir ve zamandan ve emekten tasarruf etmek için C ve veya B kaydını durdurabilir miyim? Her üç değişkenin de verilerimdeki varyansın% 60'ını oluşturan …

1
PCA ve TruncatedSVD'nin scikit-learn uygulamaları arasındaki fark
Temel Bileşen Analizi ile Tekil Değer Ayrışması arasındaki ilişkiyi cebirsel / tam düzeyde anlıyorum. Benim sorum scikit-learn uygulaması hakkında . Dokümantasyonda: " [TruncatedSVD] PCA'ya çok benzer, ancak her iki yaklaşım arasındaki cebirsel farkı yansıtan örnek vektörler üzerinde bir kovaryans matrisi yerine doğrudan çalışır. " Ancak, daha sonra şöyle der: " …
12 pca  scikit-learn  svd  scipy 

2
Ana bileşenlerin sayısını belirlemek için PCA için çapraz doğrulama nasıl yapılır?
Temel bileşen analizi için kendi fonksiyonumu yazmaya çalışıyorum, PCA (tabii ki zaten yazılmış çok şey var ama sadece kendi başıma bir şeyler uygulamakla ilgileniyorum). Karşılaştığım temel sorun çapraz doğrulama adımı ve öngörülen karelerin toplamının (PRESS) hesaplanmasıdır. Hangi çapraz doğrulamayı kullandığım önemli değil, esasen arkasındaki teori ile ilgili bir soru, ancak …

4
Sadece mesafe matrisi ile PCA gerçekleştirmek
Sadece çift mesafelere sahip olduğum büyük bir veri kümesini kümelemek istiyorum. Bir k-medoid algoritması uyguladım, ancak çalışması çok uzun sürüyor, bu yüzden PCA'yı uygulayarak sorunumun boyutunu azaltarak başlamak istiyorum. Ancak, bu yöntemi gerçekleştirmenin tek yolu benim durumumda olmayan kovaryans matrisini kullanmaktır. PCA'yı sadece çift mesafeleri bilerek uygulamak için bir yol …

2
PCA çözümleri benzersiz mi?
PCA'yı belirli bir veri kümesinde çalıştırdığımda, çözüm bana benzersiz mi? Yani, interpoint mesafelerine göre bir dizi 2d koordinat elde ederim. Bu kısıtlamaları karşılayacak noktalardan en az bir tane daha düzenleme bulmak mümkün müdür? Cevabınız evet ise, bu kadar farklı bir çözümü nasıl bulabilirim?
12 pca 

4
Çok yüksek boyutsal veriler için PCA nasıl yapılır?
Temel bileşen analizi (PCA) yapmak için, her bir sütunun ortalamalarını verilerden çıkarmanız, korelasyon katsayı matrisini hesaplamanız ve sonra özvektörleri ve özdeğerleri bulmanız gerekir. Daha doğrusu, Python'da uygulamak için yaptığım şey, sadece korelasyon katsayısı matrisini (corrcoef) bulma yöntemi yüksek boyutsallığa sahip bir dizi kullanmama izin vermediği için sadece küçük matrislerle çalışıyor. …
12 pca  python 


1
PCA ve PLS'de “yüklemeler” ve “korelasyon yüklemeleri” arasındaki fark nedir?
Temel Bileşen Analizi (PCA) yaparken yapılacak ortak bir şey, değişkenler arasındaki ilişkileri araştırmak için birbirine karşı iki yük çizmektir. Temel Bileşen Regresyonu ve PLS regresyonu yapmak için PLS R paketine eşlik eden makalede , korelasyon yükleme grafiği olarak adlandırılan farklı bir grafik vardır (makalede şekil 7 ve sayfa 15'e bakınız). …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.