«pca» etiketlenmiş sorular

Temel bileşen analizi (PCA) doğrusal boyutsallık azaltma tekniğidir. Çok değişkenli bir veri kümesini olabildiğince fazla bilgi (varyans) koruyan daha küçük bir yapılandırılmış değişken grubuna indirger. Temel bileşenler olarak adlandırılan bu değişkenler, giriş değişkenlerinin doğrusal kombinasyonlarıdır.

1
R fonksiyonları 'princomp' ve 'prcomp' neden farklı özdeğerler veriyor?
Bunu yeniden üretmek için dekatlon veri kümesini {FactoMineR} kullanabilirsiniz. Soru, hesaplanan özdeğerlerin kovaryans matrisininkinden farklı olmasının nedenidir. İşte kullanarak özdeğerler princomp: > library(FactoMineR);data(decathlon) > pr <- princomp(decathlon[1:10], cor=F) > pr$sd^2 Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 1.348073e+02 2.293556e+01 9.747263e+00 1.117215e+00 3.477705e-01 1.326819e-01 Comp.7 Comp.8 Comp.9 Comp.10 6.208630e-02 4.938498e-02 2.504308e-02 4.908785e-03 …
22 r  pca 

2
PCA zaman serisi verileri için uygulanabilir mi?
Temel Bileşen Analizinin (PCA) temel olarak kesitsel veriler için uygulanabileceğini anlıyorum. PCA, yılı zaman serisi değişkeni olarak belirterek ve PCA'yı normal şekilde çalıştırarak zaman serisi verileri için etkili bir şekilde kullanılabilir mi? Dinamik PCA'nın panel verileri için çalıştığını ve Stata'daki kodlamanın zaman serileri için değil panel verileri için tasarlandığını buldum. …
22 time-series  pca 

2
olduğunda "birim varyans" ridge regresyon tahmincisi sınırı
Çıkıntı regresyonunu, nin birim kareler toplamına sahip olmasını gerektiren ek bir kısıtlama ile düşünün (eşdeğerde birim sapma); Gerekirse, kişi birim toplamı da olduğu varsayılabilir :y^y^\hat{\mathbf y}yy\mathbf y β^∗λ=argmin{∥y−Xβ∥2+λ∥β∥2}s.t.∥Xβ∥2=1.β^λ∗=arg⁡min{‖y−Xβ‖2+λ‖β‖2}s.t.‖Xβ‖2=1.\hat{\boldsymbol\beta}_\lambda^* = \arg\min\Big\{\|\mathbf y - \mathbf X \boldsymbol \beta\|^2+\lambda\|\boldsymbol\beta\|^2\Big\} \:\:\text{s.t.}\:\: \|\mathbf X \boldsymbol\beta\|^2=1. β^∗λβ^λ∗\hat{\boldsymbol\beta}_\lambda^* ne zaman \ lambda \ to \ infty sınırı …

3
PCA, boyutluluk örneklem sayısından büyük olduğunda
Bir sınıflandırıcıya geçmem gereken 14000 veri noktası (boyut) içeren 10 kişi için 10 sinyal / kişi (yani 100 örnek) bulunan bir senaryoya rastladım. Bu verinin boyutunu azaltmak istiyorum ve PCA bunu yapmanın yolu gibi görünüyor. Ancak, PCA'nın örneklerini yalnızca örnek sayısının boyut sayısından büyük olduğu yerlerde bulabildim. SVD kullanarak PC'leri …

3
Rastgele verilerin SVD sonuçlarındaki garip korelasyonlar; matematiksel bir açıklaması var mı yoksa LAPACK hatası mı?
Hem Matlab hem de R'de çoğaltılabileceğim rastgele verilerin SVD sonucunda çok garip bir davranış gözlemliyorum. LAPACK kütüphanesinde sayısal bir sorun gibi görünüyor; bu mu? Sıfır ortalama ve kimlik kovaryansına sahip boyutlu Gaussian'dan n=1000n=1000n=1000 örnek çiziyorum : . Onları veri matrisi . (İsteğe bağlı olarak merkezleyebilir ya da değil, aşağıdakileri etkilemez.) …

4
Fonksiyonel temel bileşen analizi (FPCA): hepsi ne hakkında?
Fonksiyonel temel bileşen analizi (FPCA) tökezlediğim ve asla anlayamadığım bir şey. Bütün bunlar ne hakkında? Bkz Shang 2011 tarafından "işlevsel temel bileşenler analizinin bir anket" ve ben gerekçe ediyorum: PCA, “boyutsallığın laneti” nedeniyle fonksiyonel verilerin analizinde ciddi zorluklarla karşılaşmaktadır (Bellman 1961). “Boyutsallığın laneti” yüksek boyutlu uzayda veri esnekliğinden kaynaklanmaktadır. PCA'nın …

2
NumA ve sklearn'te PCA farklı sonuçlar üretir
Bir şeyi yanlış mı anlıyorum. Bu benim kodum sklearn kullanma import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from sklearn import decomposition from sklearn import datasets from sklearn.preprocessing import StandardScaler pca = decomposition.PCA(n_components=3) x = np.array([ [0.387,4878, 5.42], [0.723,12104,5.25], [1,12756,5.52], [1.524,6787,3.94], ]) pca.fit_transform(x) Çıktı: array([[ -4.25324997e+03, …

4
PCA alanına yeni bir vektör nasıl yansıtılır?
Temel bileşen analizi (PCA) yaptıktan sonra, PCA alanına yeni bir vektör yansıtmak istiyorum (yani PCA koordinat sistemindeki koordinatlarını bulmak). PCA'yı R dilinde kullanarak hesapladım prcomp. Şimdi vektörümü PCA dönme matrisi ile çarpabilmeliyim. Bu matristeki temel bileşenler satır veya sütunlar halinde mi düzenlenmelidir?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

1
PCA / yazışma analizindeki “at nalı etkisi” ve / veya “kemer etkisi” nedir?
Ekolojik istatistiklerde çok boyutlu verilerin keşifsel veri analizi için birçok teknik vardır. Bunlara 'koordinasyon' teknikleri denir. Birçoğu istatistiklerin başka yerlerindeki ortak tekniklerle aynı veya yakından ilişkilidir. Belki de prototip örnek temel bileşenler analizi (PCA) olabilir. Ekolojistler, 'degradeleri' keşfetmek için PCA'yı ve ilgili teknikleri kullanabilirler (Bir degradenin ne olduğunu tam olarak …

2
PCA'ya göre SVD'nin herhangi bir avantajı var mı?
PCA ve SVD'nin matematiksel olarak nasıl hesaplanacağını biliyorum ve her ikisinin de Doğrusal En Küçük Kareler regresyonuna uygulanabileceğini biliyorum. SVD'nin matematiksel olarak ana avantajı, kare olmayan matrislere uygulanabileceği gibi görünüyor. Her ikisi de matrisinin ayrışmasına odaklanır . Bahsedilen SVD'nin avantajı dışında, PCD'ye göre SVD kullanılarak sağlanan ek avantajlar veya öngörüler …
20 pca  least-squares  svd 

2
Faktör skorlarını hesaplama yöntemleri ve PCA veya faktör analizinde “skor katsayısı” matrisi nedir?
Anladığım kadarıyla, PCA'da korelasyonlara dayalı olarak, değişkenler ve faktörler arasındaki korelasyonlardan başka bir şey olmayan faktör (bu örnekte ana bileşen) yükleri alıyoruz. Şimdi SPSS'de faktör puanları üretmem gerektiğinde, her bir faktörün her bir katılımcısının faktör puanlarını doğrudan alabilirim. " Bileşen skor katsayısı matrisini " (SPSS tarafından üretilen şekilde) standartlaştırılmış orijinal …

3
R'deki rollapply PCA'da “jumpy” yüklemeleri alıyorum.
28 farklı para birimi için 10 yıllık günlük getiri verilerim var. İlk temel bileşeni çıkarmak istiyorum, ancak PCA'yı 10 yıl boyunca çalıştırmak yerine, 2 yıllık bir pencere açmak istiyorum, çünkü para birimlerinin davranışları gelişiyor ve bu yüzden bunu yansıtmak istiyorum. Ancak büyük bir sorunum var, yani hem princomp () hem …
20 r  pca 

6
Gauss olmayan verilerin PCA'sı
PCA hakkında birkaç hızlı sorum var: PCA , veri kümesinin Gauss olduğunu varsayıyor mu? Doğası gereği doğrusal olmayan verilere bir PCA uyguladığımda ne olur? Bir veri kümesi verildiğinde, işlem ilk önce normalleştirmek, varyansı 1'e ayarlamak, bir SVD almak, sıralamayı azaltmak ve son olarak veri kümesini yeni düşük sıralı alanla eşlemektir. …
20 pca  svd 

4
Uç durumlarda hassaslık ve geri çağırma için doğru değerler nelerdir?
Hassasiyet şu şekilde tanımlanır: p = true positives / (true positives + false positives) Gibi, bu doğru mu true positivesve false positiveshassas 1 yaklaşır yaklaşım 0? Hatırlama için aynı soru: r = true positives / (true positives + false negatives) Şu anda bu değerleri hesaplamam gereken bir istatistiksel test uyguluyorum …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.