Bir korelasyon matrisinin özdeğerlerinin dağılımının sezgisi / yorumu?


13

Bir korelasyon matrisinin özdeğerlerinin dağılımına dair sezginiz / yorumunuz nedir? Genellikle en büyük 3 öz değerin en önemli olduğunu, sıfıra yakın olanların ise gürültü olduğunu duyma eğilimindeyim. Ayrıca, doğal olarak meydana gelen özdeğer dağılımlarının rastgele korelasyon matrislerinden hesaplananlardan (yine, sinyalden gelen sinyali ayırt eden) ne kadar farklı olduğunu araştıran birkaç araştırma makalesi gördüm.

Lütfen görüşlerinizi açıklamaktan çekinmeyin.


Herhangi bir özel uygulamanız var mı, yani herhangi bir uygulama dışında (yani saf matematiksel bir tarafta) kaç EV'yi göz önünde bulundurmamız gerektiğine dair genel öneriler mi arıyorsunuz yoksa belirli bir bağlam için mi (örn. Faktör analizi, PCA vb.)?
chl

Daha çok matematiksel tarafla, yani bir korelasyon matrisinin altında yatan verinin bir özelliği olarak özdeğerlerle ilgileniyorum. Bunu belirli bir bağlam açısından tartışmak mantıklıysa, bunu yapmaktan çekinmeyin.
Eduardas

Yanıtlar:


4

Genellikle en büyük 3 öz değerin en önemli olduğunu, sıfıra yakın olanların ise gürültü olduğunu duyma eğilimindeyim

Bunu test edebilirsiniz. Daha fazla ayrıntı için bu yayında bağlantı verilen makaleye bakın . Yine, finansal zaman serileri ile uğraşmanız durumunda önce leptokurtisiteyi düzeltmek isteyebilirsiniz (yani ham getirileri değil, garch ayarlı getiriler serisini düşünün).

Doğal olarak oluşan özdeğer dağılımlarının rastgele korelasyon matrislerinden hesaplananlardan (yine, sinyalden gelen sinyali ayırt eden) ne kadar farklı olduğunu araştıran birkaç araştırma makalesi gördüm.

Edward:> Genellikle, bunu başka bir yolla yapardınız: İstediğiniz uygulamadan gelen özdeğerlerin (korelasyon matrislerinin) çok değişkenli dağılımına bakın. Özdeğerlerin dağılımı için güvenilir bir aday belirledikten sonra, onlardan üretmek oldukça kolay olmalıdır.

p10p

Düzenle (Shabbychef tarafından yazılan yorumlar)

dört adım prosedürü:

  1. j=1,...,JC~jj
  2. jΛ~j= log(λ~1j)log(λ~pj)C~j
  3. CV(Λ~)J×pΛ~j
  4. CV(Λ~)wiCV(Λ~)wi=γii=1pγiγi

J2


1
Merak ediyorum: hile nedir?
shabbychef

C~

λ1

Bu çok garip bir prosedür; bir yerde yayınlandı mı?
shabbychef

@Shabbychev:> hayır, ancak bir süre önce ilgili bir sorun üzerinde çalışma fırsatı buldum (sadece bir zaman serisini içeren değil) (bununla aynı sorun stats.stackexchange.com/questions/2572/… )
user603

11

Özdeğerler, veri yayılımının temel bileşenlerinin büyüklüğünü verir.



(3001)π/4


2

k

Genellikle ilk öz portföy, her isimde neredeyse eşit ağırlıklı, yani eşit dolar ağırlığına sahip tüm varlıklardan oluşan 'pazar' portföyüdür. İkinci özdeğer portföyü, hangi zaman periyoduna baktığınıza bağlı olarak bazı anlamsal anlamlara sahip olabilir: örneğin çoğunlukla enerji stokları veya banka hisse senetleri, vb. ve bu kısmen evren seçimine ve dikkate alınan süreye bağlıdır. Bu gayet iyi çünkü genellikle beşinci özdeğer ya da öylesine Marchenko-Pastur dağılımının getirdiği sınırların çok ötesinde değil.


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.