(Aşağıdaki cevap sadece [0] 'da kanıtlanmış teoremi ortaya koyar ve ifade eder. Bu makaledeki güzellik, argümanların çoğunun temel lineer cebir açısından yapılmış olmasıdır. Bu soruyu cevaplamak için ana sonuçları belirtmek yeterli olacaktır; elbette, orijinal kaynağı kontrol edin).
Verilerin çok değişkenli deseni ile tarif edilebilir herhangi bir durumda değişken eliptik dağılımı, istatistiksel çıkarım, tanımı gereği, bir montaj (ve karakterize) sorununa azaltacaktır k değişken yer vektörü (ki θ ) ve k ile verilere simetrik yarı pozitif belirli matris (say ). Aşağıda açıkladığım nedenlerle (ancak zaten tesis olarak varsaydığınız), bir şekil bileşenine ( aynı boyutta bir SPSD matrisi) daha anlamlıkkθkΣ Σ Σ σ SkΣΣΣ) çok değişkenli dağılımınızın yoğunluk konturlarının şeklini ve bu konturların ölçeğini ifade eden bir skaler .σS
Tek değişkenli verilerde ( ), , verilerinizin kovaryans matrisi bir ve aşağıdaki tartışmadan itibaren, şekil bileşeni , böylece eşittir ölçek bileşeni her zaman ve hiçbir belirsizlik mümkün değildir.Σ Σ Σ Σ = σ Sk=1ΣΣΣΣ=σS
Çok değişkenli verilerde, birçok ölçekleme fonksiyonu seçimi mümkündür. Özellikle biri ( ) arzu edilen bir anahtar özelliğe sahip olarak göze . Bu, eliptik aileler bağlamında tercih edilen ölçeklendirme faktörü seçimini yapmalıdır.σ S = | ΣσSσS=|ΣΣ|1/k
MV istatistiklerindeki birçok problem, fonksiyonunda (al) simetrik yarı pozitif kesin olarak tanımlanan bir dağılım matrisinin tahmin edilmesini
ve tatmin edilmesini içerir:R k × kΣRk×k
A b
(0)Σ(AX+b)=AΣ(X)A⊤
(sigara tekil matrisler için ve vektörler ). Örneğin, klasik kovaryans tahmini (0) 'ı tatmin eder, ancak hiçbir şekilde tek değildir.
Ab
Tüm yoğunluk konturlarının aynı şekil matrisi tarafından tanımlanan elipsler olduğu eliptik dağıtılmış verilerin varlığında, bir skaler ile kadar, formun normalleştirilmiş sürümlerini dikkate almak doğaldır :Σ
VS=Σ/S(Σ)
burada , tatmin edici 1-onurlu bir işlevdir:S
(1)S(λΣ)=λS(Σ)
tüm . Sonra , dağılım matrisinin şekil bileşeni (kısa şekil matrisinde) ve dağılım matrisinin ölçek bileşeni olarak adlandırılır. Kayıp fonksiyonunun sadece şekil bileşeni bağlı olduğu çok değişkenli tahmin problemlerine örnek olarak diğerleri arasında küresellik, PCA ve CCA testleri dahildir.V S σ S = S 1 / 2 ( Σ ) Σ V Sλ>0VSσS=S1/2(Σ)ΣVS
Tabii ki, birçok olası ölçekleme işlevi vardır, bu nedenle bu, normalleştirme işlevi birkaç seçeneğinin (varsa) bir anlamda optimal olduğu sorusunu hala açık bırakır . Örneğin:S
- S=tr(Σ)/k (örneğin OP'nin sorusunun altındaki yorumunda @amoeba tarafından önerilen metin. Ayrıca bkz. [1], [2], [3])
- S=|Σ|1/k ([4], [5], [6], [7], [8])
- Σ11 (kovaryans matrisinin ilk girişi)
- Σλ1(Σ) ilk öz )Σ
Bununla birlikte, , yerel olarak asimptotik olarak normal ailelerde karşılık gelen ölçek ve şekil tahminleri için Fisher Information matrisinin blok diyagonal olduğu tek ölçekleme işlevidir (ölçek ve kestirim probleminin şekil bileşenleri asimptotik olarak diktir) [0]. Bu, diğer şeylerin yanı sıra , belirtiminde belirtim herhangi bir verimlilik kaybına neden olmadığı tek seçimi olduğu anlamına gelir. .S=|Σ|1/kS=|Σ|1/kSσSVS
tatmin eden birçok olası seçenek için nispeten güçlü bir optimallik karakterizasyonu bilmiyorum (1).S
- [0] Paindaveine, D., Şeklin kanonik bir tanımı, İstatistik ve Olasılık Mektupları, Cilt 78, Sayı 14, 1 Ekim 2008, Sayfa 2240-2247. Kontrolsüz bağlantı
- [1] Dumbgen, L. (1998). Tyler'ın yüksek boyutlu saçılımının M-işlevselliği üzerine Ann. Öğr. Devletçi. Matematik. 50, 471-491.
- [2] Ollila, E., TP Hettmansperger ve H. Oja (2004). Afin eşdeğer çok değişkenli işaret yöntemleri. Baskı Öncesi, Jyvaskyla Üniversitesi.
- [3] Tyler, DE (1983). Saçılma matrislerinin sağlamlık ve verimlilik özellikleri, Biometrika 70, 411-420.
- [4] Dumbgen, L. ve DE Tyler (2005). Bazı çok değişkenli M-Fonksiyonellerinin arıza özellikleri, Scand. Statist. 32, 247-264.
- [5] Hallin, M. ve D. Paindaveine (2008). Saçılım homojenliği için optimum sıra tabanlı testler, Ann. Statist., Görünmek.
- [6] Salibian-Barrera, M., S. Van Aelst ve G. Willems (200 6). Hızlı ve sağlam bootstrap ile çok değişkenli MM tahmincilerine dayanan temel bileşenler analizi, J. Amer. Devletçi. Doç. 101, 1198–1211.
- [7] Taskinen, S., C. Croux, A. Kankainen, E. Ollila ve H. O ja (2006). Dağılım ve şekil matrislerine dayanan kanonik korelasyon ve vektör tahminlerinin etki fonksiyonları ve verimlilikleri, J. Multivariate Anal. 97, 359-384'te açıklanmaktadır.
- [8] Tatsuoka, KS ve DE Tyler (2000). S-Fonksiyonelleri ve M-fonksiyonellerinin eliptik olmayan dağılımlar üzerindeki tekliği üzerine, Ann. Devletçi. 28, 1219–1243'te açıklanmaktadır.