Soru her şeyi söylüyor. Her ikisini de KS'yi ikiye eşit veya daha büyük bir boyuta genelleştiremediğini ve Sayısal Tarifler'deki gibi ünlü uygulamaların yanlış olduğunu okudum . Neden böyle olduğunu açıklar mısınız?
Soru her şeyi söylüyor. Her ikisini de KS'yi ikiye eşit veya daha büyük bir boyuta genelleştiremediğini ve Sayısal Tarifler'deki gibi ünlü uygulamaların yanlış olduğunu okudum . Neden böyle olduğunu açıklar mısınız?
Yanıtlar:
Söz konusu paragrafın ilgili kısmını alıntılamanın meşru olduğuna inanıyorum:
3. KS testi iki veya daha fazla boyutta uygulanamaz. Gökbilimcilerin genellikle bir çizgi boyunca değil, bir düzlemde veya daha yüksek boyutlarda dağıtılmış noktaları olan veri kümeleri vardır. Astronomik literatürdeki birkaç makale iki boyutlu KS testi sunma iddiasındadır ve biri ünlü cilt Sayısal Tarifler'de çoğaltılmıştır. Bununla birlikte, EDF tabanlı hiçbir test (KS, AD ve ilgili testleri içerir) iki veya daha yüksek boyutlarda uygulanamaz, çünkü noktaları iyi tanımlanmış EDF'ler arasındaki mesafelerin hesaplanabilmesi için benzersiz bir yol yoktur. Bazı sıralama prosedürüne dayalı bir istatistik oluşturulabilir ve daha sonra iki veri kümesi (veya bir veri kümesi ve bir eğri) arasındaki supremum mesafeleri hesaplanabilir. Ancak ortaya çıkan istatistiğin kritik değerleri dağıtımdan bağımsız değildir.
Belirtildiği gibi, bu çok güçlü görünüyor.
1) İki değişkenli dağıtım işlevi, bir harita için . Yani, işlev 0 ile 1 arasında tek değişkenli gerçek değerler alır . Bu değerler - olasılıklar - kesinlikle "sipariş edilir" - ve bu (işlevin değeri) ECDF tabanlı testler için karşılaştırmalar yapmamız gereken şeydir. . Benzer şekilde, ecdf, iki değişkenli durumda mükemmel bir şekilde tanımlanmıştır.
Metnin önerdiği gibi, tek değişkenli bir değişkenin bazı fonksiyonlarına dönüştürmeye çalışmanın bir gereklilik olduğunu düşünmüyorum. Siz sadece hesaplayın ve gereken her kombinasyonda ve farkı hesaplayın.
2) Ancak, dağıtımdan bağımsız olup olmadığı sorusunda bir anlamı vardır:
a) Açıkçası böyle bir test istatistiği, iki değişkenli bağımsız üniformaların bir testi olarak inşa edildiğinde, marjların dönüşümlerindeki değişikliklerle değiştirilmeyecektir, , daha sonra bağımsız bir test olarak eşit derecede iyi çalışır nerede . Bu anlamda dağıtımdan yoksun ('marjsız' diyebiliriz).
b) bununla birlikte, daha genel anlamda KS istatistiğinin naif bir versiyonunun (daha önce tarif ettiğim gibi) daha genel olarak dağıtımdan özgür olmadığı temel bir nokta vardır; basitçe dönüşemeyiz keyfi olarak .
Cevabımın önceki bir versiyonunda dedim ki:
Zorluk yok, sorun yok
Bu yanlış. Daha önce de belirtildiği gibi, iki değişkenli bağımsız üniformaların marjlarında bir değişiklik olmadığı takdirde gerçekten de sorunlar var. Bununla birlikte, bu zorluklar, Kolmogorov-Smirnov istatistiklerinin bu sorundan muzdarip olmayan iki değişkenli / çok değişkenli versiyonlarını veren birkaç makalede çeşitli şekillerde ele alınmıştır.
Geri dönüp bu referanslardan bazılarını ve zamanın izin verdiği anda nasıl çalıştıklarını tartışabilirim.