Eşitliği test etmek yaygın bir şeydir, ancak çok boyutlu bir nokta bulutu için bunu yapmanın yöntemlerinin ne olduğunu merak ediyorum.
Eşitliği test etmek yaygın bir şeydir, ancak çok boyutlu bir nokta bulutu için bunu yapmanın yöntemlerinin ne olduğunu merak ediyorum.
Yanıtlar:
artar - çoğu uygulamada null K fonksiyonu için simülasyon yoluyla bir güven bandı kurulur ve gezileri tespit etmek için gözlenen K fonksiyonu fazla çizilir. Bazı düşünce ve deneyimlerle, geziler belirli mesafelerde kümelenme eğilimleri açısından yorumlanabilir.
Sorunun düşündüğümden daha zor olduğu ortaya çıktı. Yine de ödevimi yaptım ve etrafa baktıktan sonra, Ripley'in işlevlerine ek olarak çeşitli boyutlarda tekdüzelik test etmek için iki yöntem buldum.
Her unf
iki testi de uygulayan bir R paketi yaptım . Sen indirebilirsiniz github de https://github.com/gui11aume/unf . Büyük bir kısmı C'dir, bu nedenle makinenizde derlemeniz gerekecektir R CMD INSTALL unf
. Uygulamanın dayandığı makaleler pakette pdf formatındadır.
library(unf)
set.seed(123)
# Put 20 points uniformally in the 5D hypercube.
x <- matrix(runif(100), ncol=20)
liang(x) # Outputs the p-value of the test.
[1] 0.9470392
İkinci yaklaşım daha az konvansiyoneldir ve minimum yayılan ağaçlar kullanır . İlk çalışma, iki çok değişkenli numunenin aynı dağıtımdan gelip gelmediğini test etmek için 1979'da Friedman ve Rafsky tarafından (pakette referans olarak) gerçekleştirildi. Aşağıdaki görüntü prensibi göstermektedir.
İki değişkenli örnekten alınan noktalar, orijinal örneklerine (sol panel) bağlı olarak kırmızı veya mavi olarak çizilir. İki boyutta toplanan örneğin minimum yayılma ağacı hesaplanır (orta panel). Bu, minimum kenar uzunluğu toplamına sahip ağaçtır. Ağaç, tüm noktaların aynı etiketlere sahip olduğu alt ağaçlarda ayrıştırılır (sağ panel).
Aşağıdaki şekilde, sağdaki panelde de görebileceğiniz gibi, işlemin sonunda ağaç sayısını azaltan mavi noktaların toplandığı bir durum gösteriyorum. Friedman ve Rafsky, bir test yapılmasına izin veren süreçte elde edilen ağaç sayısının asimptotik dağılımını hesapladılar.
Çok değişkenli bir numunenin homojenliği için genel bir test oluşturma fikri 1984 yılında Smith ve Jain tarafından geliştirildi ve C'de Ben Pfaff (pakette referans) tarafından uygulandı. İkinci numune, ilk örneğin yaklaşık dışbükey gövdesinde eşit olarak üretilir ve Friedman ve Rafsky'nin testi iki örnek havuzunda gerçekleştirilir.
Yöntemin avantajı, sadece hiperküp üzerinde değil, her dışbükey çok değişkenli şekil üzerinde homojenliği test etmesidir. Güçlü dezavantaj, testin rastgele bir bileşene sahip olmasıdır, çünkü ikinci numune rastgele üretilir. Elbette, tekrarlanabilir bir cevap almak için testi tekrarlayabilir ve sonuçları ortalayabilir, ancak bu kullanışlı değildir.
Önceki R oturumu devam ederken, işte böyle devam ediyor.
pfaff(x) # Outputs the p-value of the test.
pfaff(x) # Most likely another p-value.
Kodu github'dan kopyalamak / çatallamaktan çekinmeyin.