2B karede noktaların dağılımının eşitliğini ölçün


11

Bir 2D karem var ve içinde 1000 puan olan bir dizi noktam var. Kare içindeki noktaların dağılımının yayıldığını (veya daha fazla veya daha az düzgün bir şekilde dağıtıldığını) veya karenin içindeki bir noktada bir araya gelme eğiliminde olup olmadığını görmek için bir yola ihtiyacım var.

Bunu belirlemek için bir matematiksel / istatistiksel (programlama değil) yoluna ihtiyacım var. Google'a gittim, uyum iyiliği, Kolmogorov vb. Gibi bir şey buldum ve bunu başarmak için başka yaklaşımlar olup olmadığını merak ettim. Sınıf kağıdı için buna ihtiyacınız var.

Girişler: 2B kare ve 1000 nokta. Çıktı: evet / hayır (evet = eşit dağılmış, hayır = bazı noktalarda bir araya geliyor).


1
Sizin için "eşit olarak dağıtılmış" olanı yeterince açık bir şekilde ifade etmediniz. Eşit olarak döşenmiş 2D üniforma küpü veya başka bir şey mi demek istediniz? Örneğin, eşit aralıklı nokta zinciri? veya bir nokta çemberi mi? Bir anlamda, bu rakamlar aynı şekilde formalardır.
ttnphns

3
@ttnphns Bu bağlamda, "üniforma" iyi bilinen geleneksel bir anlama sahiptir. Sabit yoğunluklu bir Poisson sürecine karşılık gelir. Genellikle tamamen mekânsal olarak "CSR" olarak bilinir .
whuber

2
@Van "mekansal nokta süreçleri" ni araştırmak istiyorsunuz. İyi anahtar kelimeler arasında "Ripley K işlevi," "CSR" ve "Poisson" sayılabilir. Sizin için erişilebilir bir referans O'Sullivan & Unwin, Coğrafi Bilgi Analizi olacaktır. Bir klasik Ripley, Mekansal İstatistikler : nokta süreçlerine odaklanır. Uygulamalar için CrimeStat'a hızlı bir göz atın . Eğer memnun kalırsanız R, orada bu görev için araçlar bol .
whuber

Yanıtlar:


5

Sanırım @John'un ki-kare testi fikri bir yoludur.

2-b'de yamalar istersiniz, ancak 1 yönlü bir ki-kare testi kullanarak bunları test etmek istersiniz; yani, hücreler için beklenen değerler ; burada N, hücre sayısıdır.1000N-

Ancak farklı sayıda hücrenin farklı sonuçlar vermesi mümkündür.

Başka bir olasılık, noktalar arasındaki ortalama mesafeyi hesaplamak ve daha sonra bunu o ortalamanın benzetilmiş sonuçlarıyla karşılaştırmaktır. Bu, rastgele sayıda hücre sorununu önler.

EDIT (ortalama uzaklık hakkında daha fazla bilgi)

1000 puanla, noktalar arasında çift ​​mesafe vardır. Bunların her biri hesaplanabilir (örneğin Öklid mesafesi kullanılarak). Bu mesafelerin ortalaması alınabilir.1000*9992

Daha sonra, eşit olarak dağıtılmış 1000 noktadan oluşan N (çok sayıda) dizi oluşturabilirsiniz. Bu N setlerinin her biri de noktalar arasında ortalama bir mesafeye sahiptir.

Bir p değeri elde etmek veya sadece nereye düştüklerini görmek için gerçek puanların sonuçlarını simüle edilmiş puanlarla karşılaştırın.


Ben tek örnek ki-kare ("anlaşma ki-kare testi") makul yollar arasında olduğunu kabul ediyorum. Ancak "ortalama mesafe" teklifinizle ilgili daha fazla ayrıntı verebilir misiniz? Tam olarak anlamadım.
ttnphns

@ttnphns, uzamsal analizde kullanılanlar en yakın komşu testidir (diğer adıyla Clark ve Evans testi) veya Ripley'nin K'si . Örnekler için R kütüphanesi spatstat veya CrimeStat belgelerine bakın. Simülasyona dayalı bir başka olasılık "tarama" testleridir, ancak bunlar ortalama mesafelere dayanmaz.
Andy W

3

Başka bir olasılık Chi-Squared testidir. Kareyi eşit büyüklükte çakışmayan yamalara bölün ve yamalara düşen noktaların sayılarını tekdüzelik hipotezi altında beklenen sayımlarına karşı test edin (bir yama beklentisi total_points / total_patch'dur). ve ki kare testi uygulayın. 1000 puan için 9 yama yeterli olmalıdır, ancak verilerinizin nasıl göründüğüne bağlı olarak daha fazla ayrıntı düzeyi kullanmak isteyebilirsiniz.


1
Sanırım her bir hücredeki gerçek sayıları beklenen eşit sayıda hücre ile karşılaştırmak için uygun bir ki-kare iyiliği istiyorsunuz. Bir olasılık testinin kullanılması, hücreleriniz arasında tekdüze dağılım olup olmadığını, yalnızca satır sütuna bağlıysa Sınama ETMEZ.
John

Ayrıca, ki-kare testi sadece seçtiğiniz hücreler arasında tek tip olmadıklarını söyleyecektir. Üniforma olup olmadıklarını söylemez.
John

Evet, tekdüzelik hipotezi altında beklenen sayılarına karşı sayımları kastediyordum, açık olmasaydı özür dilerim. Sadece deneyimsizler için neler olup bittiğini anlamaya yardımcı olan bir tablo olarak görselleştirebilirsiniz! Ve tabii ki soyut anlamda tekdüzelik yerine seçtiğiniz hücrelere karşı test
Ben Allison

John, tipik olarak bu "dağılım testi" yapıldığında tipik olarak iki taraflı bir test yapılır. Desenin şans eseri beklenenden daha düzgün olup olmadığını görmek istiyorsanız, ki-kare testinin dağılımın sol kuyruğuna düştüğünü (tercih ettiğiniz herhangi bir kesimde) görebilirsiniz.
Andy W

Andy, bu iki taraflı uyum iyiliği testinin ayrıntılarını veren bir cevap vermelisin. Genellikle iki taraflı testler null değerine iki farklı alternatifi test eder ancak yine de null değerini gösteremez. Teklifin ilgi çekici.
John

1

Neden Kolmogorov-Smirnov testini kullanmıyorsunuz? Özellikle örneklem büyüklüğünüzün güç eksikliğini telafi edecek kadar büyük olduğunu düşünürdüm.

Alternatif olarak, bazı simülasyonlar yapabilirsiniz. Titiz değil, ancak verilerin aynı şekilde dağıtılıp dağıtılmadığına dair bazı kanıtlar sunuyor.


@whuber KS'nin 2 boyutlu uzantısı iyi bilinmektedir ( buraya bakınız ). Bu durumda, bu 1000 çekilişin (koordinatlar (x, y)) 2 boyutlu birleşik tekdüze dağılımdan çizilip çizilemeyeceğini araştırıyoruz - en azından "eşit olarak yayıldı". @John Kendimi beceriksizce ifade edebilirdim (ne matematik ne de İngilizce benim ilk dillerim). Demek istediğim, tam p-değeri KS gibi bir test kullanılarak hesaplanabiliyordu, oysa p-değeri (ya da eşdeğeri denir ne olursa olsun) simülasyonlar yaparken sadece asimptotik eğilimliydi.


Simülasyon neden titiz olmaz?
John

1
Sürekli bir rastgele değişkenin sonuçları olduğu varsayılan gerçek sayı kümeleri için tasarlanan KS testinin bu uzamsal veri kümesine nasıl uygulanacağını açıklayabilir misiniz ?
whuber

@whuber Yanıtınıza cevap vermek için yanıtımı düzenledim. En iyi.
abaumann

@John Ne demek istediğimi açıklamaya çalıştım. En iyi.
abaumann
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.