Bimodal dağılım testi


30

İki modlu bir dağılımın önemini "test etmek" için herhangi bir istatistiksel test olup olmadığını merak ediyorum. Demek istediğim, verilerim iki modlu dağılıma uyuyor mu değil mi? Eğer öyleyse, R programında herhangi bir test var mı?


3
Sitemizi arayarak bir cevap bulamadınız mı? Olmazsa, eksik olan ne?
whuber

7
İki modlu veya çoklu mod için testler var, ancak tek taraflı olma eğilimi var. Başka bir deyişle, "birden fazla mod var" gibi şeyleri sonlandırabilirsiniz, ancak "üç moddan daha az mod" olduğunu söyleyemezsiniz - modların sayısında daha düşük sınırlar elde edebilirsiniz ancak gerçekten üst sınırlar elde edemezsiniz çünkü herhangi bir sayıda mod içeren bir multimodal dağılım bulunabilir, bu sayede herhangi bir sayıda daha küçük mod içeren bir dağılıma keyfi olarak yakındır. Bazı açık testler veya referanslar bulabilir miyim bakacağım.
Glen_b -Reinstate Monica

4
İki modlu dağılımdaki wikipedia sayfası, tek modelliğe karşı çoklu mod için sekiz test listeliyor ve bunlardan yedi tanesine referans veriyor. R'de olup olmadığından emin değilim. Bakacağım.
Glen_b -Reinstate Monica

Yanıtlar:


17

Bu konuya olası bir başka yaklaşım, gördüğünüz verileri üreten sahnelerin ardında neler olabileceğini düşünmektir. Yani, bir karışım modeli , örneğin bir Gauss karışımı modeli olarak düşünebilirsiniz . Örneğin, verilerinizin tek bir normal popülasyondan veya iki normal dağılımın (bazı oranlarda) farklı araçlarla ve farklılıklar içeren bir karışımından alındığına inanabilirsiniz. Tabii ki, sadece bir veya iki olduğuna inanmak zorunda değilsiniz, ya da verilerin alındığı popülasyonların normal olması gerektiğine inanmak zorunda değilsiniz.

Karışım modellerini tahmin etmenizi sağlayan (en az) iki R paketi vardır. Bir paket flexmix , diğeri mclust . İki aday modeli tahmin ettikten sonra, bir olasılık oranı testi yapmanın mümkün olabileceğine inanıyorum. Alternatif olarak, parametrik önyükleme çapraz montaj yöntemini ( pdf ) kullanabilirsiniz.


Hi @gung, parametrik önyükleme çapraz-fitting yöntemi için, iki modlu dağılım için en uygun kriteri nasıl tanımlarsınız? İki rakip dağıtımın birbirini iki noktada geçtiği bir durum olabilir. Böyle bir durumda ne yapılmalı?
akashrajkn

32

Yorumlarda belirtildiği gibi, 'Bimodal dağıtım' hakkındaki Wikipedia sayfası, tekdüzelliğe karşı multimodalite için sekiz test listeliyor ve bunlardan yedi tanesine referans veriyor.

R'de en az bazıları var. Örneğin:

  1. Paket diptestHartigan'ın dip testini uygular.

  2. stampVeri bootstrappaketi Efron ve Tibshirani en kullanılmıştır bootstrap giriş modlarının sayısı önyükleyebilir ilişkin bir örnek yapmak (paket dayandığı kitabı); Eğer kitaba erişiminiz varsa, bu yaklaşımı kullanabilirsiniz.

    Efron, B. ve Tibshirani, R. (1993) Bootstrap'a Giriş .
    Chapman ve Salonu, New York, Londra.

-

CV'de, @ whuber'un aramasının ortaya çıktığı modların sayısını belirlemek (yani test etmek yerine tahmin etmek) hakkında konuşan bir soru var. Buradaki cevapları okumaya değer. Buradaki yanıtlardan biri (olduğu gibi, benimsem), bu makaleyi David Donoho'nun, elbette bir test olarak kullanılabilecek modların sayısı için tek taraflı CI'lar oluşturma konusunda ortaya koyan bir Google arama bağlantısı var. , tek taraflı aralık, tek biçimli durum içermiyorsa, tek biçimliliği reddedebilirsiniz). Benim bilmediğim kadarıylaWikipedia'nın bahsettiği testlerden biri. Bu aralığın R uygulaması olduğunu sanmıyorum, ancak (Donoho'nun tartışmasında oldukça karmaşık araçları kullanma eğiliminde olmasına rağmen) uygulanması oldukça basit bir fikir. Bu fikir doğrudan çekirdek yoğunluğu kestirimi kullanma kavramıyla ilgilidir.


Bu değerli bir iş.
rolando2,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.