İki modlu bir dağılımın önemini "test etmek" için herhangi bir istatistiksel test olup olmadığını merak ediyorum. Demek istediğim, verilerim iki modlu dağılıma uyuyor mu değil mi? Eğer öyleyse, R programında herhangi bir test var mı?
İki modlu bir dağılımın önemini "test etmek" için herhangi bir istatistiksel test olup olmadığını merak ediyorum. Demek istediğim, verilerim iki modlu dağılıma uyuyor mu değil mi? Eğer öyleyse, R programında herhangi bir test var mı?
Yanıtlar:
Bu konuya olası bir başka yaklaşım, gördüğünüz verileri üreten sahnelerin ardında neler olabileceğini düşünmektir. Yani, bir karışım modeli , örneğin bir Gauss karışımı modeli olarak düşünebilirsiniz . Örneğin, verilerinizin tek bir normal popülasyondan veya iki normal dağılımın (bazı oranlarda) farklı araçlarla ve farklılıklar içeren bir karışımından alındığına inanabilirsiniz. Tabii ki, sadece bir veya iki olduğuna inanmak zorunda değilsiniz, ya da verilerin alındığı popülasyonların normal olması gerektiğine inanmak zorunda değilsiniz.
Karışım modellerini tahmin etmenizi sağlayan (en az) iki R paketi vardır. Bir paket flexmix , diğeri mclust . İki aday modeli tahmin ettikten sonra, bir olasılık oranı testi yapmanın mümkün olabileceğine inanıyorum. Alternatif olarak, parametrik önyükleme çapraz montaj yöntemini ( pdf ) kullanabilirsiniz.
Yorumlarda belirtildiği gibi, 'Bimodal dağıtım' hakkındaki Wikipedia sayfası, tekdüzelliğe karşı multimodalite için sekiz test listeliyor ve bunlardan yedi tanesine referans veriyor.
R'de en az bazıları var. Örneğin:
Paket diptest
Hartigan'ın dip testini uygular.
stamp
Veri bootstrap
paketi Efron ve Tibshirani en kullanılmıştır bootstrap giriş modlarının sayısı önyükleyebilir ilişkin bir örnek yapmak (paket dayandığı kitabı); Eğer kitaba erişiminiz varsa, bu yaklaşımı kullanabilirsiniz.
Efron, B. ve Tibshirani, R. (1993) Bootstrap'a Giriş .
Chapman ve Salonu, New York, Londra.
-
CV'de, @ whuber'un aramasının ortaya çıktığı modların sayısını belirlemek (yani test etmek yerine tahmin etmek) hakkında konuşan bir soru var. Buradaki cevapları okumaya değer. Buradaki yanıtlardan biri (olduğu gibi, benimsem), bu makaleyi David Donoho'nun, elbette bir test olarak kullanılabilecek modların sayısı için tek taraflı CI'lar oluşturma konusunda ortaya koyan bir Google arama bağlantısı var. , tek taraflı aralık, tek biçimli durum içermiyorsa, tek biçimliliği reddedebilirsiniz). Benim bilmediğim kadarıylaWikipedia'nın bahsettiği testlerden biri. Bu aralığın R uygulaması olduğunu sanmıyorum, ancak (Donoho'nun tartışmasında oldukça karmaşık araçları kullanma eğiliminde olmasına rağmen) uygulanması oldukça basit bir fikir. Bu fikir doğrudan çekirdek yoğunluğu kestirimi kullanma kavramıyla ilgilidir.