Değerleri bir grafik olarak çizdiğimizde, ikiz tepeleri gözlemleyerek iki modlu bir dağılımı tanımlayabildiğimizi anlıyorum, ancak bir kişi bunu programsal olarak nasıl bulur? (Bir algoritma arıyorum.)
Değerleri bir grafik olarak çizdiğimizde, ikiz tepeleri gözlemleyerek iki modlu bir dağılımı tanımlayabildiğimizi anlıyorum, ancak bir kişi bunu programsal olarak nasıl bulur? (Bir algoritma arıyorum.)
Yanıtlar:
Sürekli bir dağıtım için bir mod tanımlamak verilerin düzleştirilmesini veya eşleştirilmesini gerektirir.
Kutuya Dağıtım tipik çok Procrustes geçerli: Sonuçlar sıklıkla bin kesme noktaları yerleştirmek yere bağlıdır.
Çekirdek yumuşatma (özellikle, çekirdek yoğunluğu kestirimi şeklinde ) iyi bir seçimdir. Birçok çekirdek şekli mümkün olsa da, tipik olarak sonuç şekle pek bağlı değildir. Çekirdek bant genişliğine bağlıdır. Böylece insanlar ya uyarlanmış bir çekirdek pürüzsüz kullanırlar ya da tanımlanan modların stabilitesini kontrol etmek amacıyla değişken sabit bant genişlikleri için bir çekirdek pürüzsüz dizisi uygularlar. Uyarlanabilir veya "optimum" bir pürüzsüz kullanmak çekici olsa da, bunların çoğunun (hepsinin?
Uygulama devam ettiği sürece, çekirdek yerel olarak yumuşatır ve verilere uygun önceden belirlenmiş bir işlevi ölçeklendirir. Bu temel fonksiyonun ayırt edilebilir olması koşuluyla - Gausslar iyi bir seçimdir çünkü onları istediğiniz kadar farklılaştırabilirsiniz - o zaman tek yapmanız gereken pürüzsüzün türevini elde etmek için türevi ile değiştirmektir. O zaman sadece kritik noktaları tespit etmek ve test etmek için standart bir sıfır bulma prosedürü uygulamak meselesi. ( Brent'in yöntemi iyi sonuç verir.) Elbette, herhangi bir kritik noktanın yerel bir maksimum olup olmadığını (yani bir mod) hızlı bir şekilde test etmek için ikinci türevle aynı numarayı yapabilirsiniz.
Silverman'ın bu konuyla ilgilenen iyi bilinen bir makalesi var. Çekirdek yoğunluğu tahmini kullanır. Görmek
BW Silverman, Multimodaliteyi araştırmak için çekirdek yoğunluğu tahminlerini kullanma , J. Royal Stat. Soc. B , cilt. 43, hayır. 1, 1981, sayfa 97-99.
Kağıdın tablolarında bazı hatalar olduğunu unutmayın. Bu sadece bir başlangıç noktası, ama oldukça iyi. En çok aradığınız şey olduğunda, kullanmak için iyi tanımlanmış bir algoritma sağlar. Google Akademik’te daha “modern” yaklaşımlar için alıntı yapan makalelere bakabilirsiniz.
Partiye geç geldim, ancak sadece multimodal olup olmadığına ilgi duyuyorsanız, bu modlarla ilgilenmediğiniz anlamına gelirse , en alt seviyeye bakmalısınız .
Gelen R
paketin adı verilir diptest
.
Wiki'deki tanım biraz kafamı karıştırıyor. Sürekli bir veri setinin sadece bir moda sahip olma olasılığı sıfırdır. İki modlu bir dağıtımı programlamanın basit bir yolu, farklı merkezli iki ayrı normal dağılımdır. Bu, iki tepe noktası veya wiki'nin modları dediği şeyi oluşturur. Neredeyse iki dağıtımın tümünü kullanabilirsiniz, ancak en zor istatistiksel fırsatlardan biri, iki rasgele veri dağıtımını birleştirdikten sonra veri setinin nasıl oluşturulduğunu bulmaktır.