Bu tür durumlarda ki-kare düşük gücünün bariz sorununu bir kenara bırakarak, verileri ikiye ayırarak, belirtilmemiş parametrelerle bazı yoğunluk için ki-kare testi iyiliği yaptığınızı hayal edin.
Somutluk için, diyelim ki ortalaması bilinmeyen üstel dağılım ve örnek büyüklüğü 100 diyelim.
Bölme başına makul sayıda beklenen gözlem elde etmek için verilerin bir kısmının dikkate alınması gerekir (örneğin, ortalamanın altına 6 bölme ve bunun üzerine 4 bölme koymayı seçersek, yine de veri tabanlı bölme sınırları kullanır) .
Ancak, verileri görmeye dayanan bu kutuların kullanımı muhtemelen test istatistiğinin sıfırın altındaki dağılımını etkileyecektir.
Parametreler, binned verilerden maksimum olasılıkla tahmin edilirse , tahmin edilen parametre başına 1 df kaybedersiniz (Fisher vs Karl Pearson'a kadar uzanan bir sorun) - ancak hatırlamıyorum hakkında birçok tartışma gördüm. verilere dayanarak çöp kutusu sınırlarını bulma hakkında her şeyi okumak. (Bunları birleştirilmemiş verilerden tahmin ederseniz, k kutuları ile test istatistiğinin dağılımı χ 2 k ile χ 2 k - p arasındadır .)
Bu veri tabanlı kutu seçimi önem düzeyini veya gücü önemli ölçüde etkiliyor mu? Diğerlerinden daha önemli bazı yaklaşımlar var mı? Çok fazla etki varsa, büyük örneklerde kaybolan bir şey var mı?
Eğer önemli bir etkisi varsa, parametreler birçok durumda neredeyse işe yaramazsa (hala birkaç metinde savunulmasına rağmen) ki-kare testi kullanıyorsunuz. parametrenin priori tahmini.
Konuların veya referanslara işaretçilerin tartışılması (tercihen sonuçlarından bahsedilerek) faydalı olacaktır.
Düzenle, ana sorunun hemen hemen bir kenara:
Bana göre, üstel * (ve üniforma düşünmeye gelir) özel durumu için potansiyel çözümler var, ancak hala etki seçme bölmesi sınırlarının daha genel konusuyla ilgileniyorum.
* Örneğin, üstel için, kutuların nereye yerleştirileceği hakkında çok kaba bir fikir edinmek için en küçük gözlem ( eşittir ) kullanılabilir (en küçük gözlem ortalama μ / n ile üstel olduğu için ) ve sonra kalan n - 1 farklarını ( x i - m ) üstellik açısından test edin . Tabii ki bu çok kötü bir tahmin μve dolayısıyla zayıf çöp kutusu seçimleri olsa da, makul bölmeleri seçmek için en düşük iki veya üç gözlemi almak ve daha sonra kalan gözlemlerin en küçük sipariş istatistiklerinin en büyüğünün üzerindeki farklarını test etmek için argümanı tekrar tekrar kullanabileceğini varsayalım. exponentiality)