Örnek bölme, istatistiğin dağılımı ile ilgili sorunu belki azaltabilir, ancak kaldırmaz.
Fikriniz, tahminlerin aynı örneğe dayandığı için nüfus değerlerine göre 'çok yakın' olacağı sorununu önler.
Hala tahmin ettikleri problemden kaçınmıyorsunuz. Test istatistiğinin dağılımı tablo halinde verilmemiştir.
Bu durumda, önemli ölçüde azaltmak yerine, sıfırın altındaki reddetme oranını artırır.
Daha iyi bir seçim, Shapiro Wilk gibi parametrelerin bilinmediği bir test kullanmaktır.
Kolmogorov-Smirnov tipi bir teste bağlıysanız, Lilliefors'un testine yaklaşabilirsiniz.
Yani, KS istatistiğini kullanmak ancak test istatistiğinin dağılımının parametre tahmininin etkisini yansıtmasını sağlamak - test istatistiğinin parametre tahmini altında dağılımını simüle edin. (Artık dağıtımdan bağımsız değil, bu nedenle her dağıtım için yeni tablolara ihtiyacınız var.)
http://en.wikipedia.org/wiki/Lilliefors_test
Liliefors, normal ve üstel durum için simülasyon kullandı, ancak herhangi bir belirli dağıtım için kolayca yapabilirsiniz; R gibi bir şeyde 10.000 veya 100.000 örneği simüle etmek ve test istatistiğinin null altında dağılımını sağlamak anlar meselesidir.
[Alternatif, aynı konuya sahip olan Anderson-Darling'i düşünmek olabilir, ancak bu - D'Agostino ve Stephens'in ( uygunluk teknikleri ) kitabından yola çıkarak konuya daha az duyarlı görünüyor. Lilliefors fikrini uyarlayabilirsiniz, ancak oldukça iyi işleyen nispeten basit bir ayarlama önermektedirler.]
Ama yine de başka yaklaşımlar var; örneğin, bazı özel durumlarda parametre tahmini ile başa çıkabilen (örneğin Rayner ve Best'in kitabına bakınız) uygunluk iyiliği testlerinin aileleri vardır.
* etki hala oldukça büyük olabilir - belki de normal olarak kabul edilebilir olarak kabul edilenden daha büyük olabilir; Momo bu konuda endişelerini dile getirmekte haklıdır. Daha yüksek bir tip I hata oranı (ve daha düz bir güç eğrisi) bir sorunsa, bu bir iyileşme olmayabilir!