Hangisine inanılır: Kolmogorov-Smirnov testi veya QQ grafiği?


16

Sürekli veri veri kümemin şekil 1.7 ve oran 0.000063 parametreleriyle bir gama dağılımını takip edip etmediğini belirlemeye çalışıyorum .===

Sorun, teorik dağıtım gama (1.7, 0.000063) karşı veri kümem bir QQ grafiği oluşturmak için R kullandığımda , ampirik verilerin kabaca gama dağılımı ile aynı olduğunu gösteren bir çizim olsun. Aynı şey ECDF grafiğinde de olur.x

Ancak bir Kolmogorov-Smirnov testi yaptığımda, bana mantıksız derecede küçük bir değeri veriyor .< % 1p<1%

Hangisine inanmayı seçmeliyim? Grafiksel çıktı mı yoksa KS-testinin sonucu mu?

QQplot ve ECDF grafiği


elde ettiğiniz yoğunluk dağılım grafiklerini de sağlayabilir misiniz?
çizik

13
Test ve teşhis planı tutarsız değil. QQ grafiğinin gösterdiği gibi dağılım teorik olana benzer. Örneklem büyüklüğü, teorik boyuttan küçük farklar bile alabileceğiniz kadar geniştir.
Glen_b

Yanıtlar:


18

QQ grafiğine "inanmamanın" hiçbir anlamı görmüyorum (eğer düzgün bir şekilde ürettiyseniz); sadece tanım dağılımıyla yan yana olan verilerinizin gerçekliğinin grafiksel bir temsilidir. Açıkçası mükemmel bir eşleşme değil, ancak amaçlarınız için yeterince iyi ise, hikayenin aşağı yukarı sonu olabilir. Bu ilgili soruyu incelemek isteyebilirsiniz: Normallik testi 'temelde işe yaramaz mı?

p

Verilerinizin amaçlanan amaçlara yönelik bir gama dağılımından çok farklı olup olmadığı başka bir sorudur. KS testi tek başına sizin için cevap veremez (çünkü sonucu diğer nedenlerin yanı sıra örneklem büyüklüğünüze bağlı olacaktır), ancak QQ grafiği karar vermenize yardımcı olabilir. Ayrıca, çalıştırmayı planladığınız diğer analizlere de sağlam alternatifler aramak isteyebilirsiniz ve sonraki analizlerin gama dağılımından sapmalara olan duyarlılığını özellikle önemsiyorsanız, bazı simülasyon testleri de yapmayı düşünebilirsiniz. .


15

Yapabileceğiniz şey teorik dağılımınızdan birden fazla örnek oluşturmak ve bunları QQ grafiğinizin arka planına çizmektir. Bu, sadece örneklemeden makul bir şekilde ne tür bir değişkenlik beklediğiniz hakkında bir fikir verecektir.

Aşağıdaki fikri 86-89. Sayfalardaki örneği kullanarak teorik çizginin etrafında bir zarf oluşturmak için bu fikri genişletebilirsiniz:

Venables, WN ve Ripley, BD 2002. S. New York: Springer ile modern uygulamalı istatistikler.

Bu akıllıca bir zarf olacak. 151-154. Sayfalardaki fikirleri kullanarak genel bir zarf oluşturmak için bu fikri daha da genişletebilirsiniz:

Davison, AC ve Hinkley, DV 1997. Bootstrap yöntemleri ve uygulamaları. Cambridge: Cambridge Üniversitesi Yayınları.

Bununla birlikte, temel keşif için QQ grafiğinizin arka planında birkaç referans örneği çizmenin yeterli olacağını düşünüyorum.


İyi bir fikir! Bunu 11 saat içinde onaylamamı hatırlat ( karikatürlerdeki tüm oyları tükettim) ... Özellikle ECDF'yi bu tür arsaları zenginleştirmenin bir yolu olarak önyüklemeyi seviyorum.
Nick Stauner

1
Ayrıca, ecdf.ksCI işlevinin ecdf grafiğinde bir güven bandını çeken CRAN paketi sfsmisc'e bir göz atın. Aynı fikir, QQ çiziminde bir güven grubu çizmek için de kullanılabilir ...
kjetil b halvorsen

2

KS testi, dağıtımınızın belirli parametrelerini varsayar. "Veriler bu özel dağılıma göre dağıtılır" hipotezini test eder. Bu parametreleri bir yerde belirtmiş olabilirsiniz. Değilse, eşleşen olmayan bazı varsayılanlar kullanılmış olabilir. Tahmini parametreler hipoteze takılırsa KS testinin konservatif hale geleceğini unutmayın.

Bununla birlikte, uyum iyiliği testlerinin çoğu yanlış yönde kullanılır. KS testi önem göstermezse, bu kanıtlamak istediğiniz modelin uygun olduğu anlamına gelmez. @Nick Stauner çok küçük örnek boyutu hakkında böyle söyledi. Bu konu nokta hipotez testleri ve denklik testlerine benzer.

Sonunda: Sadece QQ grafiklerini düşünün.


-1

QQ Plot, keşifsel bir veri analizi tekniğidir ve bu şekilde ele alınmalıdır - diğer tüm EDA grafikleri de. Bunlar yalnızca eldeki veriler hakkında ön bilgiler vermek içindir. QQ grafiği gibi EDA grafiklerine dayanarak analizinize asla karar vermemeli veya durdurmamalısınız. Sadece QQ grafiklerini dikkate almak yanlış bir tavsiye. Kesinlikle KS Testi gibi nicel tekniklerle gitmelisiniz. Benzer veri kümesi için başka bir QQ grafiğiniz olduğunu varsayalım, ikisini nicel bir araç olmadan nasıl karşılaştırırsınız? Sizin için doğru bir sonraki adım, EDA ve KS testinden sonra KS testinin neden düşük p değeri verdiğini bulmaktır (sizin durumunuzda, bazı hatalardan kaynaklanıyor olabilir).

EDA teknikleri, karar verme araçları olarak hizmet etmek anlamına DEĞİLDİR. Aslında, çıkarımsal istatistiklerin bile sadece keşif amaçlı olduğunu söyleyebilirim. İstatistiksel analizinizin hangi yöne doğru ilerlemesi gerektiğine dair size işaret ederler. Örneğin, bir örnekteki t testi size yalnızca örneğin popülasyona ait olabileceği (veya olmayabileceği) bir güven düzeyi verir, verilerinizin hangi dağılıma ait olduğuna ve neye ait olduğuna dair bu kavrayışa dayanarak daha da ileri gidebilirsiniz. Aslında, bazıları makine öğrenme kütüphanelerinin bir parçası olarak uygulanan tekniklerin bile doğada keşifçi olduğunu ifade ettiğinde! Umarım bu anlamda demek isterler ...!

İstatistiksel kararları parseller veya görselleştirme teknikleri temelinde sonuçlandırmak, istatistik biliminde kaydedilen ilerlemelerle alay etmektir. Bana sorarsanız, bu grafikleri nicel istatistiksel analizinize dayanarak nihai sonuçları iletmek için araçlar olarak kullanmalısınız.


Bu, sık sık yaptığım ve mantıklı olarak gördüğüm bir şeyi yapmamı yasaklıyor, keşifsel bir plan yaparak bir karar ver ve daha resmi bir önem testinden önce dur. Alay konusu yoktur. Bu, mevcut mükemmel ve çok daha nüanslı cevaplara yararlı bir şey eklemeyen tekrarlayan ve dogmatik bir yorumdur. QQ parsellerini karşılaştırmak çok kolay ...
Nick Cox

Başka cevapları okumadım ama nicel yöntemleri de teşvik ederlerse, iyiyim. Sorulan soru için cevabımı vermiştim. Ama merak ediyorum, R gibi mevcut paketlerle resmi miktar testleri (KS testi yapmak için sadece birkaç dakika daha) çok fazla zaman almıyor, o zaman neden kimse EDA parsellerinde dursun? Bootstrapping ile R'nin KS test sonuçlarını doğruladıktan hemen sonra, vb. Tercih edilmediği belirtildiği birkaç yerde fark ettim., .. Geleneksel stat yöntemleri hakkında genel bir şüphe mi var? Bu benim güçlü yorumların arkasındaki mantık ... herhangi bir gücendirmek için değil
Murugesan Narayanaswamy

Göndermeden önce diğer cevapları gerçekten okumalısınız. Göndermenin anlamı, söyleyebileceğiniz farklı (ve savunulabilir) bir şeye sahip olmanızdır. Yorumunuz QQ grafiklerinin "nicel yöntemler" olmadığını ima etmekle kafa karıştırıyor. QQ grafiği prensipte dağıtım uyumunun değerlendirilmesiyle ilgili tüm nicel bilgileri gösterir. Buna karşılık Kolmogorov-Smirnov gibi bir test tek boyutlu bir azalma sağlar ve bundan sonra ne yapacağına çok az yardım eder.
Nick Cox

QQ grafiği teorik dağılımı verilen test verileriyle karşılaştırır ve görsel bir sunum sağlar ancak KS testi aynı şeyi istatistiksel kavramları kullanarak çok daha titiz bir şekilde yapar ve son olarak bir olasılık değeri verir. İki QQ grafiğini karşılaştıramazsınız, ancak KS testini kullandığınızda nicel bir fark elde edersiniz. KS testi p-değerinin yanlış olması yanlıştır. Ayrıca ampirik veri setinin dağıtım parametrelerini çıkarmak için kullanılamaması da yanlıştır. Şahsen bootstrapping yaptım ve her iki tablo ve manuel olarak hesaplanan kolomogrov dağılımı ile p değerleri ile doğruladım.
Murugesan Narayanaswamy

Yorumunuzda çok fazla gölge boksu var: Parametre tahminleri almak için ampirik verileri nerede kullanamayacağınızı kim tartışıyor? Burada yapıldığımız konusunda hemfikiriz. Bir tartışma yürütmek istemediğin için beni affetmen gerekecek. Cevabına vereceğim tepki karşısında duruyorum.
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.