QQ komplo yorumu


12

Aşağıdaki kodu ve çıktıyı göz önünde bulundurun:

  par(mfrow=c(3,2))
  # generate random data from weibull distribution
  x = rweibull(20, 8, 2)
  # Quantile-Quantile Plot for different distributions
  qqPlot(x, "log-normal")
  qqPlot(x, "normal")
  qqPlot(x, "exponential", DB = TRUE)
  qqPlot(x, "cauchy")
  qqPlot(x, "weibull")
  qqPlot(x, "logistic")

resim açıklamasını buraya girin

Log-normal için QQ grafiğinin, weibull için QQ grafiğiyle hemen hemen aynı olduğu görülüyor. Onları nasıl ayırt edebiliriz? Ayrıca, noktalar iki dış siyah çizgi tarafından tanımlanan bölge içindeyse, bu belirtilen dağılımı izlediklerini gösterir mi?


Araba paketini kullandığınıza inanıyorum , değil mi? Öyleyse, library(car)insanların izlemesini kolaylaştırmak için ifadeyi kodunuza eklemelisiniz . Genel olarak, set.seed(1)örneği tekrarlanabilir hale getirmek için tohumu (örn. ) Ayarlamak da isteyebilirsiniz , böylece muhtemelen burada önemli olmadığı halde herkes aldığınız veri noktalarını alabilir.
gung - Monica'yı eski durumuna getirin

2
Bilgisayarımda yazıldığı gibi çalışmaz. Örneğin, araç paketindeki qqPlot normal norm ve log-normal norm istiyor. Neyi kaçırıyorum?
Tom

2
@Tom, paket hakkında yanılmışım. Belli ki, kalite araçları paketi. Dahası, örnek buradan alınmıştır .
gung - Monica'yı eski durumuna getirin

İlginç bir alternatif Cullen ve Frey grafiği, bunun için bakınız stats.stackexchange.com/questions/243973/... bir örnek için
Halvorsen Kjetil b

Yanıtlar:


12

Burada söylenecek birkaç şey var:

  1. için CDF şekli log-normal bir CDF şekline benzer yeterlidir Weibull onların daha Weibull ve diğerleri arasındaki benzerlik düzeyi daha ayırt etmek.
  2. dış siyah çizgiler bir güven bandı oluşturur . Güven bandının çıkarımda kullanımı, Frequentist istatistiksel çıkarımın diğer standart formlarıyla aynıdır. Yani, değerler bandın içine düştüğünde, pozitif dağılımın doğru olduğuna dair sıfır hipotezini reddedemeyiz. Bu, beklenen dağılımın doğru olduğunu bildiğimizi söylemekle aynı şey değildir . (Bu başka bir cevap tartışılan ne büyük bir örnek olduğunu Not burada hipotez testine Fisherian perspektif Neyman- Pearson tercih olacak bir durum.)
  3. daha fazla veriye ihtiyacınız var; senin buradaki tek 20'dir. N

Küçük numune boyutları için dağılımları incelemenin yolları var mı?
proton

aslında puanlar tüm dağıtımlar için güven bantlarında yatmaktadır. Yani dağıtımları ayırt edemiyoruz?
proton

1
Bir veri kümesinin teorik bir dağılıma uyumunun iyiliği için testler vardır, ancak qq-parsellerinden daha düşük olduklarını düşünme eğilimindeyim. Temel olarak, olan dağılımları ayırt edemezsiniz . Bunu istatistiksel güç açısından düşünüyorsanız, burada yanlış null'ların her birini reddetme yeteneğiniz . 2. maddede bağladığım yanıtı okumanıza yardımcı olabilir. % 5n=205%
gung - Monica'yı eski durumuna getirin

2
Küçük örnek boyutunda +1. 300 örnek kullanmak, işleri ayırt etmeye yardımcı olur. Proton: Hayır, dağıtımları küçük bir örnekle gerçekten ayırt edemezsiniz. Nasıl yapabildin? 20 pikselli bir yüzü tanımlamaya çalışmak gibi.
Wayne

3

Log-normal için QQ grafiğinin, weibull için QQ grafiğiyle hemen hemen aynı olduğu görülüyor.

Evet.

Onları nasıl ayırt edebiliriz?

Bu örnek boyutunda, muhtemelen yapamazsınız.

Ayrıca, noktalar iki dış siyah çizgi tarafından tanımlanan bölge içindeyse, bu belirtilen dağılımı izlediklerini gösterir mi?

Hayır. Yalnızca verilerin dağıtımının o dağıtımdan farklı olduğunu söyleyemeyeceğinizi gösterir. Bir farkın kanıtı yok, farkın kanıtı değil.

Veri dikkatinizden kaçmış olanların herhangi olmayan bir dağılımından olduğunu neredeyse emin olabiliriz (neden olsun ki tam o herhangi birinden?).


İfadede olduğu gibi: "Bu bir farkın kanıtının olmaması, farkın olmadığının kanıtı değil."
jlandercy
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.