+1'den @NickSabbe'ye, çünkü 'arsa sadece "bir şeylerin yanlış olduğunu" söyler, bu da qq-arsa kullanmanın en iyi yoludur (bunları nasıl yorumlayacağınızı anlamak zor olabilir). Bununla birlikte, bir qq-grafiğini nasıl yorumlayacağınızı düşünerek öğrenmek mümkündür.
Verilerinizi sıralayarak başlayacaksınız, ardından her birini eşit bir yüzde olarak alan minimum değerden yukarı doğru sayarsınız. Örneğin, 20 veri noktanız varsa, ilkini (minimum) saydığınızda, kendinize 'Verilerimin% 5'ini saydım' diyebilirsiniz. Bu prosedürü sonuna kadar, verilerinizin% 100'ünden geçtiğinizde takip edersiniz. Bu yüzde değerleri daha sonra karşılık gelen teorik normalden (yani, aynı ortalama ve SD ile normal) aynı yüzde değerleriyle karşılaştırılabilir.
Bunları çizmeye gittiğinizde,% 100 olan son değerle ilgili sorun yaşadığınızı keşfedeceksiniz, çünkü teorik bir normalin% 100'ünü geçtiğinizde 'sonsuz' olursunuz. Bu sorun, yüzdeleri hesaplamadan önce verilerinizdeki her bir noktaya paydaya küçük bir sabit eklenerek ele alınmaktadır. Tipik bir değer, paydaya 1 eklemek; örneğin, 1. (20) veri noktanızı 1 / (20 + 1) =% 5 olarak adlandırırsınız ve sonuncunuz 20 / (20 + 1) =% 95 olur. Şimdi bu noktaları karşılık gelen bir teorik normale göre çizerseniz, bir pp-grafiğiniz olur.(olasılıkları olasılıklara göre çizmek için). Böyle bir arsa, büyük olasılıkla dağılımınız ile dağıtımın ortasındaki bir normal arasındaki sapmaları gösterecektir. Bunun nedeni, normal dağılımın% 68'inin +/- 1 SD içinde yatmasıdır, bu nedenle pp-parsellerin mükemmel çözünürlüğü ve başka yerlerde zayıf çözünürlüğü vardır. (Bu konuda daha fazla bilgi için, cevabımı burada okumak yardımcı olabilir: PP-parseller ve QQ-parseller .)
Çoğunlukla, dağıtımımızın kuyruklarında neler olduğu konusunda endişeliyiz. Orada daha iyi çözünürlük (ve böylece ortada daha kötü çözünürlük) elde etmek için, bunun yerine bir qq-komplo oluşturabiliriz . Bunu olasılık setlerimizi alıp normal dağılımın CDF'sinin tersinden geçirerek yapıyoruz (bu, bir istatistik kitabının arkasındaki z tablosunu geriye doğru okumak gibi - bir olasılıkta okuyorsunuz ve bir z- Puan). Bu operasyonun sonucu, birbirine benzer şekilde çizilebilen iki set kantil .
@whuber, referans çizgisinin daha sonra (tipik olarak) noktaların orta% 50'si boyunca (yani birinci çeyrekten üçe kadar) en iyi montaj çizgisini bularak çizilmesinde haklıdır. Bu, arsanın okunmasını kolaylaştırmak için yapılır. Bu çizgiyi kullanarak, grafiği, dağıtımınızın miktarlarının kuyruklara doğru ilerledikçe aşamalı olarak gerçek bir normalden farklı olup olmadığını gösteren olarak yorumlayabilirsiniz. (Merkezden daha uzak noktaların konumunun daha yakın olanlardan gerçekten bağımsız olmadığını unutmayın; bu nedenle, belirli histogramınızda, kuyrukların 'omuzlar' farklı olduktan sonra bir araya geldiği gerçeği, niceliklerin olduğu anlamına gelmez. şimdi tekrar aynı.)
x−3y−.2dağıtımınızın kuyruğundaki veriler teorik bir normalden daha fazladır. Diğer bir deyişle:
- her iki kuyruk saat yönünün tersine bükülürse , ağır kuyruklarınız ( leptokurtoz ) varsa,
- Her iki kuyruk da saat yönünde bükülürse, hafif kuyruklarınız (platykurtoz) vardır,
- sağ kuyruğunuz saat yönünün tersine bükülürse ve sol kuyruğunuz saat yönünde bükülürse, sağ eğiminiz vardır
- sol kuyruğunuz saat yönünün tersine ve sağ kuyruğunuz saat yönünde kıvrılırsa