1) Tasvir edilen, çubuk grafik olarak çizilen (gruplandırılmış) sürekli veriler gibi görünmektedir.
Bunun bir Poisson dağılımı olmadığı sonucuna varabilirsiniz .
Poisson rasgele değişkeni 0, 1, 2, ... değerlerini alır ve yalnızca ortalama 1'den küçük olduğunda 0'da en yüksek zirveye sahiptir. Sayım verileri için kullanılır; Poisson verilerinin benzer bir grafiğini çizdiyseniz, aşağıdaki grafiklere benzeyebilir:
Birincisi, kendinize benzer çarpıklık gösteren bir Poisson. Ortalamanın oldukça küçük olduğunu görebilirsiniz (yaklaşık 0.6).
İkincisi, sizinkine benzer (çok kaba bir tahminde) anlamına gelen bir Poisson. Gördüğünüz gibi oldukça simetrik görünüyor.
Çarpıklık veya büyük ortalamaya sahip olabilirsiniz, ancak her ikisine de aynı anda sahip olamazsınız.
2) (i) Ayrık verileri normal yapamazsınız -
Gruplandırılmış verilerle, monotonikliği artıran herhangi bir dönüşümü kullanarak, bir gruptaki tüm değerleri aynı yere taşıyacaksınız, böylece en düşük grup yine de en yüksek zirveye sahip olacaktır - aşağıdaki tabloya bakın. İlk grafikte, x değerlerinin konumlarını normal bir cdf ile yakından eşleşecek şekilde taşıyoruz:
İkinci grafikte dönüşümden sonra olasılık fonksiyonunu görüyoruz. Normallik gibi bir şeye gerçekten ulaşamayız çünkü hem ayrık hem de eğri; ilk grubun büyük sıçraması, sağa veya sola itmenizden bağımsız olarak büyük bir sıçrama olarak kalacaktır.
(ii) Sürekli çarpık veriler makul görünecek şekilde dönüştürülebilir. Ham (gruplanmamış) değerleriniz varsa ve çok ayrık değilse, muhtemelen bir şeyler yapabilirsiniz, ancak o zaman bile insanlar genellikle verilerini dönüştürmeye çalıştıklarında gereksizdir veya altta yatan sorun farklı (genellikle daha iyi) bir şekilde çözülebilir . Bazen dönüşüm iyi bir seçimdir, ancak genellikle çok iyi olmayan nedenlerle yapılır.
Öyleyse ... neden dönüştürmek istiyorsun?