Söz konusu bağlantı SAS hakkında da konuşuyor. Ama aslında bu sorudaki hiçbir şey, muhtemelen posterin kendi odağı dışında, onu belirli programlarla sınırlandırıyor.
Bence burada, bazıları aldatıcı ve bazıları gerçek olan oldukça farklı türden sorunları ayırmamız gerekiyor.
Bazı programlar 3'ü çıkarır ve öyle yapmaz ki rapor edilen basıklık ölçüsü Gauss / normal değişkenler için 3 ve çıkarma olmadan 0 olur. İnsanların şaşkına döndüğünü gördüm, çoğu zaman fark tam olarak değil 3.999 dendiğinde ortaya çıkıyor.
Bazı programlar basıklığın önyargısız olarak tahmin edilmesini sağlamak için tasarlanmış düzeltme faktörlerini kullanır. Bu düzeltme faktörleri, numune boyutu büyüdükçe 1'e yaklaşmaktadır . Küçük numunelerde basıklık iyi tahmin edilmediğinden, bu çok endişe verici olmamalıdır.n
Yani, küçük bir formül sorunu var; # 1, # 2'den çok daha büyük bir anlaşma, ancak her ikisi de anlaşılırsa küçük. Öneriler, kullandığınız programın belgelerine ve bu programı derhal terk etmek için bu tür ayrıntıları açıklayan herhangi bir belge bulunmadığına açıkça bakmaktır. Ancak bir değişken (1, 2) kadar basit bir test durumu, yalnızca # 1'e (düzeltme faktörü olmadan) bağlı olarak 1 veya 4 basıklık verir.
Bu durumda soru yorumlama ister, ancak bu çok daha açık ve tartışmalı bir konudur.
Ana tartışma alanına gelmeden önce, sıklıkla bildirilen ancak az bilinen bir zorluk, basıklık tahminlerinin örneklem büyüklüğünün bir fonksiyonu olarak sınırlanmasıdır. Cox, NJ 2010'da bir inceleme yazdım. Örnek çarpıklık ve basıklık sınırları. Stata Journal 10 (3): 482-495. http://www.stata-journal.com/article.html?article=st0204
Özet: Örnek çarpıklığı ve basıklık, örneklem büyüklüğü işlevleri ile sınırlıdır. Sınırlar veya bunlara ilişkin yaklaşımlar son birkaç on yılda tekrar tekrar keşfedildi, ancak yine de çok az biliniyor gibi görünüyor. Sınırlar kestirime karşı önyargıyı beraberinde getirir ve aşırı durumlarda hiçbir numunenin ana dağıtımına kesin tanıklık edemeyeceğini ima eder. Ana sonuçlar bir öğretici derlemede açıklanmıştır ve Stata ve Mata'nın sonuçlarını doğrulamak ve araştırmak için nasıl kullanılabileceği gösterilmiştir.
Şimdi konunun özü olarak kabul edilen şeye:
Birçok insan basıklığı doruk noktasına çevirir, ancak diğerleri sıklıkla kuyruk ağırlığının bir ölçüsü olarak hizmet ettiğini vurgular. Aslında, iki yorum bazı dağıtımlar için makul ifadeler olabilir. Basıklığın basit bir sözlü yorumunun olmaması neredeyse kaçınılmazdır: dilimiz, dördüncü güçlerin toplamlarının ve bunların ikinci güçlerinin toplamlarından sapmalarının karşılaştırılması konusunda yeterince zengin değildir.
Küçük ve sıklıkla gözden kaçan bir klasikte, Irving Kaplansky (1945a), bazı basıklık tartışmalarıyla tutarlı olmayan farklı basıklık ve davranış değerlerine sahip dört dağılım örneğine dikkat çekti.
Dağılımları tümü, ortalama 0 ve varyans 1 simetrik olan ve değişken için yoğunluk fonksiyonlara sahip ve ,xc=π−−√
(1) (1/3c)(9/4+x4)exp(−x2)
(2) (3/(c8–√))exp(−x2/2)−(1/6c)(9/4+x4)exp(−x2)
(3) (1/6c)(exp(−x2/4)+4exp(−x2))
(4) (33–√/16c)(2+x2)exp(−3x2/4)
Basıklık (çıkarma olmadan) (1) 2.75 (2) 3.125 (3) 4.5 (4) 8/3 2.667: Gaussian veya normal 3 değerini karşılaştırınız. Ortalama yoğunluk (1) 0.423 (2'dir. ) 0.387 (3) 0.470 (4) 0.366: 0.399'un Gauss değerini karşılaştırın.≈
Bu yoğunlukları çizmek öğreticidir. Stata kullanıcıları kaplansky
programımı SSC'den indirebilir . Yoğunluk için logaritmik bir ölçek kullanmak yardımcı olabilir.
Tüm ayrıntılardan vazgeçmeden bu örnekler, düşük veya yüksek basıklığın, doruk noktası veya gerçekten de diğer herhangi bir kontrast açısından açık bir yorumu olduğu herhangi bir basit hikayeyi baltalamaktadır.
Irving Kaplansky adı bir zil çalarsa, muhtemelen modern cebirde çalışmasını bildiğiniz için. (1917-2006) Kanadalı (daha sonra Amerikalı) bir matematikçiydi ve Columbia Üniversitesi Ulusal Savunma Konseyi Uygulamalı Matematik Grubu'nda Harvard, Chicago ve Berkeley'de ders verdi ve araştırdı. Kaplansky grup teorisi, halka teorisi, operatör cebir teorisi ve alan teorisine büyük katkılarda bulunmuştur. Başarılı bir piyanist ve söz yazarı ve matematiğin hevesli ve berrak bir açıklayıcısıydı. Ayrıca Kaplansky (1943, 1945b) ve Kaplansky ve Riordan'ın (1945) olasılık ve istatistiklere diğer bazı katkılarına da dikkat edin.
Kaplansky, I. 1943. Normal dağılımın karakterizasyonu. Yıllık Matematik İstatistikleri 14: 197-198.
Kaplansky, I. 1945a. Basıklık ile ilgili yaygın bir hata. Dergi, yalnızca Amerikan İstatistik Kurumu 40: 259.
Kaplansky, I. 1945b. Ardışık elemanların çalışmalarının asimptotik dağılımı. Yıllıklar Matematik İstatistikleri 16: 200-203.
Kaplansky, I. ve Riordan, J. 1945. Çoklu eşleme ve sembolik yöntemle çalışır. Yıllıklar Matematik İstatistikleri 16: 272-277.