Test puanları gerçekten normal bir dağılım izliyor mu?


14

GLM'lerde hangi dağıtımların kullanılacağını öğrenmeye çalışıyorum ve normal dağıtımın ne zaman kullanılacağı konusunda biraz şaşkınım. Ders kitabımın bir bölümünde, normal bir dağılımın sınav puanlarını modellemek için iyi olabileceğini söylüyor. Bir sonraki bölümde, bir araba sigortası talebini modellemek için hangi dağıtımın uygun olacağını sorar. Bu kez, uygun dağılımların Gamma veya Ters Gauss olacağını, çünkü sadece pozitif değerlerle sürekli olduklarını söyledi. Sınav puanlarının da sadece pozitif değerlerle sürekli olacağına inanıyorum, neden orada normal bir dağılım kullanalım? Normal dağılım negatif değerlere izin vermiyor mu?


1
Puanlardaki sınırlardan endişe ediyorsanız en.wikipedia.org/wiki/Truncated_normal_distribution
JG

6
Gerçek dünyada, elbette, sınav puanı dağılımları genellikle normal bir dağılım gibi görünmez. Matematik lisans günlerimden bir örnek olarak, Topoloji I sınıfının yüksek bimodal "dambıl eğrisi" sınıf dağılımı için kötü şöhretli olduğunu hatırlıyorum : ya anahtar kavramları anladınız ve neredeyse mükemmel bir puan aldınız ya da yapmadınız ve herhangi bir puan almak için şanslı. Çok az insan ortada bu iki uç arasında herhangi bir yerde gol attı.
Ilmari Karonen

2
Hayır. Sonraki soru.
Carl Witthoft

Yanıtlar:


14

Örneğin, yükseklik genellikle normal olarak modellenir. Belki de erkeklerin yüksekliği standart 2 inç sapma ile 5 ayak 10 gibi bir şeydir. Negatif yüksekliğin fiziksel olmayan olduğunu biliyoruz, ancak bu model altında, negatif bir yüksekliği gözlemleme olasılığı esasen sıfırdır. Modeli yine de kullanıyoruz çünkü yeterince iyi bir yaklaşım.

Tüm modeller yanlış. Soru "bu model yine de yararlı olabilir" ve yükseklik ve test puanları gibi şeyleri modellediğimiz durumlarda, fenomeni normal olarak modellemesine rağmen, fiziksel olmayan şeylere teknik olarak izin vermesine rağmen yararlıdır.


Bu özel durumda, normal dağılımın yararlı bir yaklaşım olup olmadığı tartışmalıdır . Gördüğüm hemen hemen her sınıf dağılımı, yorumlarda bir dereceye kadar bahsettiğimiz bimodal eğriye benziyordu. (Her ne kadar uç uçlardan ziyade 0.6 ve 0.9 civarında modlarda olsa da) Bununla birlikte, farklı yollarla iki normal dağılımın doğrusal bir kombinasyonu kötü bir yaklaşım olmaz.
Ray

Normalin EN İYİ yaklaşık olduğunu iddia etmiyordum. Yorumumun asıl noktası bu son paragrafta yer alıyor. En azından bu soyutlama seviyesinde, gerçek dereceli dağılımların iki yönlü olması hakkındaki yorumlar gerçekten yararlı değildir.
Demetri Pananos

Yanıtınızda söylediğiniz her şeye katılıyorum, ancak sorunun bir kısmı normal dağılımın özellikle sınıf dağılımlarını modellemek için geçerli olup olmadığıyla ilgilidir. Ve bunun cevabı genellikle "Hayır" dır. Tüm modeller yanlış ve bazı modeller kullanışlıdır, ancak bazıları diğerlerinden daha yanlış ve daha az kullanışlıdır. Özellikle normal dağılım bu soruna için özellikle kötü bir uyum olması önemlidir ve olduğu gibi cevabı normal olduğunu düşündürmektedir görünüyor sadece aslında çok daha derin sorunlar varken, kuyrukları negatif ve sonsuz gittiğiniz için yanlış.
Ray

Burada biraz bilgiç oluyorsun. OP'nin problemi normalin negatif puanlara izin vermesiydi. Bimodality sorunu değildi. Bu soruyla ilgili olarak ağaçlar için ormanı görmüyorsunuz. Modelleme ayrıntıları şu anda alakalı değil.
Demetri Pananos

10

Normal dağılım negatif değerlere izin vermiyor mu?

Doğru. Üst sınırı da yoktur.

Ders kitabımın bir bölümünde, normal bir dağılımın sınav puanlarını modellemek için iyi olabileceğini söylüyor.

Önceki açıklamalara rağmen, yine de bazen durum budur. Test için çok fazla bileşene sahipseniz, çok güçlü bir şekilde ilişkili değilsiniz (örneğin, aslında bir düzine kez aynı soruda değilsiniz veya her bir parçanın bir önceki bölüme doğru cevap vermesini istemiyorsanız) ve çok kolay veya çok zor değil ( böylece çoğu işaret ortada bir yerde olur), o zaman işaretler genellikle normal bir dağılımla makul derecede iyi bir şekilde yaklaştırılabilir; genellikle tipik analizlerin çok az endişeye neden olması yeterlidir.

Biz normal olmadığını kesin olarak biliyorum , ama bu otomatik bir sorun değil - Kullandığımız prosedürlerin davranış onlar (bizim için örneğin standart hataları, güven aralığı, anlamlılık düzeyleri ne olması gerektiği yakın yeterli olduğu sürece ve güç - hangisine ihtiyaç varsa - onlardan beklediğimiz şeye yaklaşın)

Bir sonraki bölümde, bir araba sigortası talebini modellemek için hangi dağıtımın uygun olacağını sorar. Bu kez, uygun dağılımların Gamma veya Ters Gauss olacağını, çünkü sadece pozitif değerlerle sürekli olduklarını söyledi.

Evet, ama bundan daha fazlası - çok sağa eğik olma eğilimindedir ve ortalama büyüdükçe değişkenlik artma eğilimindedir.

Araç talepleri için talep boyutu dağılımına bir örnek:

https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg

(Şekil 5, Garrido, Genest & Schulz (2016) "Sigorta taleplerinin bağımlı sıklığı ve ciddiyeti için genelleştirilmiş doğrusal modeller", Sigorta: Matematik ve Ekonomi, Cilt 70, Eylül, p205-215. Https: //www.sciencedirect. com.tr / bilim / makale / pii / S0167668715303358 )

Bu tipik bir sağ-eğri ve ağır sağ kuyruğu gösterir. Ancak çok dikkatli olmalıyız, çünkü bu marjinal bir dağılımdır ve koşullu dağılım için bir model yazıyoruz , bu tipik olarak çok daha az çarpık olacaktır (sadece talep büyüklüğünün bir karışım olduğu bir histogramı yaparsak baktığımız marjinal dağılım) bu koşullu dağılımların). Bununla birlikte, tahmin edicilerin alt gruplarındaki (belki de sürekli değişkenleri kategorize eden) alt boyutlarındaki talep boyutuna bakarsak, dağılımın hala güçlü bir şekilde sağa eğik ve sağda oldukça ağır kuyruklu olduğu, bir gama modeli * gibi bir şeyin bir Gauss modelinden çok daha uygun olması muhtemeldir.

* Gaussian'dan daha uygun olabilecek başka dağıtımlar da olabilir - ters Gauss başka bir seçenektir - daha az yaygın olsa da; lognormal veya Weibull modelleri, GLM'ler durdukları gibi olmasa da, oldukça faydalı olabilirler.

[Nadiren bu dağılımlardan herhangi birinin mükemmel tanımlara yakın olması söz konusudur; bunlar kesin olmayan yaklaşımlardır, ancak çoğu durumda analizin yararlı ve istenen özelliklere yakın olması yeterince iyidir.]

Sınav puanlarının da sadece pozitif değerlerle sürekli olacağına inanıyorum, neden orada normal bir dağılım kullanalım?

Çünkü (daha önce bahsettiğim koşullar altında - çok fazla bileşen, çok bağımlı değil, zor ya da kolay değil) dağıtım oldukça simetrik, tek modlu ve ağır kuyruklu olma eğilimindedir.


0

Sınav puanları daha iyi bir binom dağılımı ile modellenebilir. Oldukça basitleştirilmiş bir durumda, her biri 1 puan değerinde 100 doğru / yanlış sorunuz olabilir, bu nedenle puan 0 ile 100 arasında bir tam sayı olacaktır. ), skor bağımsız rastgele değişkenlerin toplamıdır ve Merkezi Limit Teoremi geçerlidir. Soru sayısı arttıkça, doğru sorunların oranı normal dağılıma yaklaşmaktadır.

0'dan küçük değerler hakkında iyi bir soru sorarsınız. Aynı soruyu% 100'den büyük değerler hakkında da sorabilirsiniz. Test sorularının sayısı arttıkça, toplamın varyansı azalır, böylece tepe noktası ortalamaya doğru çekilir. Benzer şekilde, en uygun normal dağılım daha küçük varyansa sahip olacaktır ve pdf'nin [0, 1] aralığı dışındaki ağırlığı her zaman sıfırdan farklı olmasına rağmen 0'a doğru eğilimlidir. "Doğru kesir" değerlerinin arasındaki boşluk da azalır (100 soru için 1/100, 1000 soru için 1/1000, vb.), Bu nedenle gayri resmi olarak pdf sürekli bir pdf gibi daha fazla davranmaya başlar.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.