Normal dağılım negatif değerlere izin vermiyor mu?
Doğru. Üst sınırı da yoktur.
Ders kitabımın bir bölümünde, normal bir dağılımın sınav puanlarını modellemek için iyi olabileceğini söylüyor.
Önceki açıklamalara rağmen, yine de bazen durum budur. Test için çok fazla bileşene sahipseniz, çok güçlü bir şekilde ilişkili değilsiniz (örneğin, aslında bir düzine kez aynı soruda değilsiniz veya her bir parçanın bir önceki bölüme doğru cevap vermesini istemiyorsanız) ve çok kolay veya çok zor değil ( böylece çoğu işaret ortada bir yerde olur), o zaman işaretler genellikle normal bir dağılımla makul derecede iyi bir şekilde yaklaştırılabilir; genellikle tipik analizlerin çok az endişeye neden olması yeterlidir.
Biz normal olmadığını kesin olarak biliyorum , ama bu otomatik bir sorun değil - Kullandığımız prosedürlerin davranış onlar (bizim için örneğin standart hataları, güven aralığı, anlamlılık düzeyleri ne olması gerektiği yakın yeterli olduğu sürece ve güç - hangisine ihtiyaç varsa - onlardan beklediğimiz şeye yaklaşın)
Bir sonraki bölümde, bir araba sigortası talebini modellemek için hangi dağıtımın uygun olacağını sorar. Bu kez, uygun dağılımların Gamma veya Ters Gauss olacağını, çünkü sadece pozitif değerlerle sürekli olduklarını söyledi.
Evet, ama bundan daha fazlası - çok sağa eğik olma eğilimindedir ve ortalama büyüdükçe değişkenlik artma eğilimindedir.
Araç talepleri için talep boyutu dağılımına bir örnek:
https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg
(Şekil 5, Garrido, Genest & Schulz (2016) "Sigorta taleplerinin bağımlı sıklığı ve ciddiyeti için genelleştirilmiş doğrusal modeller", Sigorta: Matematik ve Ekonomi, Cilt 70, Eylül, p205-215. Https: //www.sciencedirect. com.tr / bilim / makale / pii / S0167668715303358 )
Bu tipik bir sağ-eğri ve ağır sağ kuyruğu gösterir. Ancak çok dikkatli olmalıyız, çünkü bu marjinal bir dağılımdır ve koşullu dağılım için bir model yazıyoruz , bu tipik olarak çok daha az çarpık olacaktır (sadece talep büyüklüğünün bir karışım olduğu bir histogramı yaparsak baktığımız marjinal dağılım) bu koşullu dağılımların). Bununla birlikte, tahmin edicilerin alt gruplarındaki (belki de sürekli değişkenleri kategorize eden) alt boyutlarındaki talep boyutuna bakarsak, dağılımın hala güçlü bir şekilde sağa eğik ve sağda oldukça ağır kuyruklu olduğu, bir gama modeli * gibi bir şeyin bir Gauss modelinden çok daha uygun olması muhtemeldir.
* Gaussian'dan daha uygun olabilecek başka dağıtımlar da olabilir - ters Gauss başka bir seçenektir - daha az yaygın olsa da; lognormal veya Weibull modelleri, GLM'ler durdukları gibi olmasa da, oldukça faydalı olabilirler.
[Nadiren bu dağılımlardan herhangi birinin mükemmel tanımlara yakın olması söz konusudur; bunlar kesin olmayan yaklaşımlardır, ancak çoğu durumda analizin yararlı ve istenen özelliklere yakın olması yeterince iyidir.]
Sınav puanlarının da sadece pozitif değerlerle sürekli olacağına inanıyorum, neden orada normal bir dağılım kullanalım?
Çünkü (daha önce bahsettiğim koşullar altında - çok fazla bileşen, çok bağımlı değil, zor ya da kolay değil) dağıtım oldukça simetrik, tek modlu ve ağır kuyruklu olma eğilimindedir.