GLM'de kaç dağıtım var?


11

Ders kitaplarında GLM'nin 5 dağılımla (viz., Gama, Gauss, Binom, Ters Gauss ve Poisson) açıklandığı birden fazla yer belirledim. Bu, R'deki aile işlevinde de örneklenmiştir.

Bazen ek dağıtımların dahil edildiği GLM referanslarına rastlarım ( örnek ). Birisi bu 5'in neden özel olduğunu veya her zaman GLM'de olduğunu ancak bazen başkalarının olduğunu açıklayabilir mi?

Şimdiye kadar öğrendiğim kadarıyla, üstel ailede GLM dağılımlarının hepsi şu forma sığmaktadır: burada dağılım parametresi ve standart parametredir.

f(y;θ,ϕ)=exp{yθb(θ)ϕ+c(y,ϕ)}
ϕθ

Herhangi bir dağıtım GLM'ye sığacak şekilde dönüştürülemez mi?


5
Açıkçası, tekdüze dağılım üstel aileye ait değildir.
Zhanxiong

Güzel soru. Örneğin lognormal ne olacak?
Michael M

1
@Zhanxiong, tekdüze bir beta dağıtımı örneği değil ve beta dağıtımı üstel ailede mi?
shf8888

@ shf8888 AFAIK, gama dağılımına yaklaştığında sınırda sadece üstel bir aile dağılımıdır.
shadowtalker

@Zhanxiong, açıkladığın için teşekkürler! Özür dileriz, haklısınız, bilinmeyen sınırlarla üstel bir aile dağılımı değil.
shf8888

Yanıtlar:


4

Belirttiğiniz gibi, bir GLM'de dağıtım kullanma yeterliliği, üstel ailenin olmasıdır (not: bu, üstel dağılımla aynı şey değildir ! Her ne kadar üstel dağılım, bir gama dağılımı olarak, üstel aile). Listelediğiniz beş dağıtım, bu ailenin tamamıdır ve daha da önemlisi, ÇOK yaygın dağıtımlardır, bu nedenle örnek ve açıklama olarak kullanılırlar.

Zhanxiong'un belirttiği gibi, tekdüze dağılım (bilinmeyen sınırlarla), üstel olmayan bir aile dağılımının klasik bir örneğidir. shf8888 genel üniforma dağılımını herhangi bir aralıkta bir Üniforma ile karıştırmaktadır (0, 1). Üniforma (0,1) dağılımı beta dağılımı, özel bir durumdur olduğu üstel ailesi. Diğer üstel olmayan aile dağılımları, karışım modelleri ve t dağılımıdır.

Üstel ailenin doğru tanımına sahipsiniz ve standart parametre GLM'yi kullanmak için çok önemlidir. Yine de, üstel aileyi şöyle yazarak anlamayı biraz daha kolay buldum:

f(x;θ)=a(θ)g(x)exp[b(θ)R(x)]

Bunu yazmak için bir skaler yerine vektörü ile daha genel bir yol vardır ; ancak tek boyutlu durum çok açıklıyor. Özellikle, iki fonksiyonları, bilinmeyen parametre birine faktörü için yoğunluk dışı exponentiated parçası olmalıdır ancak gözlenen değil veri ve biri değil ; ve aynı üslü kısım için de geçerlidir. Örneğin binom dağılımının bu şekilde nasıl yazılabileceğini görmek zor olabilir; ama bazı cebirsel hokkabazlıklarla netleşir.θθθxxθ

Üstel aileyi kullanıyoruz çünkü birçok şeyi çok daha kolay hale getiriyor: örneğin, yeterli istatistik bulmak ve hipotezleri test etmek. GLM'de, kanonik parametre genellikle bir bağlantı işlevi bulmak için kullanılır. Son olarak, istatistikçiler (diyelim ki, üzerinde herhangi bir klasik istatistiksel çıkarsama, bir Uniform yapmaya çalışıyor hemen her durumda üstel ailesi kullanmayı tercih niçin ilgili bir illüstrasyon , ikisi) dağıtım nerede ve bilinmemektedir . İmkansız değil, ancak üstel aile dağılımları için aynı şeyi yapmaktan çok daha karmaşık ve ilgili.θ1θ2θ1θ2


Her iki parametrenin bilinmediği beta dağılımı hala üstel bir ailedir (ancak 2 parametreli üstel bir ailedir). Sizi bunun olmadığını düşünmeye iten nedir? www2.stat.duke.edu/courses/Spring11/sta114/lec/… veya wikipedia
DavidR

Bunu işaret ettiğiniz için teşekkürler, yorumumu değiştirdim ... haklısın! Ne demek istediğimi gerçekten bilmiyorum
Henry
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.