Gama rasgele değişkenlerinin genel toplamı


35

I adres okuma aynı ölçek parametresi ile Gama rastgele değişkenlerin toplamı başka Gama rastgele değişken olduğunu. Ayrıca Moschopoulos'un genel bir Gamma rasgele değişken setinin toplanması için bir yöntemi tanımlayan makalesini de gördüm . Moschopoulos'un yöntemini uygulamaya çalıştım ancak henüz başarılı olamadım .

Genel bir Gamma rasgele değişken kümesinin toplamı nasıl görünür? Bu soruyu somutlaştırmak için neye benziyor:

Gamma(3,1)+Gamma(4,2)+Gamma(5,1)

Yukarıdaki parametreler özellikle açıklayıcı değilse, lütfen başkalarını önerin.


4
Her iki Gamma dağıtımının toplamı için açık bir çözüm , istatistik.stackexchange.com/a/252192 adresinde yayınlanmıştır .
whuber

Tüm Gama dağılımlarının şekil parametresi 1'e sahip olduğu (yani üstel oldukları) bunun özel bir örneği hipo-eksensel dağılım (aile) olarak adlandırılır . Sadece iki adet üstel dağılım için, istatistik.stackexchange.com/questions/412849 adresinde verilen açık bir formül de vardır .
whuber

Yanıtlar:


37

İlk önce, aynı ölçek faktörüne sahip olan toplamları birleştirin : a artı a değişkeni, bir değişkeni oluşturur.Γ(n,β)Γ(m,β)Γ(n+m,β)

Daha sonra, karakteristik fonksiyonu (bakınız) gözlemleyin olan , bu dağılımların toplamının cf ürünüdür neredenΓ(n,β)(1iβt)n

j1(1iβjt)nj.

Tüm hepsi bütünleşik, kısmi fraksiyon olarak, bu ürünün genişler bir içine lineer kombinasyonu arasında burada arasındaki tam sayılardır ve . olan örnekte ( ve 'in toplamından ) ve bulduk. ( 1 - i β j t ) - v ^ v ^ 1 , n jnj (1iβjt)νν1njΓ ( 3 , 1 ) Γ ( 5 , 1 ) β 2 = 2 , n, 2 = 4β1=1,n1=8Γ(3,1)Γ(5,1)β2=2,n2=4

1(1it)81(12it)4=1(x+i)88i(x+i)740(x+i)6+160i(x+i)5+560(x+i)41792i(x+i)35376(x+i)2+15360ix+i+256(2x+i)4+2048i(2x+i)39216(2x+i)230720i2x+i.

Cf almanın tersi, ters olan Fourier Dönüşümüdür, yani doğrusaldır : bu terimi terim olarak uygulayabileceğimiz anlamına gelir. Her terim bir Gama dağılımının cf katı olarak tanınır ve böylece PDF'yi vermek için kolayca tersine çevrilir . Örnekte elde ettik

e-tt75040+190e-tt6+13e-tt5+203e-tt4+83e-t2t3+2803e-tt3-128e-t2t2+896e-tt2+2304e-t2t+5376e-tt-15360e-t2+15360e-t

Toplamın PDF'si için.

Bu, toplam içindekilere eşit ölçek faktörlerine ve toplam içindeki değerlere eşit veya daha küçük olan şekil faktörlerine sahip sonlu bir Gamma dağılımının karışımıdır . Özel durumlar dışında (bazı iptallerin olabileceği durumlarda), terimlerin sayısı toplam şekil parametresi tarafından verilir (tüm farklı olduğu varsayılarak ).n jn1+n2+nj


Bir test olarak, burada ve dağılımlarından bağımsız çizimler ekleyerek elde edilen sonuç histogramı . Üzerinde , önceki işlevin katı olan grafik üst üste getirilir . Uyum çok iyi. Γ ( 8 ,104Γ ( 4 , 2 ) 10 4Γ(8,1)Γ(4,2)104

şekil


Moschopoulos, toplamın cf'sini sonsuz bir Gamma karakteristik fonksiyon dizisine genişleterek bu fikri bir adım öteye taşıyor ve bir veya daha fazlası integral olmadığında sonsuz serileri sonlandırıyor ve sonra da sonsuz serileri makul derecede iyi olduğu bir noktada sonlandırıyor.nben


2
Küçük Yorum: Tipik haliyle, sonlu bir karışım formu bir pdf anlamına gelir burada ve olduğunu, olan Olasılıklar ve pdf, olasılıkları ile ortaya çıkan çeşitli koşullar göz önüne alındığında , koşullu pdf'lerin (toplam olasılık yasası) ağırlıklı toplamı olarak yorumlanabilir . Bununla birlikte, yukarıdaki toplamda, bazı katsayılar negatiftir ve bu nedenle karışımın standart yorumu geçerli değildir. a i > 0 i a i = 1 a i a i
f(x)=Σben=1nbirbenfben(x)
birben>0Σbenbirben=1birbenbirben
Dilip Sarwate

@Dilip Bu iyi bir nokta. Bu durumu ilginç yapan şey, bazı katsayıların olumsuz olmasına rağmen, yine de bu kombinasyonun hala geçerli bir dağılım olduğudur (inşaat tarafından).
whuber

Bu yaklaşım bağımlı değişkenlerin eklenmesi için genişletilebilir mi? Özellikle, her biri diğerleriyle korelasyon içinde olan 6 dağıtım eklemek istiyorum.
masher

11

Uygulanması oldukça kolay olan ve bugünün R yazılımıyla mümkün olan başka bir çözümü göstereceğim. Bu, daha geniş bilinmesi gereken saddlepoint yoğunluk yaklaşımıdır!

Gama dağılımı hakkında terminoloji için, ben takip edecek https://en.wikipedia.org/wiki/Gamma_distribution şekil / ölçek parametreleriyle birlikte, şekil parametresi ve θ ölçektir. Saddlepoint yaklaşımı için Ronald W Butler: "Uygulamaları ile saddlepoint yaklaşımları" (Cambridge UP). Saddlepoint yaklaşımı burada açıklanmıştır: Saddlepoint yaklaşımı nasıl çalışır? Burada bu uygulamada nasıl kullanıldığını göstereceğim.kθ

X

M(s)=EesX
s
K(s)=günlükM(s)
K ' ( ler ) = x sEX=K'(0),var(X)=K"(0)
K'(s^)=x
bu, bir fonksiyonu olarak tanımlar ( aralığında olmalıdır ). Örtük olarak tanımlanmış bu işlevi olarak yazıyoruz . Saddlepoint denkleminin her zaman tek bir çözüme sahip olduğuna dikkat edin, çünkü kümülant işlevi dışbükeydir. sx s ( x )xXs^(x)

Sonra yoğunluk için saddlepoint yaklaşım arasında ile verilir Bu yaklaşık yoğunluk işlevinin 1 değerine entegrasyonu garanti edilmez, normalize edilmemiş saddlepoint yaklaşımıdır. Daha iyi bir yaklaşım elde etmek için onu sayısal olarak bütünleştirebilir ve yeniden düzenleyebiliriz. Ancak bu yaklaşımın negatif olmadığı garanti edilir.ff ( x ) = 1X

f^(x)=12πK"(s^)exp(K(s^)-s^x)

Şimdi 'in bağımsız gama rasgele değişkenleri olmasına izin verin ; burada parametreleri ile sahiptir . Daha sonra kümülatif üretme işlevi için tanımlanmış . İlk türev ve ikinci türev Aşağıda bunu hesaplayan bazı kodlar vereceğim ve , , parametre değerlerini kullanacağımX i ( k i , θ i ) K ( s )X1,X2,,XnXi(ki,θi)

K(s)=i=1nkiln(1θis)
s<1/maksimum(θ1,θ2,...,θn) K"(ler)= N Σ i=1kiİçeride ISTV melerin RWMAIWi'nin 2 i
K'(s)=Σben=1nkbenθben1-θbens
n=3k=(1,2,3)θ=(1,2,3)
K"(s)=Σben=1nkbenθben2(1-θbens)2.
Rn=3k=(1,2,3)θ=(1,2,3). Aşağıdaki Rkodun, R 3.1'de verilen uniroot işlevinde yeni bir argüman kullandığını unutmayın , bu nedenle eski R'lerde çalışmaz.
shape <- 1:3 #ki
scale <- 1:3 # thetai
# For this case,  we get expectation=14,  variance=36
make_cumgenfun  <-  function(shape, scale) {
      # we return list(shape, scale, K, K', K'')
      n  <-  length(shape)
      m <-   length(scale)
      stopifnot( n == m, shape > 0, scale > 0 )
      return( list( shape=shape,  scale=scale, 
                    Vectorize(function(s) {-sum(shape * log(1-scale * s) ) }),
                    Vectorize(function(s) {sum((shape*scale)/(1-s*scale))}) ,
                    Vectorize(function(s) { sum(shape*scale*scale/(1-s*scale)) }))    )
}

solve_speq  <-  function(x, cumgenfun) {
          # Returns saddle point!
          shape <- cumgenfun[[1]]
          scale <- cumgenfun[[2]]
          Kd  <-   cumgenfun[[4]]
          uniroot(function(s) Kd(s)-x,lower=-100,
                  upper = 0.3333, 
                  extendInt = "upX")$root
}

make_fhat <-  function(shape,  scale) {
    cgf1  <-  make_cumgenfun(shape, scale)
    K  <-  cgf1[[3]]
    Kd <-  cgf1[[4]]
    Kdd <- cgf1[[5]]
    # Function finding fhat for one specific x:
    fhat0  <- function(x) {
        # Solve saddlepoint equation:
        s  <-  solve_speq(x, cgf1)
        # Calculating saddlepoint density value:
        (1/sqrt(2*pi*Kdd(s)))*exp(K(s)-s*x)
    }
    # Returning a vectorized version:
    return(Vectorize(fhat0))
} #end make_fhat

 fhat  <-  make_fhat(shape, scale)
plot(fhat, from=0.01,  to=40, col="red", main="unnormalized saddlepoint approximation\nto sum of three gamma variables")

aşağıdaki arsada sonuçlanan: görüntü tanımını buraya girin

Normalleştirilmiş saddlepoint yaklaşımını bir egzersiz olarak bırakacağım.


1
Bu ilginç, ancak Rkodunuzu, yaklaşımı tam cevapla karşılaştırmak için kullanamıyorum . Çağırma girişimi fhat, görünüşe göre kullanımında hatalar oluşturur uniroot.
whuber

3
R versiyonunuz nedir? Kodlar, R sürüm 3.1'de tanıtılan uniroot, extendInt komutunda yeni bir argüman kullanır. R'niz eskiyse, bunu kaldırmayı deneyebilirsiniz (ve uniroot'a verilen aralığı uzatın). Ancak bu kod daha az sağlam hale getirecek!
kjetil b halvorsen

10

Welch-Satterthwaite denklemi bir vermek için kullanılabilecek yaklaşık bir gamma dağılımının şeklinde cevap. Bu, gama dağılımlarını (yaklaşık olarak) ek altında kapalı olarak ele almamıza izin verme özelliğine sahiptir. Bu yaygın olarak kullanılan Welch t-testindeki yaklaşımdır.

(Gama dağılımı, ölçeklenmiş ki kare kare dağılımı olarak görülebilir ve tamsayı olmayan şekil parametresine izin verir.)

Yaklaşımı , gama dağılımının parametrelerine uyarladım:k,θ

ksum=(Σbenθbenkben)2Σbenθben2kben

θsum=Σθbenkbenksum

Let ,k=(3,4,5)θ=(1,2,1)

Böylece yaklaşık olarak Gamma elde ederiz (10.666 ..., 1.5)

biçim parametresinin aşağı yukarı toplamlandığını, ancak girdi ölçek parametreleri farklı olduğu için biraz daha az olduğunu görüyoruz . , toplamın doğru ortalama değere sahip olduğu şekildedir.θ i θkθbenθ


6

Bir kesin çözüm evrişimi (yani, miktar) gama dağılımları Denklem olarak verilir. (1) DiSalvo tarafından verilen bağlantılı pdf'te . Bu biraz uzun olduğu için, buraya kopyalamak biraz zaman alacak. Sadece iki gama dağılımı için, kapalı formdaki tam toplamları Denk. (2) DiSalvo ve Denk. (5) Wesolowski ve ark. Özgeçmiş sitesinde de bu sorunun cevabı olarak görünmektedir . Yani,nG,birmmbir(a,b)y(a,1/b)bP

G,DC(bir,b,α,β;τ)={bbirβαΓ(bir+α)e-bττbir+α-11F1[α,bir+α,(b-β)τ],τ>00,τ0,
yukarıdaki sorulardaki gösterim; , burada. Yani, ve burada hız sabitleridir ve zaman skalarları değildir.G,birmmbir(bir,b)Γ(bir,1/b)bβ
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.