Eğer gerçekten günlük olasılığını kastediyorsanız , cevap şudur: bu her zaman sıfır değildir.
Örneğin, Poisson verilerini düşünün: . için günlük olasılığı şu şekilde verilir:
Y = ( y 1 , … , y n ) ℓ ( μ ; Y ) = - n ∑ i = 1 μ i + n ∑ i = 1 y i log μ i - n ∑ i = 1 günlükyi∼Poisson(μi),i=1,…,nY=(y1,…,yn)
ℓ(μ;Y)=−∑i=1nμi+∑i=1nyilogμi−∑i=1nlog(yi!).(∗)
Ayırt içinde ile ilgili olarak için ve ayarlayın (bu, doymuş modeli için MLE elde nasıl):
Bu çözme almak , ikame içine geri için doymuş modelin log olasılık olduğu verir:
çok özel
olmadıkça değerler.( ∗ ) μ i 0 - 1 + y iℓ(μ;Y)(∗)μi0μi μ i=yi μ i(*)μiℓ( μ ;Y)=N Σ i=1yı(logyi-1)-N Σ i=1log(yi!)≠0yi
−1+yiμi=0.
μiμ^i=yiμ^i(∗)μiℓ(μ^;Y)=∑i=1nyi(logyi−1)−∑i=1nlog(yi!)≠0
yi
R
Fonksiyonun yardım sayfasında glm
, öğenin altında deviance
, belge bu sorunu şu şekilde açıklar:
deviance
sabit, eksi maksimize edilmiş günlük olasılığının iki katı. Mantıklı olduğunda, sabit, doymuş bir modelin sapma sıfıra sahip olacağı şekilde seçilir.
Bu bahsedilen olduğuna dikkat edin sapma yerine log olasılık doymuş modeli, sıfır olacak şekilde seçilir.
Muhtemelen, gerçekten onaylamak istediğiniz şey, " doymuş modelin sapması her zaman sıfır olarak verilir", ki bu, sapmadan, tanım gereği ( Alan tarafından Kategorik Veri Analizi (2. Baskı) Bölüm 4.5.1'e bakınız ) Agresti), belirtilen bir GLM'nin doymuş modele olasılık oranı istatistiğidir. constant
R belgelerinde yukarıda belirtilen aslında, doymuş modelin iki maksimize log olasılığıdır.
"Yine de, sapma formülünün verilme şekli bazen bu miktarın sıfır olmadığını gösterir" ifadesine gelince, muhtemelen sapma teriminin kullanımının kötüye kullanılması nedeniyledir . Örneğin, R, iki karşılaştırma olasılık oranı istatistik rasgele (iç içe) modelini ve da daha kesin olarak adlandırılan olacaktır sapma olarak ifade edilir farkı arasında sapma arasında ve sapma biz halinde Agresti'nin kitabında verilen tanımı yakından takip etti.M 2 M 1 M 2M1M2M1M2
Sonuç
Doymuş modelin log olasılığı genellikle sıfır değildir.
Doymuş modelin sapması (orijinal tanımında) sıfırdır.
Sapma aslında başka bir şey (sapmaların arasındaki fark) anlamına gelir yazılımların gelen çıkış (örneğin, R), genel sıfır olmayan bulunmaktadır.
Aşağıdakiler, genel üstel aile vakası ve başka bir somut örnek için türetilmiştir. Verilerin üstel aileden geldiğini varsayalım (bkz. S ile Modern Uygulamalı İstatistik , Bölüm ):
burada önceki ağırlıklar olarak bilinir ve dağılım / ölçek parametresidir (binom ve Poisson gibi birçok durum için bu parametre bilinirken, normal ve Gama gibi diğer durumlar için bu parametre bilinmemektedir). Ardından günlük olasılığı:
7
f(yi;θi,φ)=exp[Ai(yiθi−γ(θi))/φ+τ(yi,φ/Ai)].(1)
Aiφℓ(θ,φ;Y)=∑i=1nAi(yiθi−γ(θi))/φ+∑i=1nτ(yi,φ/Ai).
Poisson örneğinde olduğu gibi, doymuş modelin parametreleri aşağıdaki
skor işlevi çözülerek tahmin edilebilir :
0=U(θi)=∂ℓ(θ,φ;Y)∂θi=Ai(yi−γ′(θi))φ
Yukarıdaki denklemin çözümünü belirtin , sonra doymuş modelin günlük olasılığının genel formu (ölçek parametresini sabit olarak kabul edin):
θ^i
ℓ(θ^,φ;Y)=∑i=1nAi(yiθ^i−γ(θ^i))/φ+∑i=1nτ(yi,φ/Ai).(∗∗)
Önceki cevabımda, nin sağ tarafındaki ilk terimin her zaman sıfır olduğunu, yukarıdaki Poisson veri örneğinin yanlış olduğunu kanıtladığını yanlış söyledim. Daha karmaşık bir örnek için ekte verilen Gamma dağılımını düşünün .(∗∗)Γ(α,β)
Doymuş Gamma modelinin günlük olasılığındaki ilk terimin kanıtı sıfır değildir : Verilen
önce üstel aile formuna sahip olması için yeniden parametrelendirme yapmalıyız . izin doğrulanabilir
o zaman şu temsile sahiptir:
burada
f(y;α,β)=βαΓ(α)e−βyyα−1,y>0,α>0,β>0,
f(1)φ=1α,θ=−βα,
ff(y;θ,φ)=exp[θy−(−log(−θ))φ+τ(y,φ)],
τ(y,φ)=−logφφ+(1φ−1)logy−logΓ(φ−1).
Bu nedenle, doymuş modelin MLE'leri . Bu nedenle
çok özel değerler almadığı
sürece .
θ^i=−1yiyi∑i=1n1φ[θ^iyi−(−log(−θ^i))]=∑i=1n1φ[−1−log(yi)]≠0,
yi