Olasılık işaretlerinin anlamı ve


27

Birçok kitap ve makalede sıkça kullanılan ve notasyonu arasındaki anlam farkı nedir ?P(z;d,w)P(z|d,w)


13
f (x; θ), f (x | θ) ile aynıdır, yani θ'nin sabit bir parametre olduğu ve f işlevinin x'in bir işlevi olduğu anlamına gelir. f (x, Θ), OTOH, elemanların Θ ile indekslendiği, fonksiyon ailesinin (küme) bir elemanıdır. İnce bir ayrım, belki, ama önemli olan, esp. Bilinen bir veriyi temel alarak basis bilinmeyen bir parametre tahmin etme zamanı geldiğinde; o zaman, θ değişkenlik gösterir ve x sabittir, "olasılık işlevi" ile sonuçlanır. "|" Kullanımı istatistikçiler arasında daha yaygındır, ";" matematikçiler arasında.
jbowman

Evet jbowman haklı. Bazen buna given verilen X yoğunluğu diyoruz.
Michael R. Chernick

@jbowman neden bunu cevap olarak yayınlamıyor? Tek sorum - ikisi de neden kullanacağınızı, ama içeriği ile ilgili bir şey olduğunu varsayalım (| ";" "ile "" "P" ve birlikte kullanılır "). f
Abe

İyi düşünce, Abe; Muhtemelen budur. daha genel, sanırım. f
jbowman

Yanıtlar:


12

Bunun kökeninin olasılık paradigması olduğuna inanıyorum (aşağıdaki asıl tarihsel doğruluğu kontrol etmemiş olsam da, iot'un nasıl gerçekleştiğini anlamanın makul bir yoludur).

Diyelim ki bir regresyon ayarında bir dağılımınız olurdu: p (Y | x, beta). Bunun anlamı: eğer x ve beta değerlerini bildiğinizden (koşullu) Y'nin dağılımı.

Betaları tahmin etmek istiyorsanız, olasılığını en üst düzeye çıkarmak istersiniz: L (beta; y, x) = p (Y | x, beta) Temel olarak, şimdi p (Y | x, beta) ifadesine bakıyorsunuz. Beta'nın bir işlevi, ancak bunun dışında, bir fark yoktur (düzgün bir şekilde türetebileceğiniz matematiksel doğru ifadeler için, bu bir zorunluluktur - pratikte kimseyi rahatsız etmiyor olsa da).

Daha sonra, bayes ayarlarında, parametreler ve diğer değişkenler arasındaki fark çok geçmeden kaybolur, böylece biri sizin için her iki notasyonu birbirine karıştırır.

Yani, özünde: gerçek bir fark yoktur: ikisi de soldaki şeyin koşullu dağılımını, sağdaki şey (ler) in koşullu dağılımını gösterir.


23

X x θ f ( x , θ ) X Θ ( x , θ ) Θ f ( x | θ ) X Θf(x;θ) rastgele değişken yoğunluğudur noktasında ile, dağılımının parametredir. , ve noktadaki eklem yoğunluğudur ve yalnızca rastgele bir değişken olması durumunda anlamlıdır . , verilen koşullu dağılımıdır ve yine, yalnızca rasgele bir değişken olup olmadığının anlamı vardır . Kitabın içine daha fazla girip Bayesian analizine baktığınızda bu çok daha netleşecektir.Xxθf(x,θ)XΘ(x,θ)Θf(x|θ)XΘΘ


Uhhhh ... koşullu dağılımı ise x verilen θ bile çok mantıklı θ rastgele değişken değildir. Nerede, klasik istatistiklerinde hemen hemen standart gösterim var θ rastgele değişken değildir. f(x|θ)xθθθ
jbowman

Uhhhh .... eğer P [Θ = θ] = 1 (sol random rastgele bir değişken, sağ θ bir sabittir) demek için yorum yaparsanız kabul ediyorum. Aksi taktirde ... peki şartlı dağılım tanımının paydasında P [Θ = θ] ne anlama geliyor?
PeterR

Payda? yazabilirim ; burada f , Bayes Kuralı'na bakmadan Normal bir dağılımdır. μ ve σ sabittir. Diğerleri de, örneğin, ll.mit.edu/mission/communications/ist/publications/… . x~f(x|μ,σ)fμσ
jbowman

jbowman, p (x | μ, σ) random ve σ sabit sayılar (rasgele değişkenler değil) koşullu yoğunluk olarak tanımlamanız nedir?
PeterR,

1
F (X | Y) notasyonu ile ilişkilendirilmiş "koşullu" kelimesi, "meydana gelen bazı rastgele olaylara bağlı" olarak tanımlanmaktadır. Sadece "verilen" gibi, "f (x) verilen (belirli) μ ve σ" değerlerinde olduğu gibi başka bir şey ifade ediyorsanız, o zaman f (x; μ, σ) notasyonu budur. için. OP, gösterimin ne anlama geldiğini sorduğundan, cevaptaki gösterimler konusunda kesin olmalıyız.
PeterR

18

f(x;θ) ,f(x|θ) aynıdır, yaniθ sabit bir parametre olduğu vef işlevininx bir işleviolduğuanlamına gelir. f(x,Θ) , OTOH, elemanlarınΘ ile indekslendiği bir işlev ailesinin (veya kümesinin) bir öğesidir. İnce bir ayrım, belki, ama önemli olan, esp. bilinmeyen bir parametre tahmin etmek için zamanı geldiğindeθ bilinen veriler temelindex ; o sırada,θ değişir vexsabittir, "olabilirlik işlevi" ile sonuçlanır. | kullanımı istatistikçiler arasında daha yaygındır ;matematikçiler arasında.


1
Nasıl olduğunu sözlü olarak konuşulan? "X'in x'i θ" mı diyorsun? f(x;θ)
stackoverflowuser2010

@ stackoverflowuser2010 - evet, aynen öyle.
jbowman

2
Bazı Coursera videolarında Stanford profesörü Andrew Ng'in noktalı virgülün "tarafından parametrelediği" şeklinde sözlü olarak yazıldığını gördüm. Bakınız: class.coursera.org/ml-005/lecture/34 . Bu nedenle örnek "theta tarafından parametrelenen x f" ifadesi olarak söylenir.
stackoverflowuser2010

5
“Verilen” veya “şartlı” demek (genel olarak) “parametreleştirilmiş” den çok farklıdır. Birisi bunu görüp ikisinin eşdeğer olduğunu düşünmekten nefret ediyorum. "Parametreleştirilmiş" demek, yalnızca koşullu miktar, ilk terimde değişkenin pdf'lerini endeksleyen bir parametre olduğunda uygundur. İki değişken için (örneğin, f (x; y)) bu terimi kullanmak yanlış olur.
ATJ

2
@MikeWilliamson - Elbette, her şeyin ne anlama geldiğini bildiğiniz ve ona bağlı kalabileceğiniz bir gösterim seçin! Bu şekilde, daha önce yaptığınız bir şeye geri döndüğünüzde, benim deneyimimden 4 saat önce olduğu gibi, bu "|" ifadesini kullandığınızda ne demek istediğinizi çözmeniz gerekmez. Katılıyorum, bu can sıkıcı bir durum, ancak bir süre sonra notun ilk kullanımını gözlemliyor ve kitabın kalan kısmı için hatırlıyorsunuz; Zaten farklılıklar genellikle önemli olan şey değil.
Jbowman

9

Her zaman bu şekilde olmamasına rağmen, bu günlerde genellikle d , w rasgele değişkenler olmadığında kullanılır (bu, bildikleri söylenemez). P ( z | d , w ) , d , w değerlerinde şartlandırmayı belirtir . Koşullandırma rasgele değişkenler üzerinde yapılan bir işlemdir ve d , w rastgele değişkenler olmadığında bu gösterimi kullanmak kafa karıştırıcıdır (ve trajik olarak yaygındır).P(z;d,w)d,wP(z|d,w)d,wd,w

@Nick Sabbe'nin işaret ettiği gibi, , gözlemlenen verilerin y örnekleme dağılımı için ortak bir gösterimdir . Bazı sık kullanılanlar bu gösterimi kullanacak ancak Θ'nin bir istismar IMO'su olan rastgele bir değişken olmadığı konusunda ısrar edecektir . Fakat orada tekelleri yok; Bayezyalıların da bunu yaptığını ve şartların sonunda sabit hiperparametreleri aştığını gördüm.p(y|X,Θ)yΘ


2
İkinci paragrafınıza göre, tipik istatistiksel durumlarda (örneğin, bir regresyon modeline uyma), ya rasgele bir değişken olarak kabul edilmediğine ya da bilinen bir sabitler dizisine değinildiği belirtilmelidir. X
gung - Reinstate Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.