Birçok kitap ve makalede sıkça kullanılan ve notasyonu arasındaki anlam farkı nedir ?
Birçok kitap ve makalede sıkça kullanılan ve notasyonu arasındaki anlam farkı nedir ?
Yanıtlar:
Bunun kökeninin olasılık paradigması olduğuna inanıyorum (aşağıdaki asıl tarihsel doğruluğu kontrol etmemiş olsam da, iot'un nasıl gerçekleştiğini anlamanın makul bir yoludur).
Diyelim ki bir regresyon ayarında bir dağılımınız olurdu: p (Y | x, beta). Bunun anlamı: eğer x ve beta değerlerini bildiğinizden (koşullu) Y'nin dağılımı.
Betaları tahmin etmek istiyorsanız, olasılığını en üst düzeye çıkarmak istersiniz: L (beta; y, x) = p (Y | x, beta) Temel olarak, şimdi p (Y | x, beta) ifadesine bakıyorsunuz. Beta'nın bir işlevi, ancak bunun dışında, bir fark yoktur (düzgün bir şekilde türetebileceğiniz matematiksel doğru ifadeler için, bu bir zorunluluktur - pratikte kimseyi rahatsız etmiyor olsa da).
Daha sonra, bayes ayarlarında, parametreler ve diğer değişkenler arasındaki fark çok geçmeden kaybolur, böylece biri sizin için her iki notasyonu birbirine karıştırır.
Yani, özünde: gerçek bir fark yoktur: ikisi de soldaki şeyin koşullu dağılımını, sağdaki şey (ler) in koşullu dağılımını gösterir.
X x θ f ( x , θ ) X Θ ( x , θ ) Θ f ( x | θ ) X Θ rastgele değişken yoğunluğudur noktasında ile, dağılımının parametredir. , ve noktadaki eklem yoğunluğudur ve yalnızca rastgele bir değişken olması durumunda anlamlıdır . , verilen koşullu dağılımıdır ve yine, yalnızca rasgele bir değişken olup olmadığının anlamı vardır . Kitabın içine daha fazla girip Bayesian analizine baktığınızda bu çok daha netleşecektir.
, aynıdır, yani sabit bir parametre olduğu ve işlevinin bir işleviolduğuanlamına gelir. , OTOH, elemanların ile indekslendiği bir işlev ailesinin (veya kümesinin) bir öğesidir. İnce bir ayrım, belki, ama önemli olan, esp. bilinmeyen bir parametre tahmin etmek için zamanı geldiğinde bilinen veriler temelinde ; o sırada, değişir vesabittir, "olabilirlik işlevi" ile sonuçlanır. kullanımı istatistikçiler arasında daha yaygındır matematikçiler arasında.
Her zaman bu şekilde olmamasına rağmen, bu günlerde genellikle d , w rasgele değişkenler olmadığında kullanılır (bu, bildikleri söylenemez). P ( z | d , w ) , d , w değerlerinde şartlandırmayı belirtir . Koşullandırma rasgele değişkenler üzerinde yapılan bir işlemdir ve d , w rastgele değişkenler olmadığında bu gösterimi kullanmak kafa karıştırıcıdır (ve trajik olarak yaygındır).
@Nick Sabbe'nin işaret ettiği gibi, , gözlemlenen verilerin y örnekleme dağılımı için ortak bir gösterimdir . Bazı sık kullanılanlar bu gösterimi kullanacak ancak Θ'nin bir istismar IMO'su olan rastgele bir değişken olmadığı konusunda ısrar edecektir . Fakat orada tekelleri yok; Bayezyalıların da bunu yaptığını ve şartların sonunda sabit hiperparametreleri aştığını gördüm.