İstatistiksel model gösterimi için herhangi bir “standart” var mı?


10

Örneğin, BUGS kılavuzunda veya Lee ve Wagenmakers'ın ( pdf ) yaklaşan kitabında ve diğer birçok yerde, çoğu istatistiksel modeli özlü bir şekilde tanımlamak için kullanılabileceği için çok esnek göründüğü bir tür gösterim kullanılır. Bu gösterime örnek olarak şunlar verilebilir:

yiBinomial(pi,ni)log(pi1pi)=bibiNormal(μp,σp)

yordayıcısı olmayan, ancak grubuyla hiyerarşik bir lojistik modeli tanımlar . Modelleri tanımlamanın bu yolu, sık ve Bayes modellerini tanımlamak için eşit derecede iyi çalışıyor gibi görünmektedir, örneğin, bu model tanımını tam olarak Bayes yapmak için ve eklemeniz .i=1nμpσp

Bu tür bir model gösterim / biçimcilik bazı makalelerde veya kitaplarda ayrıntılı olarak açıklanmış mı?

Modelleri yazmak için bu gösterimi kullanmak istiyorsanız, bir şeyler yapmanın birçok farklı yolu vardır ve hem takip etmek hem de başkalarına referans vermek için kapsamlı bir rehberle gerçekten yararlı olacaktır. İnsanların bu tür gösterimleri nasıl kullandıkları konusunda bazı farklılıklar buldum:

  • Dağılımlara ne denir? Örneğin, , vb. .N,N,Norm,Normal
  • Endekslerle nasıl başa çıkıyorsunuz? Örneğin, , , vb.yijyi[j]yj|i
  • Parametreler için genellikle hangi parametre sembolleri kullanılır. Örneğin , normal dağılım için ortalama olarak kullanmak yaygındır , ama diğer dağılımlar ne olacak? (Bunun için genellikle Wikipedia'nın dağıtımlarını kontrol ediyorum )μ

Takip eden soru: Bu gösterimin adı var mı? (Daha iyi bir isim olmaması için yazdığım bir blog yazısında olasılık dağıtım merkezli konvansiyonu dedim ...)

Yanıtlar:


2

İstatistiksel gösterim için önerilen bazı standartlar Halperin, Hartley ve Hoel (1965) ve Sanders ve Pugh'da (1972) sunulmaktadır . Mevcut gösterimin çoğu, 19. yüzyılın sonlarında ve 20. yüzyılın başlarında biyometrik istatistikçiler tarafından kurulan sözleşmelerden geliyor (çoğu Pearson ve Fisher ve ortakları tarafından yapıldı). Gösterimin erken kullanımlarının faydalı bir listesi burada iktisatçı John Aldrich tarafından tutulur ve İngiliz biyometrik okulunun tarihi bir açıklaması Aldrich (2003) 'te yayınlanır . (Bu konuyla ilgili daha fazla sorunuz varsa, Aldrich muhtemelen istatistik notasyonu tarihinde dünyanın önde gelen yaşayan uzmanıdır.)

Bu açık çalışmanın yanı sıra, alana giriş yapan birçok kitap vardır ve bunlar, ortak sözleşmelerle tutarlı gösterimi tanımlamaya ve gösterimleri gittikçe tanımlamaya dikkat ederler. Bu alanda literatürde tutarlı olarak çalışan birçok tanınmış sözleşme vardır ve istatistikçiler, bu araştırmacıların tavsiyelerini okumadan bile, pratik yoluyla bunları iyi tanımaktadırlar.

Dağıtım merkezli gösterimin belirsizliği: "Dağıtım merkezli" gösterimin kullanılması, istatistiksel literatürde kullanılan standart bir sözleşmedir. Ancak, bu notasyon hakkında dikkat çeken ilginç bir şey, aslında ne anlama geldiğine dair biraz kıpır kıpır odanın olması. Standart kural, bu ifadelerin sağ tarafındaki nesneyi bir olasılık ölçüsünün bir tür açıklaması olarak okumaktır (örneğin, bir dağıtım fonksiyonu, yoğunluk fonksiyonu, vb.) Ve sonra"... dağılımı vardır ..." ya da "... olasılık ölçüsü vardır ..." vb. sol taraftaki nesne rastgele bir değişkendir ve sağ taraftaki nesne bir olasılık ölçüsünün açıklamasıdır.

Bununla birlikte, sağ tarafı rastgele bir değişkene (bir dağılımın aksine) bir referans olarak yorumlamak ve ilişkisini "... ile aynı dağılıma sahip" olarak okumak da eşit derecede geçerlidir. . Bu yorum altında ilişki, rasgele değişkenleri karşılaştıran bir denklik ilişkisidir ; sol ve sağ taraftaki nesneler hem rasgele değişkenlerdir, hem de ilişki refleksif, simetrik ve geçişlidir.

Bu, aşağıdaki gibi bir ifadenin iki olası (ve aynı derecede geçerli) yorumunu verir:

XN(μ,σ2).
  • Dağılımsal yorumlama: " olasılık dağılımı ". Bu yorum, son nesneyi normal bir olasılık ölçüsünün (örneğin yoğunluk fonksiyonu, dağılım fonksiyonu, vb.) Bir açıklaması olarak kabul eder.N ( μ , σ 2 )XN(μ,σ2)

  • Rastgele değişken yorumu: " , aynı olasılık dağılımına sahiptir ". Bu yorum, ikinci nesneyi normal bir rastgele değişken olarak alır.N ( μ , σ 2 )XN(μ,σ2)

Her yorumun avantajları ve dezavantajları vardır. Rastgele değişken yorumlanması avantajı, standart sembol kullanmasıdır bir atıfta denklik göre , ancak dezavantajı dağıtım işlevlerine benzer gösterimi ile rastgele değişkenler için bir referans gerektirmesidir. Dağılımsal yorumlamanın avantajı, bir bütün olarak dağılımlar ve belirli bir argüman değerine sahip fonksiyonel formları için benzer gösterimi kullanmasıdır; dezavantajı, sembolünü denklik ilişkisi olmayan bir şekilde kullanmasıdır.


Aldrich, J. (2003) İngiliz Biyometrik Okulu Uluslararası İstatistiksel İncelemenin Dili 71 (1) , s. 109-131.

Halperin, M., Hartley, HO ve Hoel, PG (1965) İstatistiksel Semboller ve Gösterim için Önerilen Standartlar . Amerikan İstatistikçi 19 (3) , s. 12-14.

Sanders, JR ve Pugh, RC (1972) Standart İstatistiksel Semboller ve Gösterimler İçin Tavsiye . Eğitim Araştırmacısı 1 (11) , s. 15-16.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.