Dağıtım tam olarak nedir?


16

Olasılık ve İstatistik hakkında çok az şey biliyorum ve öğrenmek istiyorum. "Dağıtım" kelimesinin her yerde farklı bağlamlarda kullanıldığını görüyorum.

Örneğin, ayrı bir rastgele değişkenin "olasılık dağılımı" vardır. Bunun ne olduğunu biliyorum. Sürekli bir rastgele değişken için, daha sonra bir olasılık yoğunluk fonksiyonu vardır xR integralin, için x olasılık yoğunluk fonksiyonunun değerlendirilen kümülatif dağılım fonksiyonu x .

Ve görünüşe göre sadece "dağıtım fonksiyonu" en azından sürekli rastgele değişkenlerden bahsederken "kümülatif dağılım fonksiyonu" ile eş anlamlıdır (soru: her zaman eşanlamlı mıdır?).

Sonra birçok ünlü dağıtım var. Γ dağıtım χ2 dağıtım, vb. Ama Γ dağıtım tam olarak nedir? Γ rasgele değişkenin kümülatif dağılım fonksiyonu mudur? Veya Γ rasgele değişkenin olasılık yoğunluk fonksiyonu ?

Ancak, sonlu veri kümesinin bir frekans dağılımı histogram gibi görünür.

Uzun lafın kısası: Olasılık ve İstatistik'te "dağıtım" kelimesinin tanımı nedir?

Matematikte dağılımın tanımını biliyorum (endüktif limit topolojisi ile donatılmış test fonksiyonlarının toplanmasının ikili boşluğunun bir unsuru), ancak Olasılık ve İstatistik.


1
İlgili Wikipedia makalesi , konuya iyi bir giriş gibi görünüyor.
Aleksandr Blekh

1
Kesinlikle, 'dağıtım' ve 'cdf' eş anlamlı olarak kabul edilmelidir, ancak 'dağıtım' genellikle çok daha gevşek bir anlamda kullanılır ve genellikle bir yoğunluk / pmf'ye atıfta bulunmak için kullanılır.
Glen_b

3
Bir dağıtım anlayışınız olasılıkta olana oldukça yakındır; temel fark, olasılıkta olanların bazı ek özelliklere sahip olmalarıdır (pozitif ve birliğe normalize olma). Bağlantı, tanımınızın ilişkili beklenti operatörü açısından bir dağıtım oluşturmasıdır. İstatistiklerde yaygın olarak kullanılan (ciddi) bir dil kötüye kullanımı vardır ve bu da parametreli bir dağılım ailesini "dağıtım" olarak adlandırır. Son olarak, herhangi bir sonlu veri kümesi, ondan örnekleme yoluyla elde edilen bir dağılımı, "ampirik dağılımı" nı belirler.
whuber

@whuber Bu yardımcı olur, teşekkürler Özellikle dilin kötüye kullanılması. Bir fonksiyonun belirsiz bir integralini çağırmak gibi bir şey ... bir fonksiyon.
danzibr

İyi cevapları olan benzer bir soru: stats.stackexchange.com/questions/210403/…
kjetil b halvorsen

Yanıtlar:


7

Aşağıdakiler değeri rastgele değişkenler içindir. Eğer ilgilenirseniz, diğer alanlara uzantı doğrudan ileri. Aşağıdaki biraz daha genel tanımın yoğunluk, kütle ve kümülatif dağılım fonksiyonları göz önüne alındığında ayrı olarak daha sezgisel olduğunu savunuyorum.R

Metni düzeltmek için bazı matematiksel / olasılıklı terimler ekliyorum. Eğer kişi bu terimlere aşina değilse, sezgi sadece "Borel kümeleri" ni " aklınıza gelebilecek herhangi bir alt kümesi" olarak düşünerek ve rastgele değişken a ile bazı deneylerin ilişkili olasılık.R


Let bir olasılık alanı ve olmak X ( ω ) bir R, - bu alan üzerinde rastgele değişken değerli.(Ω,F,P)X(ω)R

Ayar fonksiyonu , burada A bir Borel kümesidir, X'in dağılımı olarak adlandırılır.Q(A):=P(ωΩ:X(ω)A)AX

Kelimelerle, dağılım (gevşekçe konuşursak), herhangi bir alt kümesi için , X'in o kümedeki bir değeri alma olasılığını söyler . Q'nun tamamen F ( x ) fonksiyonu ile belirlendiğini kanıtlayabilir : = P ( X x ) ve tersi. Bunu yapmak için - ve burada ayrıntıları atlıyorum - F olasılığını atayan Borel setleri üzerinde bir ölçü oluşturRXQF(x):=P(Xx) tüm kümelerine ( - , x ) ve bu sonlu önlem hemfikir olduğunu iddia Q a üzerindeF(x)(,x)Q Borel σ - cebirinioluşturan sistem.πσ

Bu durumda, Q ( A ) = A f ( x ) d x sonra f olarak yazılabilirQ(A)Q(A)=Af(x)dxf için bir yoğunluk fonksiyonu , bu yoğunluk benzersiz belirlenmemiş olmasına rağmen, ve görebilirsiniz (değişiklikleri dikkate Lebesgue kümeleri sıfırı ölçer), X'in dağılımı olarak f'den bahsetmek de mantıklıdır . Ancak genellikle buna X'in olasılık yoğunluk fonksiyonu diyoruz .QfXX

Benzer şekilde, bu yüzden olur olarak yazılabilir S ( A ) = Σ i bir { ... , - 1 , 0 , 1 ,Q(A),f'denbahsetmek mantıklıdırX'indağılımı olarak,buna genellikle olasılık kütle fonksiyonu diyoruz.Q(A)=iA{,1,0,1,}f(i)fX

Böylece, " [ 0 , 1 ] üzerinde eşit bir dağılım izler " gibi bir şeyi okuduğunuzda , X'in belirli kümelerde değerleri alma olasılığını söyleyen Q ( A ) fonksiyonunun , olasılık yoğunluk fonksiyonu f ( x ) = I [ 0 , 1 ] veya kümülatif dağılım fonksiyonu F ( x ) = x - f ( t )X[0,1]Q(A)Xf(x)=I[0,1] .F(x)=xf(t)dt

Rasgele bir değişkenten bahsetmediği, sadece bir dağılımın olduğu durumda son bir not. Bir dağılım fonksiyonu (veya bir kütle, yoğunluk veya kümülatif dağılım fonksiyonu) verildiğinde, bu dağılıma sahip rastgele bir değişkene sahip bir olasılık alanı mevcut olabilir. Dolayısıyla, bir dağılım hakkında veya bu dağılıma sahip rastgele bir değişken hakkında konuşmada esasen bir fark yoktur. Bu sadece bir odağın konusu.


3

Let , izin bir olasılık uzay ( X , B ) ölçülebilir bir alan olabilir ve izin X : Ω X olduğu ölçülebilir fonksiyon, araçlar X - 1 ( B ) = { ω : X, ( ω ) B } F her B B için . Dağılımı X olasılık ölçüsüdür μ(Ω,F,P)(X,B)X:ΩXX1(B)={ω:X(ω)B}FBB X üzerinde ( x , B ) ile tanımlananBorel sigma-alanıdır, fonksiyon bakınız X rastgele "değişken" olarak adlandırılmaktadır.μX(X,B) . Tüm X = R ve BμX(B)=P(XB)X=RBX


1
çok az olasılık ve istatistik bilgisi olan insanlar için çok açık olmalıdır :)
Alexey Grigorev

3
OP, "endüktif limit topolojisi ile donatılmış test fonksiyonlarının toplanmasının ikili boşluğunun elemanı" gibi gelişmiş matematik öğelerini biliyor gibi görünüyor. Sorusunun sonunu kontrol edin.
Zen

2
Gerçekten benim için iyi bir yanıttı. Bir olasılık uzayının tanımını kontrol etmem gerekiyordu, ancak matematik geçmişine sahip bir kişi için açıktı. Yanıtın kısaltmasını takdir ettim, sadece diğer cevaptaki detaydan dolayı kabul etmedim.
danzibr

1

Soru ve cevaplar şimdiye kadar teorik dağılımlara odaklanmış gibi görünüyor. Ampirik dağılımlar, dağılımların daha sezgisel bir şekilde anlaşılmasını sağlar.

Misal

İp atlamadaki bir sınıf turnuvası sırasında, bir sınıfı atlama ipi içindeki tüm çocukları gözlemliyoruz. İlk çocuk iki kez atlayabilir, ikinci dört kez, sonraki on beş kez, vs. Atlar sayısını kaydederiz. Çocukların beşi her biri sekiz kez atladı, ancak çocuklardan sadece biri iki kez atladı. Sekiz kez zıplamanın iki kez zıplamaktan farklı şekilde dağıldığını söylüyoruz.

Gözlemlenen bir dağılım için göze çarpan bir tanım, bir değişkenin gözlenen her değeri için gerçekleşme sıklığıdır.

Çıkarımsal istatistiklerde, teorik dağılımları gözlemlenen dağılımlara sığdırmaya çalışırız, çünkü teorik dağılımların varsayımlarıyla çalışmak istiyoruz. Teorik dağılımlar için benzer bir tanıma, "gözlemlenen" yerine "gözlenebilir" olarak geçerek veya daha kesin olmak gerekirse: "beklenen" olarak erişebilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.