CDF'ler PDF'lerden daha mı temeldir?


43

Statüm prof, temel olarak, eğer aşağıdaki üç taneden birine verildiyse diğer ikisini bulabileceğinizi söyledi:

  • Kümülatif dağılım fonksiyonu
  • Moment Oluşturma İşlevi
  • Olasılık Yoğunluk Fonksiyonu

Ancak ekonometri profesörüm CDF'lerin PDF'lerden daha temel olduğunu söyledi çünkü CDF'ye sahip olabileceğiniz örnekler var ama PDF tanımlanmadı.

CDF'ler PDF'lerden daha mı temeldir? Bir PDF'nin veya bir MGF'nin bir CDF'den türetilebileceğini nasıl bilebilirim?


23
Bu bir çeşit temel yarışması mı? Ünlü bir hakimler panelimiz var mı? Bu üç kavram, bir alandaki ölçüleri tanımlamak için kullanılabilir . Ancak, verilen CDF için, MGF ve PDF mevcut olmayabilir, çünkü PDF, CDF'nin bir türevi olarak tanımlanır ve MGF, bir olarak tanımlanır ve bu İntegral gerek yok. Ancak bu, bu kavramlardan herhangi birinin daha az temel olduğu anlamına gelmez. Temel, matematiksel tanımı olmayan hoş bir sıfattır. Önemli bir eş anlamlı. R exp(tx)DF(x)RdRexp(tx)dF(x)
mpiktas

6
@mpiktas: Her olasılık dağılımı (bir alt kümesi) bir CDF vardır ve benzersiz dağılımını tanımlamaktadır. Ancak, olasılık dağılımlarının hepsinde bir PDF veya MGF yoktur (ancak hepsinin karakteristik bir işlevi vardır ). Rn
Ilmari Karonen

3
@mpiktas Sen bunu yapabilir üzerinde . O zaman tanımlanmadı. Bununla birlikte, profesörün neden “daha ​​temel” ifadesini kullandığı bana açık bir şekilde açıktır. .. bazı) İngilizce de bildiğimiz o Her PDF altta yatan CDF'yi vardır Burada "altında yatan" "temel" ile güzel bir ilişkisi var tersi doğru değildir..R P ( ( - , x ] )A={R,}RP((,x])
drhab

2
@drhab, doğal olarak Radon-Nikodym türevinden bahsediyordum :) Profesörün aklından geçenleri çok iyi anlıyorum ama bence bu ifadeleri öğrencilerle kullanmak tehlikelidir çünkü o zamanlar arasındaki farkı anlamaya çalışmak yerine matematiksel kavramlar onları temeline göre sıralamaya çalışırlar, ki bu temelde yanlıştır. Pun amaçlanmıştır.
mpiktas

4
@mpiktas: elbette, “temel” in kesin bir tanımı yok. Ancak “titizlikle tanımlanmış” ve “tamamen anlamsız” arasında büyük bir orta yol var. Elbette matematiğimizin içinde her şey sonunda tamamen titiz olmalıdır, bu yüzden olmayan bir şeyi tokatlamaya çok alışıyoruz. Fakat matematik hakkında konuştuğumuzda ve düşünürken , tıpkı herkes gibi; “temel”, “genel” gibi öznel ama henüz anlamlı kavramlara sahibiz; ve bu tamam.
PLL

Yanıtlar:


69

nin bir alt kümesinde her olasılık dağılımının birikimli bir dağılım fonksiyonu vardır ve dağılımı benzersiz şekilde tanımlar. Bu nedenle, bu anlamda, CDF gerçekten dağıtımın kendisi kadar esastır.Rn

Bununla birlikte, bir olasılık yoğunluk fonksiyonu sadece (kesinlikle) sürekli olasılık dağılımları için mevcuttur . PDF içermeyen bir dağıtımın en basit örneği, yalnızca tamsayı değerleri alan rastgele bir değişkenin dağılımı gibi herhangi bir ayrık olasılık dağılımıdır .

Tabii ki, bu tür ayrık olasılık dağılımları, bunun yerine bir olasılık kütle fonksiyonu ile karakterize edilebilir , ancak sürekli ve ayrık bir dağılımın herhangi bir karışımı gibi, PDF ve bir PMF'ye sahip olmayan dağılımlar da vardır:

Sürekli, kesikli ve karışık olasılık dağılımlarının şeması
(Diyagram, Glen_b'in ilgili soruya verdiği cevabın utanmadan çalındığı diyagramdır .)

Bir PDF ve bir PMF kombinasyonu ile bile tanımlanamayan Cantor dağılımı gibi tekil olasılık dağılımları bile vardır . Bu tür dağıtımlar yine de iyi tanımlanmış bir CDF'ye sahiptir. Örneğin, burada bazen "Şeytanın merdiveni" olarak da adlandırılan, Cantor dağıtımının CDF'si:

Cantor dağıtım CDF'si
( CC-By-SA 3.0 lisansı altında kullanılan, Theon ve Amirki kullanıcıları tarafından Wikimedia Commons'dan alınan resim .)

Cantor işlevi olarak bilinen CDF süreklidir, ancak sürekli değildir. Aslında, sıfır Lebesgue ölçüsü olan Cantor kümesi dışında her yerde sabittir , ancak yine de sonsuz sayıda nokta içerir. Bu nedenle, Cantor dağılımının tüm olasılık kütlesi, gerçek sayı çizgisinin bu utanç verici küçük alt kümesine yoğunlaşmıştır, ancak kümedeki her nokta ayrı ayrı sıfır olasılığa sahiptir.


Moment üreten bir fonksiyonu olmayan olasılık dağılımları da vardır . Muhtemelen en iyi bilinen örnek Cauchy dağılımıdır , 1. veya daha yüksek derecelerde iyi tanımlanmamış anlara sahip olmayan yağ kuyruklu bir dağılımdır (bu nedenle, özellikle iyi tanımlanmış ortalama veya varyansa sahip değildir!).

Bununla birlikte, tüm olasılık dağılımları , tanımları yalnızca hayali birimle çarpma ile MGF'ninkinden farklı olan (muhtemelen karmaşık değerli) bir karakteristik fonksiyona sahiptir . Dolayısıyla, karakteristik fonksiyon, CDF kadar temel olarak kabul edilebilir.Rn


Her dağıtımın CDF'ye sahip olduğunu söylüyorsunuz, ancak hepsinde PDF yok, ancak aslında PDF'leri olan ve çok değişkenli normal gibi kapalı biçimli CDF'leri olmayan dağıtımlar var.
Tim

13
@Tim: Bu doğru, ancak yalnızca "kapalı form" niteleyicisiyle; CDF hala kapalı biçimde yazamasak bile var. Ve herhangi bir durumda, " kapalı form ifadesi " nin tanımı ünlüdür; Bazı katı tanımlara göre, tek değişkenli normal dağılım bile kapalı formlu bir CDF'ye sahip değildir, ancak hata fonksiyonunun kapalı formda olduğunu düşünüyorsanız.
Ilmari Karonen

11
@Tim Bu bir karşı örnek değil. Sizin için önemli / temel olmayı seçtiğiniz keyfi bir özellik. Benim için “var olan” mülk, “kapalı formu” ndan daha önemlidir. Dahası, “her zaman var” a karşı “bazen herhangi bir işlev gibi” kapalı bir biçime sahip olmayabilir ".
Ark-kun

3
[0,1]R

1
@ Ark-kun Ben burada şeytanların savunuculuğunu oynuyorum çünkü PDF'in CDF'den daha "doğrudan kullanılabilir" olduğu durumlar var. Bu cevabı beğendim (+1), ancak IMHO, bu da söylenebilecek bir şey.
Tim

16

Ekonometri profesörünüzün aşağıdaki satırlarda bir şeyler düşündüğünü düşünüyorum.

işlevini düşünün.F[0,1]

F(x)=12x for x<12
F(x)=12x+12 for x12

[0,1]

P({12})=12

f

f

PDF tanımı gereği, sahip olmamız gereken

0xf(t)dt=F(x)F(0)=14x

0<x<12

f(x)=14 for x<12

Aynı şekilde, ancak birinden başlayarak, sıfıra doğru ilerleyerek ve ile biten tümleştiricix>12

f(x)=14 for x>12

Bu yüzden dışında her yerde belirledik . Fakat gerçekten önemi yoktur, istenilen entegrasyon özelliğine sahip olamaz. Dan berif ( 1)ff(1)f(12)f(12)

P({12})=12

ihtiyacımız olacak

12ϵ12+ϵf(t)dt>12

içeren her aralık için . Fakat aslında herhangi bir integralin değeri, bir fonksiyonun değerini herhangi bir noktada değiştirmekten etkilenmez.12

12ϵ12+ϵf(t)dt=12ϵ12+ϵ14dt=12ϵ

Yani çıkış yok, gibi bir fonksiyon var olamaz.f

Bir PDF'nin ruhunu geri kazanabilirsiniz, ancak bir ölçü ya da dağılım olarak daha karmaşık matematiksel nesneleri kullanmanız gerekir .


3
Bu "imkansız özelliği" kolaylıkla toplamıyla elde edilmektedir bir başka oldukça geleneksel PDF içine olduğu Dirac delta , bir (sonsuz-uzun) "spike" dışında her yerde 0 değerine sahip bir genel işlevi de , özel mülkiyet o . 12δ(x12)δ(x)x=0
+δ(x)dx=1
Ben

2
@iwill PDF, tanımı gereği, bir eşdeğerlik sınıf işlevleri (içinde Lebesgue ölçüsü bakımından norm). Dirac deltası kalifiye değil - bu yüzden tam olarak "genelleştirilmiş işlev" olarak adlandırılması gerekiyor. L1
whuber

@WillnotexistIdonotexist Whuber’ün söylediği şey, son satırda gösterdiğim şeydi. "Dağıtım" kelimesini kullandım.
Matthew Drury

4
Örneğinizde yalnızca pdf yok; çünkü baskın olan ölçünün Lebesgue ölçüsü olduğunu varsayıyorsunuz. Eğer bir nokta kütlesini içeren bir hakim önlemi kullandığınızda Ama öyle de örneğin Dirac Lebesgue ölçümü ve toplamını . 1/21/2
Xi'an

4

Ilmari teorik bir bakış açısı ile iyi bir cevap verir. Bununla birlikte, bir kimse yoğunluğun (pdf) ve dağıtım fonksiyonunun (pdf) pratik hesaplamalar için hangi amaçlara hizmet ettiğini de sorabilir. Bu, hangi durumlar için birinin diğerinden daha doğrudan yararlı olduğunu netleştirebilir.

üzerindeki olasılık dağılımları için , dağıtım fonksiyonu doğrudan tüm aralıkların olasılıklarını verir olasılıklardan, sınırlı bir aralıklı birleşme olasılığı temel aritmetik ile hesaplanabilir. Bunu düşünebilirsiniz, bunları hesaplamak istediğiniz tek olasılıklar olabilir, bunları veya daha genel kümelerin olasılıklarını integral olarak ifade etmek teorik olarak uygun olabilir , ancak gerçek hesaplama için etkin bir şekilde dağıtım fonksiyonuna ihtiyacımız var. ( - , x ] - -R(,x]

Ancak yoğunluk, olasılık yoğunluk olarak tanımlandığı için istatistikler için gereklidir. Dolayısıyla, maksimum olabilirlik tahminini hesaplamak istiyorsak, doğrudan yoğunluğa ihtiyacımız var.

Ampirik ve teorik bir dağılımın karşılaştırmasına başvurursak, her ikisi de yararlı olabilir, ancak dağıtım işlevine dayanan pp ve qq çizimleri gibi yöntemler sıklıkla tercih edilir.

Rdd2

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.