Ampirik CDF ve CDF


22

Ampirik Kümülatif Dağıtım Fonksiyonunu öğreniyorum. Ama hala anlamıyorum

  1. Neden 'Ampirik' deniyor?

  2. Ampirik CDF ve CDF arasında herhangi bir fark var mı?



Bir kutu modelindeki biletler açısından basit, anlaşılır, zarif bir açıklama var : CDF, orijinal kutuda ne olduğunu açıklıyor. ECDF, örneğinizi (orijinal kutudan çizilen bir dizi bilet: "ampirik" veri) boş bir kutuya koyduğunuzda elde ettiğiniz şeydir.
whuber

Dikkat edilmesi gereken bir şey, ampirik dağılımınızın genellikle inşa edilme şekliyle sınırlı olmasıdır, ancak CDF olmayabilir. Örneğin, Poisson değişkeninin gözlemlerinden ampirik CDF oluşturursanız, elde edilen ECDF gözlemlenen en yüksek frekansla sınırlandırılırken, gerçek CDF sınırsız olacaktır.
Aksakal

Yanıtlar:


28

Let X rasgele değişken.

  • Kümülatif dağılım fonksiyonu F(x) , değeriniP(Xx) verir .
  • Ampirik kümülatif dağılım fonksiyonu G(x) , numunenizdeki gözlemlere dayanarak P(Xx) verir .

Ayrım, hangi olasılık ölçüsünün kullanıldığıdır. Ampirik CDF için, ampirik bir örnekteki frekans sayımları tarafından tanımlanan olasılık ölçüsünü kullanırsınız.

Basit bir örnek (bozuk parayla çevirme):

X , tek bir jetonlu çevirmenin sonucunu belirten rastgele bir değişken olsun , burada X=1 kafaları ve X=0 kuyrukları gösterir.

Adil bir madeni para için CDF şu şekilde verilir:

F(x)={0for x<012for 0x<11for 1x

Eğer 2 başlıkları ve 1 kuyruk çevrilmiş ise, deneysel CDF olacaktır:

G(x)={0for x<023for 0x<11for 1x

Ampirik CDF sizin numunede, o yansıtacak 2/3 senin çevirir başları idi.

Başka bir örnek ( F , normal dağılım için CDF'dir):

Let X ortalama bir normal dağılım rastgele değişken 0 ve standart sapma 1 .

CDF aşağıdakiler tarafından verilir:

F(x)=x12πex22

x1<x2<x3

G(y)={0for y<x113for x1y<x223for x2y<x31for x3y

With enough IID draws (and certain regularity conditions are satisfied), the empirical CDF would converge on the underlying CDF of the population.


12

Is there any difference between Empirical CDF and CDF?

Yes, they're different. An empirical cdf is a proper cdf, but empirical cdfs will always be discrete even when not drawn from a discrete distribution, while the cdf of a distribution can be other things besides discrete.

If you treat a sample as if it were a population of values, each one equally probable (i.e. place probability 1/n on each observation) then the cdf of that distribution would be the ECDF of the data.

Why does it called 'Empirical'?

It's an estimate of the population cdf based on the sample; specifically if you treat the proportions of the sample at each distinct data value and treat it like it was a probability in the population, you get the ECDF.

Empirical has a meaning something like "by observation rather than theory", and that's exactly what it means in this case ... using the observations to determine the distribution function.


11

Ampirik CDF, gerçek bir veri kümesinden oluşturulur (aşağıdaki grafikte, standart normal dağılımdan 100 örnek kullandım). CDF teorik bir yapıdır - sonsuz sayıda örnek alıp alamayacağınızı görürsünüz.

Ampirik CDF, özellikle büyük numuneler için CDF'ye oldukça iyi yaklaşır (aslında, örnek boyutu arttıkça CDF'ye ne kadar çabuk dönüştüğü hakkında teoremler vardır).

Empirical CDF vs CDF


10

Ampirik verilerden ve gözlemlerden inşa ettiğiniz bir şeydir. Örneğin, bir ülkedeki insanların yüksekliğinin dağılımını bilmek istediğinizi varsayalım. İnsanları ölçerek başlarsınız ve bir dağılıma yaklaşabilecek bir histogram bulursunuz. Sonra ampirik CDF'yi hesaplarsınız.

If you are using a statistical distribution (a deterministic formula that gives the exact same output with the same parameters) you can calculate its CDF also.

You can say "The height of the people in this country is distributed similar to normal distribution with the mean 1.75 m and the standard deviation 0.1 m. Then you can use CDF of ~N(μ=1.75 m,σ=0.1 m) instead of the constructed CDF of the empirical distribution.


Is there a confidence measurement employed that expresses the likelihood that CDF and Emperical CDF describe the same population in the limit of all the experimental sampling in the world? This would seem to have application to Electoral polling, for instance. (though maybe not, since the output is not strictly describable as a function...)
BenPen

3

According to Dictionary.com, the definitions of "empirical" include:

derived from or guided by experience or experiment.

Hence, the Empirical CDF is the CDF you obtain from your data. This contrasts with the theoretical CDF (often just called "CDF"), which is obtained from a statistical or probabilistic model such as the Normal distribution.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.