Anlar tam olarak nedir? Nasıl türetilirler?


19

Tipik olarak, tüm popülasyon parametrelerini tahmin edene kadar "nüfus anlarını örnek karşılıklarına eşitleyerek" moment tahmin yöntemine giriyoruz; böylece, normal dağılım durumunda, sadece birinci ve ikinci anlara ihtiyacımız olur çünkü bu dağılımı tam olarak tanımlarlar.

E(X)=μi=1nXi/n=X¯

E(X2)=μ2+σ2i=1nXi2/n

Ve teorik olarak ilave anı şu şekilde hesaplayabiliriz :n

E(Xr)i=1nXir/n

Gerçekten ne olduğu için nasıl sezgi oluşturabilirim? Fizikte ve matematikte bir kavram olarak var olduklarını biliyorum, ama ikisini de doğrudan uygulanabilir bulmuyorum, özellikle de kitle kavramından bir veri noktasına soyutlamanın nasıl yapılacağını bilmiyorum. Terimin, diğer disiplinlerde kullanımdan farklı olan istatistiklerde belirli bir şekilde kullanıldığı görülmektedir.

Verilerimin hangi özelliği , toplamda kaç ( ) moment olduğunu belirler ?r


7
Terim, olasılık dağılımına uygulandığında fizikte yaptığı ile aynı anlama gelir. Buraya bakın , , " burada , yük, kütle veya dikkate alınan herhangi bir miktarın yoğunluğunun dağılımıdır ". "Dikkate alınan şey" olasılık yoğunluğu olduğunda, karşılık gelen olasılık anına sahip olursunuz. Bunlar ham anlar (köken hakkında anlar). Karşılaştırma ... ( ρμn=rnρ(r)drρ
ctd

2
Momentler gibi rasgele değişkenlerin dağılımının parametrelendirilmiş özellikleridir. Momentler doğal sayılarla parametrelendirilir ve bir dağılımı tamamen karakterize eder ( moment oluşturma fonksiyonuna bakın ). Bu, bazı dağıtımlar için momentler arasında mükemmel bir işlevsel bağımlılık olabileceği anlamına gelmez, bu nedenle dağılımı karakterize etmek için her zaman her an gerekli değildir. (1/2)
tchakravarty

Moments normal dağılım için ilk ikisine işlevsel olarak bağımlıdır, bu nedenle ilk ikisi ortalama ve varyans dahil olmak üzere dağılımı karakterize etmek için yeterlidir. (2/2)3
tchakravarty

5
(ctd) ... matematikteki anlar aynıdır ( ), 0 yerine (yani sadece fizikte genelleştirilmiş bir biçimdir - fakat sadece kökeni değiştiğinde aynı olduklarından, bir fizikçi haklı olarak "bu nasıl farklıdır?" derdi). Bunlar, bir yoğunluk olduğunda, olasılıkla aynıdır . Bana göre, üçü de “anlar” derken aynı şeyden bahsediyor, farklı şeyler değil. C fμn=-(x-c)nf(x)dxcf
Glen_b

3
Anlar ve sezgi hakkında gönderilen birçok konuda cevap bulabileceğinize eminim . İstatistikler anlar kullanır aynen onlar fizik ve matematik kullanılan aynı şekilde - bu her üç alanda aynı tanımıyla aynı kavramdır.
whuber

Yanıtlar:


17

Bir fizik dersi aldığımdan bu yana uzun zaman geçti, bu yüzden bunların herhangi birinin yanlış olup olmadığını bana bildirin.

Fiziksel analogları olan momentlerin genel tanımı

, Rastgele değişken atın . bir inci an çevresinde olup: Bu karşılık tam bir an fiziksel anlamda. , pdf tarafından verilen yoğunluk ile gerçek çizgi boyunca bir puan koleksiyonu olarak hayal edin . Bu çizginin altına de bir dayanak yerleştirin ve o dayanağa göre momentleri hesaplamaya başlayın ve hesaplamalar tam olarak istatistiksel momentlere karşılık gelecektir.n X c m n ( c ) = E [ ( X - c ) n ] X cXnXc

mn(c)=E[(X-c)n]
Xc

Çoğu zaman, bir inci an : (dayanak noktası, 0 ° C'de yerleştirilir anlar) 0 çevresinde an anlamına gelir -inci merkezi momenti ise: Bu, dayanağın kütle merkezine yerleştirildiği anlara karşılık gelir, böylece dağılım dengelidir. Aşağıda göreceğimiz gibi anların daha kolay yorumlanmasına izin verir. İlk merkezi moment daima sıfır olacaktır, çünkü dağılım dengelidir.X, m , n = E [ X- n ] n, X, m , n = m , n ( m, 1 ) = E [ ( X - m 1 ) n ]nX

mn=E[Xn]
nX
m^n=mn(m1)=E[(X-m1)n]

inci standart an ise: Yine, bu anları dağılımın yayılmasıyla ölçeklendirir ve özellikle Kurtosis'in daha kolay yorumlanmasına izin verir. İlk standartlaştırılmış an her zaman sıfır, ikincisi her zaman bir olacaktır. Bu, bir değişkenin standart skoruna (z-skoru) karşılık gelir. Bu konsept için harika bir fiziksel analogum yok.X, ~ m , n = m n,nX

m~n=m^n(m^2)n=E[(X-m1)n](E[(X-m1)2])n

Yaygın kullanılan anlar

Herhangi bir dağıtım için potansiyel olarak sonsuz sayıda an vardır. Yeterli anlar neredeyse her zaman tam olarak karakterize edilir ve dağıtılır (bunun kesin olması için gerekli koşulları elde etmek, an probleminin bir parçasıdır ). Dört an sıklıkla istatistiklerde çokça konuşulur:

  1. Ortalama - 1. an (sıfır etrafında ortalanmış). Dağılımın kütle merkezidir veya alternatif olarak, 0'da bir dayanağa göre dağılım torku momenti ile orantılıdır.
  2. Varyans - 2. merkezi an. dağılımının yayılma derecesini temsil ettiği şeklinde yorumlanır . Dayanağında dengeli bir dağılımın atalet momentine karşılık gelir.X
  3. Çarpıklık - 3. merkezi an (bazen standartlaştırılmıştır). Bir yöndeki bir dağılımın eğriliğinin ölçüsü. Normal bir dağılıma (eğriliği olmayan) göre, pozitif çarpık dağılımın aşırı yüksek sonuç olasılığı düşüktür, negatif çarpık dağılımların çok düşük sonuç olasılığı düşüktür. Fiziksel analoglar zordur, ancak gevşek bir şekilde bir dağılımın asimetrisini ölçer. Örnek olarak, aşağıdaki şekil Wikipedia'dan alınmıştır . Çarpıklık, Wikipedia'dan alınmıştır
  4. Basıklık - 4. standart an, genellikle fazla Kurtoz, 4. standart an eksi üç. Basıklık, kuyruklara göre dağılımın merkezine ne kadar daha fazla olasılık yerleştirdiğini ölçer . Yüksek Kurtoz, ortalamadan daha az sıklıkta daha büyük sapmalar ve daha küçük sapmalarda daha sık sapmalar anlamına gelir. Genellikle standart bir anı 3 olan normal dağılıma göre yorumlanır, bu nedenle aşırı bir Kurtoz 0'dır. Burada fiziksel bir analog daha da zordur, ancak aşağıdaki şekilde, Wikipedia'dan alındığında, daha yüksek zirvelere sahip dağılımlar daha büyük Kurtozis var. XKurtoz, ayrıca WIkipedia'dan

Kurtosis'in ötesindeki anlardan nadiren bahsediyoruz, çünkü tam olarak onlara çok az sezgi var. Bu, ikinci andan sonra duran fizikçilere benzer.


6

Bu eski bir iş parçacığı biraz, ama ben "anlar doğal sayılarla parametreleştirilir ve tamamen bir dağılımı karakterize" yazdı Fg Nu tarafından yorumda bir yanlışlık düzeltmek istiyorum.

Anlar bir dağılımı tamamen karakterize ETMEZ. Özellikle, sonsuz sayıda anın bilgisi, var olsalar bile, dağılımı benzersiz bir şekilde belirlemez.

En sevdiğim olasılık kitabım Feller "Olasılık Teorisine Giriş ve Uygulamaları Cilt II" (bkz . Ortak dağılımların gerçek hayat örneklerindeki cevabım ), bölüm VII.3 örnek s. 227-228, Lognormal belirlenmemiştir anlarına göre, yani Lognormal ile aynı sonsuz farklı anlara sahip farklı dağılımlar vardır, fakat farklı dağıtım fonksiyonları. Bilindiği gibi, Moment Üretme Fonksiyonu Lognormal için mevcut değildir ve aynı momentlere sahip olan bu diğer dağılımlar için de mevcut değildir.

S. Şekil 228'de, esasen sıfır olmayan bir rastgele değişken , hepsi mevcutsa veX

Σn=1(E[X2n])-1/(2n)

ıraksadığını. Bunun bir if olmadığını ve yalnızca if olduğunu unutmayın. Bu durum Lognormal için geçerli değildir ve gerçekten de anları tarafından belirlenmez.

Öte yandan, sonsuz sayıda anı paylaşan dağılımlar (rastgele değişkenler), momentlerinden türetilebilecek eşitsizlikler nedeniyle ancak çok fazla farklılık gösterebilir.


Bu, dağılım sınırlandığında önemli ölçüde basitleştirilir, bu durumda momentler her zaman dağılımı tamamen (benzersiz olarak) belirler.
Alex

@Alex Feller'de belirtilen sonucun hemen bir sonucu.
whuber

Lognormal için moment üreten fonksiyonun mevcut olmadığını söylemek tamamen doğru değildir. Mgf'ler ile ilgili en yararlı teoremler, sıfır içeren açık bir aralıkta var olduğunu ve katı anlamda var olmadığını varsayar. Ama sıfırdan çıkan bir ışında var! Ve bu da faydalı bilgiler veriyor.
kjetil b halvorsen

@ kjetil b halvorsen, sıfırdan yayılan bir ışın üzerinde lognormal bir MGF'nin varlığından elde edebileceğiniz yararlı bilgileri (bazılarını) açıklayabilir misiniz? Bu ne ışın olurdu?
Mark L. Stone

@Kjetil b halvorsen .. 'e soru olarak yukarıdaki yorumun çarpması
Mark L. Stone

2

Glen_b'in sözlerine bir sonuç, ilk anın, ortalamanın, fiziksel bir nesnenin ağırlık merkezine karşılık geldiği ve ortalamanın etrafındaki ikinci anın, varyansın atalet momentine karşılık geldiğidir. Ondan sonra, kendi başınasın.


3
İlk an ile ortalama arasındaki ilişkiyi seviyorum ... ama ikinci an varyans değil ... varyans ortalanmış ikinci an ... . v a r [ x ] = E [ ( x - E [ x ] ) 2 ] = ( x - E [ x ] ) 2 f ( x ) d xE[x2]=x2f(x)dx vbirr[x]=E[(x-E[x])2]=(x-E[x])2f(x)dx
Zachary Blumenfeld

0

Bir binom ağacının her biri muhtemelen 0,5 olan iki dalı vardır. Aslında, p = 0.5 ve q = 1-0.5 = 0.5. Bu, eşit olarak dağıtılmış bir olasılık kütlesi ile normal bir dağılım oluşturur.

Aslında, ağaçtaki her katmanın tamamlandığını varsaymalıyız. Verileri çöp kutularına ayırdığımızda, bölümden gerçek bir sayı alırız, ancak yuvarlanırız. Bu tamamlanmamış bir katman, bu yüzden normaline yaklaşan bir histogramla sonuçlanmıyoruz.

Dallanma olasılıklarını p = 0.9999 ve q = 0.0001 olarak değiştirin ve bu bize normal bir çarpıklık kazandırır. Olasılık kütlesi değişti. Bu çarpıklığı açıklar.

2 ^ n'nin altında eksik katmanlara veya ambarlara sahip olmak, olasılık kütlesi olmayan alanlara sahip binom ağaçları oluşturur. Bu bize basıklık verir.


Yoruma verilen yanıt:

Kutu sayısını belirleme hakkında konuşurken, bir sonraki tam sayıya yuvarlayın.

Quincunx makineleri, sonunda binom yoluyla normal dağılıma yaklaşan toplar bırakır. Böyle bir makine tarafından çeşitli varsayımlar yapılır: 1) kutuların sayısı sonludur, 2) alttaki ağaç ikilidir ve 3) olasılıklar sabittir. New York'taki Matematik Müzesi'ndeki Quincunx makinesi, kullanıcının olasılıkları dinamik olarak değiştirmesini sağlar. Olasılıklar, mevcut katman bitmeden önce herhangi bir zamanda değişebilir. Bu nedenle, çöp kutularının doldurulmaması hakkındaki bu fikir.

Ağaçta bir boşluk olduğunda orijinal cevabımda söylediğimden farklı olarak, dağılım basıklık gösterir.

Buna üretici sistemler açısından bakıyorum. Karar ağaçlarını özetlemek için bir üçgen kullanıyorum. Yeni bir karar alındığında, üçgenin tabanına ve dağılım açısından kuyruklara daha fazla kutu eklenir. Ağaçtaki alt ağaçların kırpılması, dağıtımın olasılık kütlesinde boşluklar bırakacaktır.

Sadece sezgisel bir his vermek için cevap verdim. Etiketler? Excel'i kullandım ve binomdaki olasılıklarla oynadım ve beklenen eğrileri oluşturdum. Basıklık ile bunu yapmadım, hareket öneren dil kullanırken olasılık kütlesini statik olarak düşünmeye zorlanmamıza yardımcı olmuyor. Altta yatan veri veya toplar basıklığa neden olur. Daha sonra, onu çeşitli analiz eder ve merkez, omuz ve kuyruk gibi açıklayıcı terimleri şekillendiririz. Çalışmamız gereken tek şey kutulardır. Kovalar, veriler mümkün olmasa bile dinamik hayatlar yaşar.


2
Bu ilginç, ama çok kabataslak. Örneğin, binom ağacınızdaki etiketler nelerdir? Normal bir dağılım elde etmek istiyorsanız sonsuz bir ağaç daha iyi olurdu - ancak daha sonra bariz etiketler (rastgele bir yürüyüş kullanarak veya gerçek sayıların ikili gösterimlerini kullanarak) normal dağılımlara yol açmaz. Bu ayrıntılar olmadan okuyucuların hayal gücüne çok fazla şey kalır. Onları biraz açıklayabilir misiniz?
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.