Cauchy dağılımının neden bir anlamı yok?


109

Dağılım yoğunluğu işlevinden, aşağıdaki grafikte gösterildiği gibi Cauchy dağılımı için bir ortalama (= 0) tanımlayabiliriz. Ama neden Cauchy dağılımının bir anlamı olmadığını söylüyoruz?

görüntü tanımını buraya girin


2
Referans Cabeza G., UA’yi öneririm. (2013). La Media de la Distribución de Cauchy. Apoyo en Matemáticas blogunda Cauchy dağılımının ortalaması hakkında.

Yanıtlar:


99

Beklenen değerin bulunmadığını mekanik olarak kontrol edebilirsiniz, ancak bu en azından Huygens'in ilkesini ve Büyük Sayılar Yasasını kabul ediyorsanız fiziksel olarak sezgisel olmalıdır . Büyük Sayılar Yasası'nın sonucu Cauchy dağılımı için başarısız olduğu için bir anlamı olamaz. bağımsız Cauchy rasgele değişkenlerini ortalama olarak alırsanız , sonuç olasılık ile olarak yakınlaşmaz . Aynı büyüklükte bir Cauchy dağılımı kalır. Bu optikte önemlidir.0 n 1n0n1

Cauchy dağılımı, bir noktadan gelen bir çizgideki ışığın normalleştirilmiş yoğunluğudur. Huygens'in ilkesi, ışığın kaynak ve hedef arasındaki herhangi bir çizgiden yayıldığını varsayarak yoğunluğu belirleyebileceğinizi söylüyor. Bu nedenle, metre uzaklıktaki bir hattaki ışığın yoğunluğu , ışığın ilk önce metre uzaklıktaki bir hatta çarptığını ve herhangi bir ileri açıda tekrar yayıldığı varsayılarak belirlenebilir . metre uzaklıktaki bir hat üzerindeki ışığın yoğunluğu, metre uzaklıktaki bir hat üzerindeki ışığın dağılımının katlamalı dönüşümü olarak ifade edilebilir . Yani, toplamı bağımsız Cauchy dağılımları bir faktörle ölçekli Cauchy dağılımı .1 n n 1 n n21nn1nn

Cauchy dağılımı ortalama olsaydı, o zaman inci persentil bölünmesiyle kat konvolüsyon yakınsama olurdu Büyük Sayılar Kanunu ile. Bunun yerine sabit kalır. yüzdelik değeri metre uzakta, metre uzakta vb. (Saydam) bir çizgide işaretlerseniz, bu noktalar derecelik düz bir çizgi oluşturur . doğru bükülmezler .n n 0 25 1 2 45 025nn02512450

Bu size özellikle Cauchy dağılımından bahseder, ancak integral testini bilmelisiniz, çünkü net bir fiziksel yorumu olmayan hiçbir anlamı olmayan başka dağılımlar vardır.


39
+1, Şimdi orada bir aydınlatıcı bir cevap :-) (üzgün) 'dir. Bu arada, ilke Huygen değil, Christiaan Huygens için seçildi. Huygens, Pascal tarafından 1650'lerde yayınlanan (Fermat ile yazdığı mektuplara dayanarak) olasılıktaki yeni gelişmeleri ilk kez değerlendiren kişi oldu: Huygens'in, matematiksel bir olasılık üzerine olasılık teorisi olan beklenti de dahil olmak üzere, bu fikirleri (1657) açıklamasıydı. Jakob Bernoulli'nin ( Ars Conjectandi , 1713) seminal (ölüm sonrası) incelemesinin temelini oluşturdu ve temelini attı .
whuber

4
Genlikler yoğunluğu değil, yayılır.
Doru Constantin,

2
Bu harika bir cevap, ama kafamın karıştığını buluyorum: "... 25. yüzde yüzdeyi ... düz bir çizgide, 45 derecede işaretleyin. 0'a doğru bükülmezler." İfadenin kendisi doğrudur (Huygens-Fresnel ilkesinin bir sonucu olarak), fakat bu " bölü" den öncedir . 2 metrede 2'ye bölündüğünde, 3 metrede 3'e bölündüğünde, ..., sonra saydam çizgi dikeydir (ışığı tutan ekrana dik). 45 derecelik kuantil çizgisi Cauchy'nin toplamına aittir ve argümana yardımcı olmaz (henüz). n
Lee David Chung Lin

40

@ Whuber'un Michael Chernicks'ın cevabı hakkındaki yorumuna yanıt olarak yanıt eklendi (ve whuber tarafından belirtilen hatayı tamamen kaldırmak için tamamen yeniden yazıldı.)

Bir Cauchy rasgele değişkenin beklenen değeri için integralin değerinin tanımsız olduğu söylenir, çünkü değer, kişinin beğeneceği bir şey olarak "yapılabilir" olabilir. İntegral (Riemann integrali anlamında yorumlanır) uygunsuz bir integral ve değeri sınırlayıcı bir değer olarak hesaplanmalıdır: veya

xπ(1+x2)dx
xπ(1+x2)dx=limT1limT2+T1T2xπ(1+x2)dx
xπ(1+x2)dx=limT2+limT1T1T2xπ(1+x2)dx
ve ya da elbette, her iki değerlendirme de aynı sonlu değeri vermelidir. Değilse, integralin tanımsız olduğu söylenir. Bu hemen Cauchy rasgele değişkeninin ortalamasının neden tanımsız olduğu söylendiğini gösterir: iç sınırdaki sınır değer değişir.

Cauchy ana değeri, tek bir sınır olarak elde edilir: Yukarıdaki çift limit yerine . Beklenti integral temel değer kolayca görülür limitand değerine sahiptir tüm . Ancak bu, bir Cauchy rastgele değişkeninin ortalamasının olduğunu söylemek için kullanılamaz . Yani, ortalama, integralin değeri her zamanki anlamda değil, temel değer anlamında tanımlanır.

limTTTxπ(1+x2)dx
00T0

İçin , yerine entegre dikkate bir sınır değeri yaklaşımları olarak . Tüm , Başlıcalarını değeri elde yukarıda anlatıldığı gibidir. Böylece, ifadeye açık bir anlam atayamıyoruzα>0

TαTxπ(1+x2)dx=TTxπ(1+x2)dx+TαTxπ(1+x2)dx=0+ln(1+x2)2π|TαT=12πln(1+α2T21+T2)=12πln(α2+T21+T2)
ln(α)πTα=10
xπ(1+x2)dx
, iki sonsuzluğa nasıl yaklaşıldığını belirtmeden ve bu noktaya aldırış etmemek, hepsine neden olur tür komplikasyonlar ve yanlış sonuçlar, çünkü her zaman göründüğü gibi değildir, çünkü temel değer sütü değerin kreması olarak işlenir. Bu nedenle Cauchy rasgele değişkeni ortalamasının integralin temel değeri olan değeri yerine tanımsız olduğu söylenir .0

Biri olasılık için ölçü-teorik yaklaşım kullanıyorsa ve beklenen değer integrali bir Lebesgue integrali anlamında tanımlanmışsa, sorun daha basittir. yalnızca sınırlıdır ve bu nedenle Cauchy rastgele değişken için tanımlanmamış itibaren sonlu değildir.g|g|E[X]XE[|X|]


9
Orta integralin değerlendirilmesi yanlış: bu bir logaritma değil sıfır. Asıl sorun, sonsuz integrallerde örtülü olan iki sınırın değerlendirilmesi ile ilgilidir.
whuber

@whuber Hatayı gösterdiğiniz için teşekkür ederiz. Cevabımı tamamen yeniden yazdım ve yorumunuz artık geçerli değil.
Dilip Sarwate 10:12

Oranın beklentisinin neden mevcut olmadığını anlamıyorum. Eğer ve normalde normalden sıfırdan farklı ortalama ile dağıtılırsa, ortalaması , neyi özlüyorum? XYZ=XYxyp(x,y)dxdy
Royi

@Drazick Cevabımın hiçbir yerinde iki normal rastgele değişkenin oranından bahsetmedim. Lütfen Cauchy rasgele değişkenleri ile ilgili olarak bu sorunu dile getiren birisine sorun.
Dilip Sarwate

2
@Drazick İntegralinizin var olup olmadığını kontrol edin . Genel olarak, eğer yoğunluğu mahallesinde sürekli ise E [X ^ {- 1}] $ mevcut değildir. X0
Dilip Sarwate

33

Yukarıdaki cevaplar, Cauchy dağılımının neden bir beklentisinin olmadığı ile ilgili geçerli açıklamalar olsa da , iki bağımsız normal değişkenin oranının aydınlatıcı olarak Cauchy olduğu gerçeğini buldum : gerçekten, biz gelmiş ve ikinci beklenti .X1/X2N(0,1)

E[|X1||X2|]=E[|X1|]×E[1|X2|]
+

1
Is nin standart Cauchy olduğunu bildiğimde' katlanmış 'Cauchy rastgele değişkeni ? Bir kişi dağılımını nasıl bulabilir? ? |X1X2|X1X2|X1X2|
StubbornAtom

1
Evet, bu, Cauchy değişkeninin mutlak değeridir; bu , pozitif gerçek sayılar üzerinde yoğunluğuna sahiptir . f(x)+f(x)
Xi'an

Normal dağılımı ,sonsuz değil mi? E1/|X2|
Albert Chen,

Bu sonsuzdur.
Xi'an,

22

Cauchy'nin bir anlamı yoktur, çünkü seçtiğiniz nokta (0) bir ortalama değildir. Bu bir medyan ve bir moddur . Mutlak bir sürekli dağılımın ortalaması, olarak tanımlanır, burada , yoğunluk işlevidir ve integral, (( Cauchy durumunda ila ) alanı üzerinden alınır . Cauchy yoğunluk için, integral sadece sınırlı değildir (yarım için olduğu ve yarım için olup ).xf(x)dxff00


9
Seni eleştirmiyorum, @Dilip: Gözlemini artırıyorum. Çok ilginç olan, sıfır temel değerin varlığının bizi Cauchy dağılımının ortalamasını (veya herhangi bir RV'nin ortalamasını) integralin temel değeri olarak tanımlamaya teşvik edebileceğidir. Bu, integralin sonsuz ya da tanımsız olduğunu ilan ederek ortaya çıkan bu sorunun mahiyetinde çok daha derinlemesine sondalar: yani, asıl değer neden işe yaramıyor ? Bunu bir araç olarak kullanmak neden meşru olmaz?
whuber

5
@whuber Aynı zamanda, -a ve + a'daki integralleri herhangi bir> 0 için keserseniz, 0 elde edersiniz. Bu nedenle, sınırı, simetrik integralin ∞ yaklaşımı olarak kabul etmek, 0 verir. 0 ortalama.
Michael Chernick

10
@whuber: Son sorunuzu retorik olmak için son sözlerinizde alıyorum; Her halükarda mutlak yakınsama istiyoruz ve aklımdaki "" "nedeni, şeylerin alanlar gibi davranmasını istiyoruz. Özellikle, elde ettiğimiz cevabı bozmadan işleri (fonksiyonları) parçalara ayırabilmeli ve istediklerinde yeniden düzenleyebilmeliyiz. Cauchy dağılımlı doğrusal bir işlev için bu doğrama ve yeniden düzenlemeyi yapamayız, bu nedenle ortalamanın var olmadığını ısrar etmeliyiz.
kardinal

9
Bu, @ cardinal, iyi bir cevap! Ben sadece retorik olmadım, çünkü sorunun kendisi "neden Cauchy dağılımının bir anlamı olmadığını söylüyoruz?" Beklentinin tanımsız olduğunu iddia etmek, tereddütlüyü tatmin edebilir, ancak entegral için makul bir alternatif tanımlamanın mevcut olabileceği ihtimalini - ve sezgisel olarak doğru bir cevap verir! - insanları rahatsız etmek gerekir! Cevabınız benim aklımda olanlara yakın, ama yine de eksik. Tatmin edici bir cevabın koşullu yakınsak integrallerle çalışırken başarısız olan istatistiksel teorinin önemli teoremlerini belirleyeceğini düşünüyorum.
whuber

7
@Dilip Ben de öyle düşündüm, ama yansıma üzerine bunu düşündüğünüzden biraz daha zor buluyorum. Örneğin, Merkezi Limit Teoreminde bir sorun yok: bir varyansa ihtiyaç duyulması otomatik olarak bir beklentiyi garanti ediyor elbette. Ve Chebyshev'in Eşitsizliği kullanılarak birçok teorem kanıtlandı; bir kez daha bir anlam garanti ediyoruz. Bu yüzden gerçekten merak ediyorum: İstatistiksel uygulamada kullanılan ve teorik olarak yakınsak, ancak yakınsak beklentilerle ilgili problemleri anlamamız gereken büyük teoremler nelerdir?
whuber

16

Cauchy dağılımı en iyi bir birim çember üzerindeki düzgün dağılım olarak düşünülür, bu nedenle ortalamaların anlamlı olması şaşırtıcı olacaktır. bir tür "ortalama işlevi" olduğunu varsayalım . Yani, birim çemberin her sonlu alt kümesinin için birim çemberin bir noktası olduğunu varsayalım . Açıkçası, "doğal" olmalı. Daha doğrusu , rotasyonlar açısından eşdeğer olamaz. Cauchy dağılımını her zamanki fakat daha az açığa çıkaracak şekilde elde etmek için, birim çemberini (0,1) 'den x eksenine yansıtın ve bu çıkıntıyı daire üzerindeki tekdüze dağılımı x eksenine aktarmak için kullanın.fXf(X)ff

Ortalamanın neden olmadığını anlamak için, x'i birim çemberindeki bir işlev olarak düşünün. Birim dairesinde sonsuz sayıda ayrık yay bulmak oldukça kolaydır, öyle ki, yaylardan birinin uzunluğu d ise, bu yay üzerinde x> 1 / 4d olur. Böylece bu ayrık yayların her biri ortalamanın 1 / 4'ünden daha fazla katkıda bulunur ve bu yayların toplam katkısı sonsuzdur. Aynı şeyi tekrar yapabiliriz, ancak x <-1 / 4d ile toplam katkısı sonsuz olsun. Bu aralıklar bir diyagramla görüntülenebilir, ancak bir tanesi Çapraz Doğrulanmış için diyagramlar yapabilir mi?


1
Siteye Hoşgeldiniz @DavidEpstein. Görüntüleri, tercih ettiğiniz yazılımla yapabilir ve cevap alanının üstündeki küçük resim simgesini (sihirbazı başlatmak için) tıklayarak yanıtınıza yükleyebilirsiniz. Ne yazık ki ancak,>> 10 tekrar yapmanız gerekir. Yakında buna sahip olacağınıza eminim; Arada, resmi İnternet'te başka bir yerde yayınlayabilir ve cevabınıza bir link gönderebilirseniz, daha yüksek bir temsilci kullanıcı tarafından getirilebilir ve sizin için gönderebilir.
gung

3
Cauchy'nin bir çember üzerinde tek tip olarak yorumlandığını bilmiyordum ama bu kesinlikle mantıklı geliyor. Topolojik bir argüman bir ortalama fonksiyonunun özelliklerine sahip bir dairede sürekli bir fonksiyon olamayacağını gösterir.
johnny

@DavidEpstein Diğer yazıda cevabınızı da okudum . Stereografik projeksiyon gerçekten çok hoş. Buna karşılık, bir yarım dairenin eşit derecede geçerli radyal projeksiyonunun neden iyi tanımlanmış bir anlamı ifade etmediğini açıklayabilir misiniz? Yani, , sonra standart . Geometrik olarak bu, yazılı bir açının her zaman karşılık gelen merkezi açının yarısı olduğu temel gerçektir. UUnif[0,1]Xtan(π(U12))
Lee David Chung Lin

Aslında bir ışık kaynağının fiziksel modeli açısından, yarım daire resmi daha uygundur, çünkü Huygens'in ilkesinin size neden stereografik bir izdüşüm vereceği tam olarak belli değil.
Lee David Chung Lin

10

Bazı rastgele değişkenlerin ortalama veya beklenen değeri, bazı olasılık ölçütleri : üzerinde tanımlanan bir Lebesgue integralidir.XP

EX=XdP

Cauchy rasgele değişkeninin ortalamasının olmayışı, sadece Cauchy rv integralinin olmadığı anlamına gelir. Bunun nedeni Cauchy dağılımının kuyruklarının ağır kuyruklardır (normal dağılımın kuyruklarına kıyasla). Bununla birlikte, beklenen değerin olmaması, bir Cauchy rastgele değişkeninin diğer fonksiyonlarının varlığını yasaklamaz.


5
Kuyruklar, integralin birleşmesine neden olacak şekilde her iki yönde de yeterince hızlı çürümemeleri anlamında "ağır" dır. Bu konseptin normal dağılımlarla (veya herhangi bir referans dağılımıyla) ilgisi yoktur.
whuber

4
Evet, bu düzeltme için teşekkürler. Ağır kuyruklar ve normal dağılım arasında herhangi bir kesin bağlantı ima etmedim. Ancak, normal dağılımın (hafif kuyruklu) ve ağır kuyruklu dağılımın görsel olarak görselleştirilmesinin (her zaman değil) "ağır" kuyruk kavramını kavramasını biraz kolaylaştırdığını düşünüyorum.
Tomas


4

Mükemmel cevapları eklemek için, integralin uyumsuzluğunun neden istatistiksel uygulama ile ilgili olduğu konusunda bazı yorumlar yapacağım. Diğerlerinin de belirttiği gibi, asıl değerin "ortalama" olmasına izin verirsek, slln artık geçerli olmaz! Bunun dışında, pratikte tüm modellerin yaklaşık olduğu gerçeğinin sonuçlarını düşünün. Spesifik olarak, Cauchy dağılımı sınırsız bir rasgele değişken için bir modeldir. Uygulamada, rastgele değişkenler sınırlıdır, ancak sınırlar genellikle belirsiz ve belirsizdir. Sınırlandırılmamış modellerin kullanılması, bu durumun hafifletilmesinin bir yoludur; bu, modellere emin olmayan (ve genellikle doğal olmayan) sınırların getirilmesini gereksiz kılar. Ancak bunun anlaşılması için, sorunun önemli yönleri etkilenmemelidir. Bu, sınırlar koyarsak, Bu, modeli önemli şekillerde değiştirmemelidir. Ancak integral yakınsak olmadığında bu olmaz! Model, RV'nin beklentisinin büyük ölçüde keyfi sınırlara bağlı olacağı anlamında kararsız. (Uygulamalarda sınırları simetrik hale getirmek için herhangi bir sebep olması gerekmez!)

Bu nedenle, integralin "sonsuz" olduğunu söylemekten farklı olduğunu söylemek en iyisidir. Daha ayrıntılı bir tartışma burada .


-4

Bir saniye için biraz seçici olmak istedim. Üstteki grafik yanlıştır. X ekseni standart sapmalarda, Cauchy dağılımı için mevcut olmayan bir şey. Seçiciyim çünkü hayatımın her günü Cauchy dağılımını işimde kullanıyorum. Karışıklığın deneysel bir hataya neden olabileceği pratik bir durum var. Öğrencinin 1 serbestlik derecesine sahip t-dağılımı standart Cauchy'dir. Genellikle önem için gereken çeşitli sigmaları listeler. Bu sigmalar standart sapmalar DEĞİLDİR, olası hatalardır ve mu moddur.

Yukarıdaki grafiği doğru yapmak istiyorsanız, x ekseni ham veridir veya eşdeğer boyutta hataları olmasını istiyorsanız, onlara eşit olası hatalar verirdiniz. Muhtemel hatalardan biri, normal dağılımdaki büyüklüğü 0,67 standart sapmadır. Her iki durumda da yarı çeyrekler arası aralıktır.

Şimdi sorunuza bir cevap olarak, herkesin yukarıda yazdığı her şey doğrudur ve bunun matematiksel nedeni budur. Ancak, konuyla ilgili öğrenci ve yeni olduğunuzdan şüpheleniyorum ve görsel olarak belirgin olan karşı sezgisel matematiksel çözümler doğru olmayabilir.

Bir Cauchy dağılımından çizilen neredeyse aynı iki gerçek dünya örneğim var, her ikisi de aynı mod ve aynı olası hataya sahip. Birinin ortalaması 1,27, biri ortalaması 1,33'tür. Ortalama 1.27 olan bir standart 400 sapma, 1.33 olan bir standart sapma 5.15 standart sapma. Her ikisi için de muhtemel hata .32 ve mod 1'dir. Bu, simetrik veriler için ortalamanın% 50 merkezinde olmadığı anlamına gelir. Herhangi bir test için ortalamanın ve / veya varyansın öneminin dışına itilmesi yalnızca BİR ek gözlem alır. Bunun nedeni, ortalama ve varyansın parametre olmaması ve örnek ortalama ile örnek varyansın kendilerinin rastgele sayılar olmasıdır.

En basit cevabı, Cauchy dağılımının parametrelerinin bir ortalama içermemesi ve bu nedenle bir ortalama hakkında bir değişiklik olmamasıdır.

Geçmiş pedagojinizde, ortalamanın öneminin, genellikle yeterli bir istatistik olması muhtemeldir. Uzun dönem frekans temelli istatistiklerde Cauchy dağılımının yeterli bir istatistiği yoktur. Tüm medyanın, tüm gerçekleri destekleyen bir Cauchy dağılımı için yeterli bir istatistik olduğu doğrudur, ancak bunun bir düzen istatistiğinden miras almasından kaynaklanmaktadır. Bu tesadüfen yeterli, düşünmenin kolay bir yolundan yoksun. Şimdi, Bayesian istatistiklerinde, Cauchy dağılımının parametreleri için yeterli bir istatistik var ve daha önce bir üniforma kullanıyorsanız, o zaman da tarafsızdır. Bunu gündeme getiriyorum çünkü günlük olarak kullanmak zorundaysanız, onlarla ilgili tahminlerde bulunmanın her yolunu öğrendiniz.

Gerçek dünyada karşılaşmanızın muhtemel olduğu kesilmiş Cauchy dağılımları için tahmin ediciler olarak kullanılabilecek geçerli bir düzen istatistiği yoktur ve bu nedenle çoğu gerçek dünyadaki tüm uygulamalar için değil, frekans tabanlı yöntemlerde yeterli istatistik yoktur. .

Benim önerdiğim şey, zihinsel olarak, gerçek bir şey olarak, ortalamadan uzaklaşmak. Çekiç gibi bir alettir, geniş ölçüde faydalıdır ve genellikle kullanılabilir. Bazen bu araç işe yaramaz.

Normal ve Cauchy dağılımları üzerine matematiksel bir not. Veriler bir zaman dizisi olarak alındığında, normal dağılım yalnızca hatalar sıfıra yakınsadıkça gerçekleşir. Veriler bir zaman dizisi olarak alındığında, Cauchy dağılımı, hatalar sonsuzluğa uzaklaştığında gerçekleşir. Biri yakınsak serilerden diğeri divergent serilerden kaynaklanmaktadır. Cauchy dağılımları hiçbir zaman sınırda belirli bir noktaya ulaşmaz, sabit bir nokta boyunca ileri geri sallanırlar, böylece bir taraftaki zamanın yüzde ellisi, diğer taraftaki zamanın yüzde ellisi olur. Ortanca reversiyon yoktur.


9
Bu yanıtta bazı karışıklıklar var! Örneğin, “Şimdi Bayesian istatistiklerinde Cauchy dağılımının parametreleri için yeterli bir istatistik var ve daha önce bir üniforma kullanırsanız o zaman da tarafsız” diyor. Bunu anlamamız zor! Birincisi, Frequentist ve Bayesian yeterlilik kavramları çok yakın (ve sadece bazı tuhaf, sonsuz dim örneklem alanlarında farklılık gösterebileceğini düşünüyorum, bu yüzden gerçek çizgi aynıdır). Cauchy modeli için sabit boyutta yeterli istatistik yoktur !, basitçe (açıkça tüm veriler yeterlidir).
kjetil b halvorsen 12:12

-6

Basitçe söylemek gerekirse, eğri altındaki alan siz uzaklaştırdıkça sonsuzluğa yaklaşır. Sonlu bir bölgeyi örneklerseniz, o bölge için bir ortalama bulabilirsiniz. Ancak, sonsuzluk için bir anlamı yoktur.


8
PDF altındaki alan eşittir tanım gereği, bu nedenle kadar başka bir şey demek gerekir "eğri". Bu ne? 1
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.