Cauchy dağılımı bir şekilde “öngörülemez” bir dağılım mı?


14

Cauchy dağılımı bir şekilde "öngörülemez" bir dağılım mı?

Yapmayı denedim

cs <- function(n) {
  return(rcauchy(n,0,1))
}

R'de çok sayıda n değer için ve zaman zaman oldukça öngörülemeyen değerler ürettiklerini fark ettim.

Bunu, örn.

as <- function(n) {
  return(rnorm(n,0,1))
}

her zaman "kompakt" bir nokta bulutu veriyor gibi görünüyor.

Bu resim ile normal dağılım gibi görünmeli mi? Yine de bu sadece bir değer alt kümesi için olabilir. Ya da belki de hile, Cauchy standart sapmalarının (aşağıdaki resimde) çok daha yavaş bir şekilde (sola ve sağa) birleşmesi ve bu nedenle düşük olasılıklara rağmen daha ciddi aykırı değerlere izin vermesidir?

https://i.stack.imgur.com/zGTLU.png

İşte normal rvs ve cs Cauchy rvs.

resim açıklamasını buraya girin

Ama aykırı değerlerin uç noktalarında, Cauchy pdf kuyruklarının asla yakınsaması mümkün mü?


9
1. Sorunuz belirsiz / belirsiz, bu yüzden cevaplamak zor; örneğin, "öngörülemeyen" sorunuzda ne anlama geliyor? "Cauchy standart sapmaları" ve sona yakın yakınsama ile ne demek istiyorsun? Hiçbir yerde standart sapmaları hesaplamıyorsunuz. neyin standart sapmaları, tam olarak? 2. Sitedeki birçok yayın, sorunuzu odaklamanıza yardımcı olabilecek Cauchy'nin özelliklerini tartışıyor. Wikipedia'yı kontrol etmeye de değer olabilir. 3. "Çan biçimli" teriminden kaçınmayı öneririm; her iki yoğunluk kabaca bir çan gibi görünür; sadece isimleri ile çağır.
Glen_b-Monica

4
Şüphesiz cauchy çok ağır kuyruklu.
Glen_b-Monica

1
Birkaç bilgi yayınladım; umarım bunlar sorunuzu hassaslaştırmak için ne hakkında bilmek istediğinizi anlamanıza yardımcı olur.
Glen_b

1
Düzenlemenize baktığımda, "Cauchy pdf'nin kuyruklarının asla birleşmemesi mümkün" derken ne demek istediğinizden emin değilim. Şüphesiz yoğunluk olarak 0'a, hayatta kalma fonksiyonu da olarak 0'a gider . Ne demek istediğini açıklığa kavuşturabilir misin? x |x|x
Glen_b

2
Normalde büyük aykırılıklar mümkündür, ancak inanılmaz derecede nadirdirler . Yoğunluk (ve üst kuyrukta, özellikle en azından belirli bir büyüklükteki aykırı değerlerle ilgili olma, hayatta kalma fonksiyonu), normal kafaların Cauchy'den çok daha hızlı bir şekilde 0'a doğru - ancak yine de her iki yoğunluk (ve her iki hayatta kalma fonksiyonu) 0 yaklaşır ve hiçbiri ona ulaşmaz.
Glen_b

Yanıtlar:


40

Sitedeki bir dizi mesaj Cauchy'nin çeşitli özelliklerine hitap ederken, onları gerçekten birlikte ortaya koyan birini bulmayı başaramadım. Umarım burası toplamak için iyi bir yer olabilir. Bunu genişletebilirim.

Ağır kuyruklar

Cauchy simetrik ve kabaca çan şeklinde olsa da, normal dağılıma benziyor olsa da, çok daha ağır kuyruklara (ve "omuz" daha az) sahiptir. Örneğin, Cauchy rasgele değişkeninin medyandan 1000'den fazla çeyrek aralıklı aralık bırakması için küçük ama belirgin bir olasılık vardır - kabaca normal rasgele değişken ile medyanından en az 2.67 çeyrekler arası aralık olmak üzere aynı düzen.

Varyans

Cauchy'nin varyansı sonsuzdur.

Düzenleme: JG yorumlarda tanımsız olduğunu söylüyor. Varyansı, değer çiftleri arasındaki kare mesafesinin yarısı olarak alırsak - her ikisi de var olduğunda varyansla aynıdır, o zaman sonsuz olur. Bununla birlikte, genel tanım gereği JG doğrudur. [Bununla birlikte, n büyüdükçe hiçbir şeye gerçekten yaklaşmayan numune araçlarının aksine, numune boyutu arttıkça numune varyanslarının dağılımı büyümeye devam eder; ölçek n ile orantılı olarak artar veya eşdeğer olarak log varyansın dağılımı örneklem büyüklüğü ile doğrusal olarak büyür. Sonsuzluk veren varyans versiyonunun bize bir şey söylediğini düşünmek verimli görünüyor.]

Örnek standart sapmalar elbette vardır, ancak örnek ne kadar büyük olursa olma eğilimi o kadar büyük olur (örneğin n = 10'daki ortalama örnek standart sapması, ölçek parametresinin (IQR'nin yarısı) 3,67 katı civarındadır, ancak n = 100 yaklaşık 11.9).

Anlamına gelmek

Cauchy dağılımının sınırlı bir anlamı bile yoktur; ortalama için integral yakınsamaz. Sonuç olarak, büyük sayıların yasaları bile geçerli değildir - n büyüdükçe, örnek araçlar sabit bir miktara yaklaşmaz (aslında onların birleşecekleri hiçbir şey yoktur).

Aslında, örnek ortalamanın Cauchy dağılımından dağılımı, tek bir gözlemin dağılımı (!) İle aynıdır. Kuyruk o kadar ağır ki, toplama daha fazla değer eklemek, ortalamayı alırken sadece daha büyük bir payda ile bölünmeyi telafi edecek kadar aşırı bir değer yaratıyor.

öngörülebilirlik

Cauchy dağılımından gözlemler için kesinlikle mükemmel tahmin aralıklarını üretebilirsiniz; konumu ve ölçeği tahmin etmek için iyi performans gösteren basit, oldukça verimli tahminciler vardır ve yaklaşık tahmin aralıkları oluşturulabilir - bu bakımdan en azından Cauchy değişkenleri 'öngörülebilir' dir. Bununla birlikte, kuyruk çok uzar, böylece yüksek bir olasılık aralığı istiyorsanız, oldukça geniş olabilir.

Dağılımın merkezini tahmin etmeye çalışıyorsanız (örneğin, bir regresyon tipi modelde), bu bir şekilde tahmin edilmesi nispeten kolay olabilir; Cauchy oldukça zirve yapar (tipik bir ölçek ölçüsü için merkeze "yakın" bir çok dağıtım vardır), bu nedenle uygun bir tahminciniz varsa merkez nispeten iyi tahmin edilebilir.

İşte bir örnek:

Standart Cauchy hatalarıyla (100 gözlem, kesişim = 3, eğim = 1.5) doğrusal bir ilişkiden ve y-aykırı değerlere oldukça dayanıklı üç yöntemle tahmini regresyon çizgilerinden veri ürettim: Tukey 3 grup çizgisi (kırmızı), Theil regresyonu (koyu yeşil) ve L1-regresyonu (mavi). Hiçbiri Cauchy'de özellikle verimli değildir - hepsi daha verimli bir yaklaşım için mükemmel başlangıç ​​noktaları yapacaktır.

Bununla birlikte, üçü, verilerin gürültüsüne kıyasla neredeyse tesadüftir ve verilerin çalıştığı merkeze çok yakındır; bu anlamda Cauchy açıkça "öngörülebilir" dir.

Mutlak artıkların medyanı herhangi bir çizgi için 1'den biraz daha büyüktür (verilerin çoğu tahmini çizgiye oldukça yakındır); bu anlamda Cauchy “öngörülebilir” dir.

Cauchy hataları ve üç uygun regresyon çizgisi ile doğrusal ilişki

Soldaki arsa için büyük bir aykırı değer var. Verileri daha iyi görebilmek için sağdaki y eksenindeki ölçeği daralttım.


1
Ağır kuyruklar ve sonsuzluk sapması ilişkilidir, değil mi?
mavavilj

Kesinlikle. Tanımlanmamış ortalama, ağır kuyruklarla da ilişkilidir.
Glen_b-Monica

“Konum ve ölçeği tahmin etmek için iyi performans gösteren basit, oldukça verimli tahminciler vardır ve yaklaşık tahmin aralıkları oluşturulabilir” - referanslar verebilir misiniz?
Carlos Cinelli

Yorumlar uzun tartışmalar için değildir; bu görüşme sohbete taşındı .
gung - Monica'yı eski

@Carlos Orada iki farklı sorun vardır - (i) Cauchy'de konum (uygun şekilde kesilmiş bir ortalama gibi) ve ölçek için basit, oldukça verimli tahmin ediciler ve (ii) Cauchy için işe yarayacak bir tahmin aralığı oluşturmak için yöntemler. Bence ilki zaten sitede ele alındı ​​ve ikincisi kendi başına bir soruyu hak ediyor.
Glen_b

1

Hayır, Cauchy dağılımı, frakillerin iyi tanımlanmış olması anlamında çok öngörülebilir bir dağılımdır. ve biliyorsanız , arasındaki örneklemden iki nokta arasında bir gözlemin görünme olasılığı , iyi tanımlanmıştır. Ancak, verilerin% 50'si , verilerin% merkezi .μσnμ±σμ±636.62σ

Ayrıca, standart bir sapma değildir; bir ölçek parametresidir. Tanımlanmış bir ortalama yoktur, bu nedenle daha yüksek momentler de yoktur. Ortalama ve varyansın sonsuz olduğu ve neredeyse doğru olan integralin bir tanımı altında olduğu söylenir, ancak integralin başka bir anlayışında, sadece yoktur. Bir varyansı veya ortalamayı, bazı dağıtımların sahip olduğu bir özellik olarak düşünmek isteyebilirsiniz, ancak diğerlerini değil. Burunların omurgalıların bir özelliği olması gibi, burnu olan bir ağaç görürseniz, o zaman bir ağaç değildir. Varyanslı bir dağılım görürseniz, Cauchy dağılımı değildir.σ

Cauchy dağılımı, doğada, özellikle de bir çeşit büyümenin olduğu yerlerde, oldukça az görünüyor. Ayrıca tepelerden aşağı inen kayalar gibi şeylerin döndüğü yerlerde de ortaya çıkar. Bunu, açık artırmalarda satılan antika gibi şeylerin getirisinde olmasa da, borsa getirilerindeki çirkin bir dağıtım karışımının çekirdek dağılımı olarak göreceksiniz. Antikalardaki getiriler ayrıca ortalama veya varyanssız bir dağılıma aittir, ancak Cauchy dağılımına ait değildir. Farklılıklar, açık artırma kurallarındaki farklılıklar tarafından yaratılır. NYSE kurallarını değiştirirseniz, Cauchy dağılımı kaybolur ve farklı bir tane görünür.

Neden genellikle bulunduğunu anlamak için, çok büyük teklif sahiplerinde ve potansiyel teklif sahiplerinde teklif verdiğinizi düşünün. Hisse senetleri çift ihale ile satıldığı için kazananın laneti geçerli değildir. Dengede, rasyonel davranış, beklenen değerinizi teklif etmektir. Beklenti, ortalamanın bir şeklidir. Ortalama tahminlerin dağılımı, örneklem büyüklüğü sonsuzluğa ulaştıkça normalliğe yakınlaşacaktır.

Dolayısıyla, firma iflas etmeyecek veya bir birleşmede satın alınmayacaksa, likidite maliyeti yoksa normalde dağıtılacaktır. Hisse miktarı değişmezse, t zamanında yatırım getirisi . Bu onu iki normal dağılım oranı yapar. Entegrasyon (0,0) yerine denge fiyatları etrafında gerçekleşirse, kesilmiş bir Cauchy dağılımı elde edersiniz. Geri dönüşleri 20. yüzyılda bireysel işlemlere ayırmazsanız, birleşme, likidite maliyetleri ve iflasları kaldırdığınızda, kesilmiş bir Cauchy'nin gerçekte gözlenen getirilerle yakından eşleştiğini göreceksiniz.

rt=pt+1pt

Eğer borsa normal veya log-normal dağılıma sahip olduğunu düşünüyorsa, ancak ağır kuyruklar bekliyorsanız beklenmedik bir şekilde volatil olmazsa, bu borsayı çok oynak hale getirir.

Cauchy dağılımı için Bayes ve Frequentist öngörücü dağılımları inşa ettim ve iyi çalıştıkları varsayımlarını verdim. Bayes tahmini, Kullback-Leibler sapmasını en aza indirir, yani belirli bir veri kümesi için bir tahminde doğaya ulaşabileceğiniz kadar yakındır. Frequentist tahmin , birçok bağımsız örnekten gelen birçok bağımsız tahmin üzerindeki ortalama Kullback-Leibler sapmasını en aza indirir . Bununla birlikte, ortalama bir kapsama alanından beklendiği gibi, herhangi bir örnek için iyi performans göstermez. Kuyruklar birbirine yaklaşıyor, ama yavaşça birleşiyorlar.

Çok değişkenli Cauchy daha da üzücü özelliklere sahiptir. Örneğin, ortalama olmadığı için açık bir şekilde kovarisyona giremese de, kovaryans matrisine benzer bir şeyi yoktur. Sistemde başka hiçbir şey olmuyorsa Cauchy hataları her zaman küreseldir. Ayrıca, hiçbir şey kovarya olmasa da, hiçbir şey bağımsız değildir. Bunun pratik anlamda ne kadar önemli olabileceğini anlamak için, hem büyüyen hem de birbirleriyle ticaret yapan iki ülke hayal edin. Birindeki hatalar diğerindeki hatalardan bağımsız değildir. Hatalarım hatalarınızı etkiliyor. Bir ülke bir delinin eline geçerse, o delinin hataları her yerde hissedilir. Öte yandan, etkiler bir kovaryans matrisi ile beklendiği gibi doğrusal olmadığından, diğer ülkeler etkiyi en aza indirmek için ilişkileri koparabilir.

Trump'ın ticaret savaşını bu kadar tehlikeli yapan da budur. Avrupa Birliği'nin ardından dünyanın en büyük ikinci ekonomisi, diğer her ekonomiye karşı ticaret yoluyla ekonomik savaş ilan etti ve savaş ilan ettiği ülkelerden savaşmak için para ödünç alarak bu savaşı finanse ediyor. Bu bağımlılıklar gevşemeye zorlanırsa, hiç kimsenin yaşayan bir anısı olmayacak şekilde çirkin olacaktır. İngiltere Bankası'nın Atlantik ticaretini ambargolaştırdığı Jackson Jackson'dan bu yana benzer bir sorun yaşamadık.

Cauchy dağılımı büyüleyici, çünkü üstel ve S eğrisi yetiştirme sistemlerinde ortaya çıkıyor. İnsanları karıştırırlar, çünkü günlük yaşamları ortalama ve genellikle varyansları olan yoğunluklarla doludur. Karar vermeyi çok zorlaştırıyor çünkü yanlış dersler öğreniliyor.


Bu cevapta matematiksel özelliklerin gerçek dünya davranışıyla eşleştirildiği cesur yolu seviyorum. Ama (her iki taraf) Kesilmiş bir Cauchy'nin tüm anlarının sınırlı olduğunu belirtmemelisiniz?
Alecos Papadopoulos

Sadece solda kesiliyor. Nominal gezegensel bütçe kısıtı sağda stokastiktir ve para sistemleri sistemleri korumadığından sağda sınırsızdır.
Dave Harris
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.