Birisi sıfır eğriliğine sahip fakat simetrik olmayan bir tekdüze dağılım örneğini sunabilir mi?


31

Mayıs 2010'da Vikipedi kullanıcısı Mcorazao, çarpıklık makalesine "Sıfır bir değer, değerlerin ortalamanın her iki tarafına nispeten eşit şekilde dağıldığını, genellikle zorunlu olarak simetrik bir dağılım göstermediğini" belirten bir cümle ekledi . Ancak, wiki sayfasında bu kuralı ihlal eden gerçek bir dağıtım örneği yoktur. Googling "sıfır eğriltme ile asimetrik dağılımlar örneği" de en azından ilk 20 sonuçta gerçek örnekler vermedi.

Eğriltmenin hesaplandığı tanımı kullanarak E[(Xμσ)3] veR formülü

sum((x-mean(x))^3)/(length(x) * sd(x)^3)

Eğriliği düşürmek için küçük, keyfi bir dağılım oluşturabilirim. Örneğin, dağıtım

x = c(1, 3.122, 5, 4, 1.1) 

çarpıklığını verir . Ancak bu küçük bir örnek ve ayrıca simetriden sapma büyük değil. Peki, yüksek derecede asimetrik olan ancak hala sıfıra yakın bir eğriliği bulunan bir tepe ile daha büyük bir dağılım oluşturmak mümkün mü?5.64947105


3
Dağıtımın tek biçimli olmasını ister misiniz istemez misiniz? Başlık öyle diyor, ancak metin bu noktadan çok az bahsediyor.
Dilip Sarwate

@Dilip Evet, dağılımın tekdüze olmasının daha ilginç olacağını düşünüyorum, çünkü çarpıklık, merkezi bir an olarak, başka türlü mantıklı gelmiyordu.
Andy McKenzie

Yanıtlar:


28

Ayrık dağılımları göz önünde bulundurun. Desteklenir bir değerleri X 1 , x 2 , ... , x k negatif olmayan olasılıkları ile belirlenir p 1 , s 2 , ... , p k koşullarına tabi (a) bunlar 1 ve toplamı (b) eğiklik katsayısı 0'a eşittir (bu, üçüncü merkezi momentin sıfır olması ile eşdeğerdir). Bu da k - 2 serbestlik derecesi bırakır (denklem çözme anlamında istatistiksel olanı değil!). Unimodal olan çözümler bulmayı umuyoruz.kx1,x2,...,xkp1,p2,...,pkk-2

Örneklerin aranmasını kolaylaştırmak için, küçük bir simetrik vektör üzerinde, 0 , sıfır ortalama ve sıfır eğiklikte benzersiz bir modla desteklenen çözümler aradım. . Bu tür bir çözüm ( s 1 , ... , p 7 ) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 ,x=(-3,-2,-1,0,1,2,3)0 .(p1,...,p7)=(1396,3286,9586,47386,8781,3930,1235)/75600

Olasılık fonksiyonu

Asimetrik olduğunu görebilirsiniz.

İşte (asimetrik olan) ve p = ( 1 , 18 , 72 , 13 , 4 ) / 108 ile daha açık bir şekilde asimetrik bir çözüm :x=(-3,-1,0,1,2)p=(1,18,72,13,4)/108

Olasılık fonksiyonu 2

Şimdi neler olup bittiği açık: ortalama eşit olduğu için , negatif değerler ( - 3 ) 3 = - 27 ve 18 × ( - 1 ) 3 = - 18'i üçüncü ana katkı yaparken, pozitif değerler 4 × 2 3 = 32 ve 13 × 1 3 = 13 , tam olarak negatif katkıları dengeliyor. Yaklaşık bir simetrik dağılımı alabilir 0 gibi, x =0(-3)3=-2718x(-1)3=-184x23=3213x13=130 ile p = ( 1 , 4 , 1 ) / 6 , ve küçük bir kitle shift + 1 için + 2 den küçük bir kütle + 1 için aşağı - 1 , kütle ve hafif bir miktarda aşağı - 3 , ortalamayı 0’da ve eğriliği 0’dax=(-1,0,1)p=(1,4,1)/6+1+2+1-1-300Asimetri oluştururken de. Aynı yaklaşım, asimetrik hale getirirken sürekli bir dağılımın sıfır ortalama ve sıfır eğriliğini korumaya çalışacaktır; eğer kitlesel kaymaya karşı çok saldırgan olmazsak, tek parça kalmaya devam edecek.


Düzenleme: Sürekli Dağılımlar

Sorun devam edeceğinden, sürekli dağılımlarla açık bir örnek verelim. Peter Flom'un iyi bir fikri vardı: normallerin karışımlarına bakın. İki normalin karışımı yapmaz: eğikliği kaybolduğunda simetrik olacaktır. Bir sonraki en basit durum, üç normalin karışımıdır.

Uygun bir konum ve ölçek seçiminden sonra, üç normalin karışımları altı gerçek parametreye bağlıdır ve bu nedenle asimetrik, sıfır-eğik bir çözüm üretmek için fazlasıyla esnekliğe sahip olmalıdır. Bazılarını bulmak için, normal karışımların çarpıklıklarını nasıl hesaplayacağımızı bilmemiz gerekir. Bunların arasında, tek olanları arayacağız (hiçbiri mümkün değildir).

Şimdi, genel olarak, zaman, standart normal dağılımın (merkezi olmayan) an sıfır r tek ve aksi eşittir 2 r / 2 Γ ( 1 - rrincir . Biz bir standart sapması için standart normal dağılımı yeniden ölçeklendirmek zamanσ,r,incidakika ile çarpılırσr. Biz herhangi dağılımı kaydırmaya zamanu, yenirincianı ve dahil anları yukarı cinsinden ifade edilebilirr. Dağılımların karışımının momenti (yani, bunların ağırlıklı bir ortalaması), bireysel anların aynı ağırlıklı ortalamasıdır. Son olarak, çarpıklık, üçüncü merkezi moment sıfır olduğunda tam olarak sıfırdır ve bu, ilk üç an açısından kolayca hesaplanır.2r/2Γ(1-r2)/πσrinciσrμrincir

Bu bize soruna cebirsel bir saldırı verir. Buldum bir çözüm parametreleri ile üç normaller eşit bir karışımı e eşit ( 0 , 1 ) , ( 1 / 2 , 1 ) ve ( 0 , (μ,σ)(0,1)(1/2,1). Onun ortalama eşittir(0+1/2+0)/3=1/6. Bu görüntü pdf'i mavi renkte gösterir ve dağılımınpdf'si ortalamanınkırmızıya çarptığını gösterir. Farklı olduklarının her ikisinin de asimetrik olduğunu gösteriyor. (Modu yaklaşık0,0519216ortalamasına eşit,1/6). Her ikisi de yapı sıfır eğimlidir.(0,127/18)(0,2,65623)(0+1/2+0)/3=1/60.05192161/6

Sürekli örnekler

Grafikler bunların tekbiçimli olduğunu gösteriyor. (Yerel maksimumları bulmak için Matematik'i kullanarak kontrol edebilirsiniz.)


(+1) Çok kaygan cevap. Bu olsa sürekli dağılımlarla çalışacak mı? Vites değiştirme potansiyel olarak küçük küçük modlar yaratmaz mı? Düz
Makro

1
Çok iyi düşünüyorsun Makro: Hepimiz çok şüpheci olmalıyız. İşin püf noktası, geniş aralıklara yayılmış küçük miktarları değiştirmektir. Bir birinci türev testi olası modları için kontrol sağlayacak ve aynı zamanda bir kanıtı için temel oluşturur edecek yeterince bu formun minik kaymalar olacak değil yeni modlar üretirler.
whuber

Cevap için teşekkürler! Bu, sezgisel olarak düşündüklerime benziyor, ancak kelimeleri iyi ifade edemedim - dağılımın her iki tarafındaki kütleyi "dengelemek" zorundasın. Bu dengeleyici eylemi gerçekleştirmenin kalıplaşmış yollarının olup olmadığını merak etmemi sağlıyor.
Andy McKenzie

Bir yol, Andy, ayrık bir çözümle başlamak ve daha sonra normal bir dağılıma sarılmaktır. Bu durumda, tekdüzelik şartı bu normal dağılımın büyük bir standart sapmaya sahip olmasını zorlar. Buna rağmen, evrişim gerekli özellikleri (sıfır sapma gibi) önemli ölçüde değiştirmezse veya öngörülebilir şekillerde değiştirdiğinde, sorunla ilgili matematiksel bir yaklaşımınız vardır. Bir anlamda, son düzenlemem kesinlikle bir katlanma olmasa da (üç normalde farklı standart sapmalar olduğu için) böyle bir saldırı olarak görülebilir.
whuber

2
Kontrol ettim Andy: kesikli çözümü normal bir dağılımla sarsmak eğikliği değiştirmez. Bu normal dağılıma 0,57 ya da daha büyük bir standart sapma verdiğinizde, sonuç tekbiçimli olur. Altta yatan ayrık dağılım gibi, sıfır ortalama, sıfır çarpıklık ve asimetrik olmaya devam eder. Bunu standart normal dağılım miktarlarıyla karıştırmak, standart normal ve ayrık dağılım arasındaki kontrollü bir kütle hareketine eşittir: bu bir "kalıplaşmış" yöntem talebinizi yerine getirebilir.
whuber

23

Burada https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# adresinde bulduğum bir tane var : R'de güzel ve çoğaltıyorum: ters Burr veya ve c = 18.1484 şekil parametreli Dagum dağılımı :k=0.0629c=18.1484

g(x)=ckx(c+1)[1+xc](k+1)

Ortalama 0,5387, standart sapma 0,2907, çarpıklık 0,0000 ve kurtoz 2,0000'dür. Kaynak ayrıca buna "fil dağıtımı" diyor: görüntü tanımını buraya girin

R'deki üreme ile yaratıldı

library(actuar)
library(knotR)

# a nonsymmetric distribution with zero skewness
# see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html#

c <- 18.1484
k <- 0.0629

x <- seq(0,1.5,by=.0001)

elephant.density <- dinvburr(x, k, c)
plot(x,elephant.density, type="l")
polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey")
points(0.8,0.8, pch=19, cex=2)

# "ears" created via https://www.desmos.com/calculator/cahqdxeshd
ear.x <- c(0.686, 0.501, 0.42, 0.68)
ear.y <- c(0.698, 0.315, 1.095, 0.983)

myseg(bezier(cbind(ear.x, ear.y)), type="l")

EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf
EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k)
EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k)
(skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196

Bu çıkışın gösterdiği gibi, bu parametre değerleri için çarpıklık sıfır ila dört hane değil. İşte ve c için küçük bir eniyileyici :kc

   # optimize skewness a bit further
    skewval <- 1

while (skewval > 10^(-10)){
  optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c)
  skewval <- optskew.k$f.root
  k <- optskew.k$root

  optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k)
  skewval <- optskew.c$f.root
  c <- optskew.c$root
}

verimli

> print(c)
[1] 18.89306

> print(k)
[1] 0.05975542

> print(skewval)
[1] -1.131464e-15

Düzenleme için teşekkürler. Bu, 0.0000 ile dört rakam arasındaki eğriliği çoğaltamayacağımı, bunun yerine 0.0001245138 elde edemediğimi söyledi (bir sonraki düzenlemeye bakın, R kodunda).
Christoph Hanck

Muhtemelen ve k değerlerini bulmak için çarpıklık sıfıra mümkün olduğu kadar yakın olacak şekilde basit bir eniyileyici çalıştırılabilir . Birkaç ek satır olmalı, hatta belki bir satır olmalıdır. Zaten son satırınızda analitik olarak hesaplanan kayıp fonksiyonuna sahipsiniz, R'de uygun bir jenerik iyileştirici var mı? ck
amip diyor Reinstate Monica

Aslında, 0.0003756196. 0.0001245138, burada yanlışlıkla verilen bazı ilk optimizasyonlardan sonraydı. Bir göz atarım.
Christoph Hanck

@ amoeba, biraz optimize etmeye çalıştım, fakat bunu akıllıca yaptığımı iddia etmiyorum, optimizasyon konusunda çok az deneyimim var.
Christoph Hanck

2
Sıfırdan üç haneye kadar olan (yaklaşık dört) çarpıklık aklım için yeterliydi; daha kesin bir değer gibi görünmüyor, farklı görünmesini sağlıyor. Eğer çarpıklık bu civarda sıfırı geçerse ve daha fazla doğruluk gerekirse, değerleri nasıl ayarlayacağınız açıksa, bunun yeterli olduğunu düşünüyorum. Ancak ek çaba için teşekkür ederiz. (Bu arada, güzel bir örnek.)
Glen_b -Reinstate Monica

9

0'dan moda modüle doğrusal olarak yükselen ve sonra modun sağında üssel olan gerçek modun pozitif yarısında bir dağılım düşünün.

Buna üçgen-üstel dağılım denebilir (genellikle biraz köpekbalığı yüzgeci gibi görünmesine rağmen).

θλ

λθλθ6.15

Üçgen-sıfır eğriliğiyle üstel

[1][2]

Sıfır çarpıklık ve sıfır aşırı kurtosis ile normal olmayan dağılımlar iplik ? küçük bir ayrık örnek ve bir başka sürekli tek modalik örnek de dahil olmak üzere bazı asimetrik örneklere sahiptir:

Unimodal Gauss karışımı sıfır eğriltme ile

Kesikli modalit olmayan dağılımlar - veya eşdeğerde, numuneler - sıfır eğriltme ile, büyük ya da küçük boyutta, yapımı oldukça kolaydır.

Örnek olarak ya da (ham frekansları 3000'e bölerek) pmf ('x' değerleri alınan değerlerdir, 'n' örnekte bu değerin meydana gelme sayısıdır) örnek olarak ele alabileceğiniz bir örnek ):

x:  -2   -1    0    1    2    3    4    5    6    7    8    9   10
n: 496  498  562 1434    2    1    1    1    1    1    1    1    1

Yukarıdan inşa edilmiş olasılık kütle işlevinin bir grafiği

Bu örnek 3 nokta dağılımlarından oluşur:

x:          -2              1                  c
n:   c(c-1)(c+1)/6     c(c-1)(c+1)/3 - c       1

ccΣbennbenxben=0Σbennbenxben3=0c

İnsanın yapabileceği bu tür diğer "atomların" her yolu vardır, ancak bu örnek sadece bu türden kullanır. Bunun gibi bazı atomların kombinasyonuna, kalan delikleri doldurmak ve ortalama ve üçüncü momentin yapısını tahrip etmeden eşbiçimliliği garanti etmek için simetrik olarak yerleştirilmiş birkaç değer eklenir.

[1]


[2]



3
Belki de "Köpekbalığı yüzgeci" diyebilir miyiz?
Glen_b -Reinstate Monica

@Glen_b Gerçekten tamamen Shark-fin.
Alecos Papadopoulos

2

Emin. Bunu dene:

skew= function (x, na.rm = FALSE) 
 {
    if (na.rm)    x <- x[!is.na(x)]             #remove missing values
    sum((x - mean(x))^3)/(length(x) * sd(x)^3)  #calculate skew   
 }

set.seed(12929883) 
x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1))

 skew(x)
 plot(density(x))

(Zor işleri zaten yaptın!)


1
Güzel beğendim. 1
dediklerinin - Eski Monica

4
İki modlu değil ... korkunç bir çoklu moda. Yoğunluğu çizmeyi deneyin; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
misafir

1
Bu şekilde üretilen veriler kesinlikle tekdüze değildir. Bunu kesmek ve kodunuzu yapıştırmak, sözlü olarak görmek için yapmanız gereken tek şey. Gerçekten de normal dağılmış değişkenlerin bir karışımı asla tekdüze olmayacak (tabii ki karışım oranlarından biri 1 değil).
Makro

8
@ Makro, bu doğru değil. Örneğin, "araçlar en az 2 standart sapma ile ayrılmadığı sürece iki karma normalin yoğunluğunun iki modlu olmadığı" için iyi bilinen bir sonuç için Roeder 1994'ün (JASA) özeti konusuna bakınız. Bundan daha azıyla ayrılırlarsa, karışım tekdüzedir.
misafir

1
@Guest haklısın. Görevimi yaparken bu olasılığı unutmuştum
Makro

2

E[(X-μσ)3]=0
E[(X-μσ)3|Xμ]+E[(X-μσ)3|X>μ]=0.

YZμ

E[(Y-μσ)3]=E[(Z-μσ)3]
XYμ(μ-Z)

YZμμ


1
Dağıtımın tek biçimli olduğunu nasıl garanti edersiniz?
Dilip Sarwate

YZμ

σYZ

@whuber: Kahretsin. Orada biliyordum vardı bazı sıkan ... :-) olmak
krlmlr

2

Aşağıdaki ayrık dağılım asimetriktir ve sıfır eğikliğe sahiptir: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Doric ve ark., Qual Quant (2009) 43: 481-493; DOI 10.1007 / s11135-007-9128-9


+1 Kontrol eder ve tekdüzedir. Bu mümkün olan en basit örnek.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.