Laplace dağıtılmış 2 aracı nasıl karşılaştırabilirim?


10

1 dakikalık hisse senedi iadeleri için 2 örnek aracı karşılaştırmak istiyorum. Ben Laplace dağıtılmış (zaten kontrol edilmiş) ve iadeleri 2 gruba ayrılır varsayalım. Önemli ölçüde farklı olup olmadıklarını nasıl kontrol edebilirim?

Sanırım onları Normal dağılım gibi ele alamıyorum, çünkü 300'den fazla değer olmasına rağmen, QQ grafiği Normal dağılımda büyük bir fark olduğunu gösteriyor


Kod / paket istemek burada konu dışıdır, ancak burada gömülü gerçek bir istatistiksel sorunuz var. Temeldeki istatistiksel sorunu açıklığa kavuşturmak için sorunuzu düzenlemek isteyebilirsiniz. İlgili istatistiksel kavramları anladığınızda, yazılıma özgü öğelerin kendiliğinden belirgindiğini veya en azından belgelerden kolayca ulaşılabileceğini görebilirsiniz.
gung - Monica'yı eski

"Farklı" dediğinizde, sadece araçların farkıyla ilgileniyorsunuz ve eğer öyleyse, spreadlerin aynı olduğunu mu düşünüyorsunuz?
Glen_b -Reinstate Monica

Evet, sadece araçların önemli ölçüde farklı olup olmadığını bilmek istiyorum ve dağıtımın aynı olduğunu varsayıyorum. Standart sapmanın aynı olduğunu sanmıyorum, ama bunun da iyi olacağını düşünüyorum
Rob

2
Lütfen 1 dakikalık stok iadeleri hakkında daha fazla bilgi verin. Zamansal olarak ilişkili verilerin ortalamalarını karşılaştırmak ister misiniz?
Michael M

2
Ayrıca, kontrol ettiğiniz değer sayısının dağılımı değiştirmediğini unutmayın; Laplace için değerinde normale çok yakın olacak örnek araçların dağılımını düşünüyor olabilirsiniz . n=300
Glen_b -Reinstate Monica

Yanıtlar:


12

Her iki Laplace dağılımının da aynı varyansa sahip olduğunu varsayarsak,

a) olabilirlik oranı testi aşağıdaki gibi bir test istatistiği içerecektir:

L=i=1n12τ^exp(|xiμ^|τ^)i=1n112τ^1exp(|xiμ^1|τ^1)i=n1+1n12τ^2exp(|xiμ^2|τ^2)

Günlükleri alma, iptal etme / basitleştirme ve ile çarpma .2

2l=2(nlog(τ^)n1log(τ^1)n2log(τ^2)) (burada )l=log(L)

burada birleştirildi numunede ortanca ortalama mutlak sapma ve , numunede ortanca ortalama mutlak sapma .τ^=mτ^i=mii

Wilks teoremine göre, bu asimptotik olarak null altında olarak dağıtılır , bu nedenle% 5'lik bir test için aşarsa reddedersiniz ,.χ123.84

Simülasyon deneyleri, testin küçük örnek boyutlarında anti-muhafazakar olduğunu (reddetme olasılığının nominalden biraz daha yüksek olduğunu), ancak yaklaşık n = 100 kadar, en azından makul (% 5.3 -% 5.4 civarında) Nominal% 5 testi için altındaki reddetme oranı; örneğin için% yakın görünüyor).n1,n2>300

b) Ayrıca o beklediğiniz iyi bir test istatistiği olurdu (burada temsil örnek medyan ve ); orada bir hata yapmazsam, sizinki gibi büyük örneklerde, normalde null altında, ortalama 0 ve varyans 1 ile dağıtılır, burada , karenin karesine dayalı olabilir birleştirilmiş örnekteki ortalamadan mutlak sapma, , ancak pratikte iki örnek 's örnek ağırlıklı ortalamaya dayandırarak daha iyi çalışma eğiliminde olmasını bekliyorum .μ~1μ~2vμ~v=2τ^2(1n1+1n2)τ^2m2mi2

(Düzenleme: simülasyon normal yaklaşımın iyi olduğunu gösterir ancak varyans hesaplaması yukarıda doğru değildir; Sorunun şu anda ne olduğunu görebiliyorum ama yine de düzeltmem gerekiyor. Bu testin permütasyon versiyonu (bakınız madde (c)) hala iyi olmalı).

c) Başka bir alternatif, yukarıdaki istatistiklerden birine dayalı bir permütasyon testi yapmak olacaktır. ( Buradaki cevaplardan biri, medyanlarda bir fark için permütasyon testinin nasıl uygulanacağının ana hatlarını verir.)

d) Her zaman bir Wilcoxon / Mann-Whitney testi yapabilirsiniz; Laplace'da bir t testi kullanmaya çalışmaktan çok daha verimli olacaktır.

e) Laplace verileri için (d) 'den daha iyi, Mood'un medyan testi olacaktır; kitaplarda sıklıkla tavsiye edilmesine rağmen, Laplace verileriyle uğraşırken iyi bir güç gösterecektir. Medyanlardaki asimptotik fark testinin permütasyon versiyonuna benzer bir güce sahip olmasını bekliyorum ((c) 'de belirtilen testlerden biri).

Buradaki soru , Fisher testi kullanan bir R uygulaması veriyor, ancak bu kod bunun yerine ki-kare testi kullanmak için uyarlanabilir (hatta orta düzey örneklerde bile öneririm); alternatif bunun için örnek kod (bir fonksiyonu olarak) var burada .

Medyan testi burada çok derin olmamakla birlikte Wikipedia'da tartışılmaktadır (bağlantılı Almanca çevirinin biraz daha fazla bilgisi vardır). Parametrik olmayan bazı kitaplar tartışır.


Çok teşekkürler! Daha sonra, normal dağılım testinde yaptığım gibi ortalama = 0 ve standart sapma = 1 için Laplace kantilini aşarsanız, kullandığınız test istatistiğini kullanabilir ve reddedebilir miyim?
Rob

Üzgünüm, gerçekten orada ne istediğini bilmiyorum, bu yüzden ne demek istediğini detaylı olarak açıklaman gerekecek. Hangi test istatistiğinden bahsediyorsunuz? [(A), (c) veya (d) 'de belirtilen testlere bağlı kalmalısınız, çünkü düzenlemem bir " " ile işaretlenmiş olduğu gibi, ikinci (b) olarak etiketlenmiş asimptotik olanda var olan hesaplanmış varyansımla ilgili bir sorun var açıkça belirtiyor. Hala bu davayı düzeltmek zorundayım ama hızlı bir şekilde
alamayabilirim

@Glen_b. Faydalı cevap teşekkürler (+1) ama null model 2 parametreye ( ve ) sahipken, alternatif 4'e sahiptir. Yani olmalı ? (küçük-orta ölçekli örneklem durumunda ben yine de simülasyon ile değerleri μ^τ^χ22
tabloya veriyorum bakıyorum

Veya alternatif modeldeki ölçek için tek bir tahmin mi kullandınız?
P.Windridge

@ P.Windridge Bu mükemmel bir nokta. Evet, cebirsel ifadeye sahip olduğum için, null değerine alternatif olan 2 serbest parametrenin azalması (ama gerçekten yazdığımda aynı ölçeği üstlenmeyi düşünüyordum ). Bunu düzeltmek gerekiyor, bu yüzden tüm tutarlı (ve ben bunu yaparken ben düzenlemede bahsettiğim diğer sorun ne olursa olsun düzeltmek için yeniden çalışması gerekir)χ12
Glen_b-Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.