Ortalama için sağlam t testi


17

Rastgele değişkenin hafif ve orta çarpıklığına ve basıklıklarına maruz kalan rastgele bir X değişkeni için yerel E [ X ] > 0 değerine karşı boş değerini test etmeye çalışıyorum . Wilcox'un 'Sağlam Tahmin ve Hipotez Testine Giriş' önerilerini takiben, kesilmiş ortalamaya, medyanın yanı sıra konumun M tahmincisine (Wilcox '"tek adımlı" prosedür) dayanan testlere baktım. Bu sağlam testler, eğik olmayan, ancak leptokurtotik bir dağılımla test yaparken, güç açısından standart t testinden daha iyi performans gösterir.E[X]=0E[X]>0X

Bununla birlikte, çarpık bir dağılımla test yaparken, bu tek taraflı testler, dağılımın sola veya sağa çarpık olmasına bağlı olarak, sıfır hipotezi altında çok liberal veya çok muhafazakardır. Örneğin, 1000 gözlemle, ortancaya dayalı test aslında zamanın ~% 40'ını nominal% 5 seviyesinde reddedecektir. Bunun nedeni açıktır: çarpık dağılımlar için medyan ve ortalama oldukça farklıdır. Ancak, uygulamamda, kesilmiş ortalama değil medyanı değil, ortalamayı test etmem gerekiyor.

T-testinin ortalamaları test eden, ancak çarpıklık ve basıklık geçirmeyen daha sağlam bir versiyonu var mı?

İdeal olarak prosedür, eğimsiz, yüksek basıklık durumunda da iyi çalışır. 'Tek adım' testi neredeyse 'yeterince iyi' ve 'bükülme' parametresi nispeten yüksek ayarlanmış, ancak eğrilik olmadığında kesilmiş ortalama testlerden daha az güçlüdür ve eğriltme altında nominal reddetme düzeyini koruyan bazı sıkıntılar vardır .

arka plan: medyanı değil, ortalamayı gerçekten önemsememin nedeni, testin finansal bir uygulamada kullanılmasıdır. Örneğin, bir portföyün beklenen günlük getirilerinin pozitif olup olmadığını test etmek istiyorsanız, ortalama aslında uygundur, çünkü portföye yatırım yaparsanız, tüm getirileri (örnek sayısının ortalama çarpıdır) yerine Ortanca kopyalar. Yani, gerçekten RV X n berabere toplamı umurumda .nnX


Welch t-testinin kullanımını yasaklayan bir neden var mı? Bu soruya vereceğim cevaba bir göz atın ( stats.stackexchange.com/questions/305/… ).
Henrik

1
iyi, sorun ben 2-örnek testi değil, 1-örnek testi istiyorum! Boş test ediyorum , E [ X 1 ] = E [ X 2 ] değil . Kubinger ve ark. al., kâğıt (Ich kann schlecht Deutsche). E[X]=μE[X1]=E[X2]
shabbychef

Açıkladığınız için teşekkürler. Bu durumda Kubinger kağıdı size çok yardımcı olmayacaktır. Özür dilerim.
Henrik

Yanıtlar:


5

Parametrik olmayan testlere neden bakıyorsunuz? T-testinin varsayımları ihlal ediliyor mu? Yani, sıralı veya normal olmayan veriler ve tutarsız varyanslar? Tabii ki, numuneniz yeterince büyükse, numunedeki normallik eksikliğine rağmen parametrik t-testini daha büyük gücü ile haklı çıkarabilirsiniz. Benzer şekilde, endişeniz eşit olmayan varyanslarsa, parametrik testte doğru p değerleri veren düzeltmeler vardır (Welch düzeltmesi).

Aksi takdirde, sonuçlarınızı t-testiyle karşılaştırmak bu konuda iyi bir yol değildir, çünkü varsayımlar karşılanmadığında t-testi sonuçları taraflıdır. Mann-Whitney U, gerçekten ihtiyacınız olan şeyse, parametrik olmayan uygun bir alternatiftir. Parametrik olmayan testi yalnızca t-testini haklı olarak kullanabildiğinizde kaybedersiniz (varsayımlar karşılandığı için).

Ve biraz daha arka plan için buraya gidin ...

http://www.jerrydallal.com/LHSP/STUDENT.HTM


veriler kesinlikle normal değildir. fazla basıklık 10-20 mertebesinde, çarpıklık ise -0,2 ila 0,2 mertebesinde. 1 örnekli t testi yapıyorum, bu yüzden sizi 'eşit olmayan varyanslar' veya U-testi ile ilgili takip ettiğimden emin değilim.
shabbychef

'Parametrik test kullan' tavsiyesini kabul ediyorum. sorumu tam olarak çözmüyor, ama sorum muhtemelen çok açık uçluydu.
shabbychef

12

Grup araçlarının farklı olup olmadığını gerçekten test etmek istiyorsanız (grup medyanları veya kesilmiş araçlar vb. Arasındaki farkları test etmek yerine), farklı bir hipotezi test eden parametrik olmayan bir test kullanmak istemediğinizi kabul ediyorum.

  1. Genel olarak, t-testinden elde edilen p-değerleri, artıkların normallik varsayımının ılımlı kalkışları göz önüne alındığında oldukça doğru olma eğilimindedir. Bu sağlamlık hakkında bir sezgi almak için bu uygulamaya göz atın: http://onlinestatbook.com/stat_sim/robustness/index.html

  2. Hala normalite varsayımının ihlali konusunda endişeleriniz varsa, önyükleme yapmak isteyebilirsiniz . ör. http://biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf

  3. Normalden ayrılma ile ilgili sorunları çözmek için çarpık bağımlı değişkeni de dönüştürebilirsiniz .


2
+1 güzel ve net cevap. Jeromy, 3. nokta hakkında bir soru sorabilir miyim? Verileri dönüştürmenin ardındaki mantığı anlıyorum, ama bunu yaparken beni hep rahatsız etti. Dönüştürülen verilerdeki t-testinin sonuçlarının dönüştürülmemiş verilere (t-testi yapmasına "izin verilmez") rapor edilmesinin geçerliliği nedir? Diğer bir deyişle, veri günlüğe dönüştürüldüğünde iki grup farklıysa, ham verilerin de hangi bazlarda farklı olduğunu söyleyebilirsiniz? Unutmayın, ben bir istatistikçi değilim, bu yüzden belki de kesinlikle aptalca bir şey söyledim :)
nico

2
@nico Sonuçları nasıl raporlayacağımı veya düşüneceğinden emin değilim, ancak göstermek istediğiniz tek şey bazı X ve Y için mu_X! = mu_Y ise, tüm X_i <X_j, log ( X_i) <log (X_j) ve tüm X_i> X_j, log (X_i)> log (X_j). Bu nedenle, kademelerle çalışan parametrik olmayan testler için verilerin dönüştürülmesi sonucu etkilemez. Bundan düşünüyorum, bazı testler mu_log (X)! = Mu_log (Y) gösteriyorsa, o zaman mu_X! = Mu_Y olduğunu varsayabilirsiniz.
JoFrhwld

cevaplar için teşekkürler. aslında, t-testi hafif eğik / kurtotik girdi altında nominal tip I oranını koruyor gibi görünmektedir. ancak daha fazla güce sahip bir şey umuyordum. re: 2, Wilcox'u uyguladım trimpbve trimcibten azından benim zevkime göre güç testlerimi yapmak için biraz yavaşlar. re: 3, bu yöntemi düşündüm, ama dönüştürülmemiş verilerin ortalaması ile ilgileniyorum (yani, 2 RV'leri bir t-testi ile karşılaştırmıyorum, bu durumda, monotonik bir dönüşüm için iyi olur @JoFrhwld tarafından not edildiği gibi sıra tabanlı bir karşılaştırma.)
shabbychef

2
@nico Eğer artıkların nüfus dağılımı iki grupta aynıysa, o zaman her zaman ham nüfus grubunda bir fark olduğunu hayal ediyorum. Bununla birlikte, p değerleri ve güven aralıkları ham veri mi yoksa dönüştürülmüş veri mi kullandığınıza bağlı olarak biraz değişme eğilimi gösterecektir. Genel olarak, değişkeni anlamak için anlamlı bir metrik gibi göründüklerinde dönüşümleri kullanmayı tercih ederim (ör. Richter ölçeği, desibel, sayım günlükleri, vb.).
Jeromy Anglim

3

Johnson (1978) ,t- sorunum için iyi bir başlangıç ​​noktası olan istatistik ve güven aralıkları. Düzeltme, Cornish-Fisher genişlemesine dayanır ve örnek eğriliği kullanır.

'En son ve en büyük', Hall ve diğerlerine yapılan referanslarla Ogaswara'dan kaynaklanmaktadır .


0

Bir yorum için yeterli itibarım yok, bu yüzden bir cevap olarak: Bu hesaplamaya bir göz atın . Bunun mükemmel bir cevap verdiğini düşünüyorum. Kısaca:

Asimptotik performans, çarpıklık biçimindeki normallikten sapmalara basıklık biçiminden çok daha duyarlıdır ... Bu nedenle, öğrencinin t-testi, çarpıklığa karşı hassastır, ancak ağır kuyruklara karşı nispeten sağlamdır ve bir test kullanmak mantıklıdır. t-testini uygulamadan önce çarpıklık alternatiflerine yönelik normallik.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.