Sağlam istatistiksel test nedir? Güçlü bir istatistiksel test nedir?


14

Bazı istatistiksel testler sağlamdır, bazıları değildir. Sağlamlık tam olarak ne anlama geliyor? Şaşırtıcı bir şekilde, bu sitede böyle bir soru bulamadım.

Dahası, bazen, bir testin sağlamlığı ve güçlülüğü birlikte tartışılmaktadır. Ve sezgisel olarak, iki kavram arasında ayrım yapamadım. Güçlü test nedir? Güçlü bir istatistiksel testten farkı nedir?


2
Güç ve sağlamlık, bir testin iki önemli özelliği olsalar bile dik kavramlardır. Bana öyle geliyor ki iki ayrı soru sormak daha iyi olurdu.
Stephan Kolassa

2
Sağlamlığı , temel teorisinin bazı varsayımlarının ihlallerine duyarsız olan uyarlanmış bir prosedürün özelliği olarak söyleyebiliriz .
Firebug

Yanıtlar:


21

Sağlamlığın istatistiklerde çeşitli anlamları vardır, ancak hepsi kullanılan veri türündeki değişikliklere biraz direnç gösterir. Bu biraz belirsiz gelebilir, ancak bunun nedeni sağlamlığın değişikliklere farklı türde duyarsızlıklara işaret edebilmesidir. Örneğin:

  • Aykırı değerlere sağlamlık
  • Normalliklere karşı sağlamlık
  • Sabit olmayan varyansa (veya hetero-esnekliğe) dayanıklılık

Testler durumunda , sağlamlık genellikle böyle bir değişiklik göz önüne alındığında testin hala geçerli olduğunu ifade eder. Diğer bir deyişle, sonucun anlamlı olup olmadığı yalnızca testin varsayımlarına uyulduğu takdirde anlamlıdır. Bu tür varsayımlar gevşetildiğinde (yani önemli değil), testin sağlam olduğu söylenir.

Bir testin gücü, gerçek bir fark varsa önemli bir farkı algılama yeteneğidir. Spesifik testlerin ve modellerin çeşitli varsayımlarla kullanılmasının nedeni, bu varsayımların sorunu basitleştirmesidir (örneğin, daha az parametrenin tahmin edilmesini gerektirir). Bir test ne kadar fazla varsayım yaparsa, o kadar az sağlamdır, çünkü testin geçerli olması için tüm bu varsayımların karşılanması gerekir.

Öte yandan, daha az varsayım içeren bir test daha sağlamdır. Bununla birlikte, sağlamlık genellikle güç maliyetiyle gelir, çünkü girişten daha az bilgi kullanılır veya daha fazla parametrenin tahmin edilmesi gerekir.

Sağlam
bir normal dağıtılmış grupları varsayarken, hala karşılaştırılması için geçerli bir test olduğu söylenebilir -testi, sağlam olması için , yaklaşık normal olarak dağılmış grup.t

Bir Wilcoxon testi, testinin varsayımları karşılandığında daha az güçlüdür , ancak altta yatan bir dağılımı kabul etmediğinden ve bu nedenle normal olmayan veriler için geçerli olduğundan daha sağlamdır. Gücü genellikle daha düşüktür, çünkü orijinal sayılardan ziyade verilerin saflarını kullanır ve bu nedenle temelde bazı bilgileri atar.t

Sağlam Değil
Bir testi, varyansların bir karşılaştırmasıdır, ancak normalliğe karşı çok hassastır ve bu nedenle yaklaşık normallik için geçersizdir. Başka bir deyişle, testi güçlü değildir.FFF


1
Cevabınız çok açık ve anlaşılması kolaydır. powerfulCevabınızda tartıştığınızı gördüğünüz gibi testin olup olmadığı hakkında daha fazla soru sormak için soru ile düzenledim . Güçlü bir testin ne anlama geldiğini açıklar mısınız?
JetLag

Bunun bir testin gücü ile nasıl ilişkili olduğuna dair kısa bir açıklama ekledim.
Frans Rodenburg

1
Bu harika bir cevap, sadece tanımı resmileştirmenin yolları olduğunu eklemek istiyorum. Bazıları bir testin hem geçerlilik sağlamlığına sahipse sağlam olduğunu düşünürler , yani sıfırdan küçük kalkışlar göz önüne alındığında testin önem seviyesi sabit kalır ve verim sağlamlığı , yani belirtilen alternatiften küçük kalkışlar verildiğinde güç hala iyidir; ve bu nitelikler etki fonksiyonları kullanılarak ölçülebilir .
Francis

1
@Eric, denklik sadece iki grup için geçerli değil mi?
Sextus Empiricus

1
@eric_kernfeld Sanırım Frans, ANOVA'daki kullanımını değil varyansları karşılaştırmak için kullanımını ifade ediyor . F
mdewey

3

"Sağlam istatistiksel test" in resmi bir tanımı yoktur, ancak bunun ne anlama geldiğine dair bir tür genel anlaşma vardır. Wikipedia web sitesi bunun iyi bir tanımına sahiptir (testin kendisi yerine istatistik açısından):

Sağlam istatistikler, çok çeşitli olasılık dağılımlarından, özellikle normal olmayan dağılımlardan alınan veriler için iyi performansa sahip istatistiklerdir.

https://en.wikipedia.org/wiki/Robust_statistics

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.