Welch t-testi için serbestlik derecelerini bildirme


14

Eşitsiz varyanslar için Welch t testi (Welch-Satterthwaite veya Welch-Aspin olarak da bilinir) genellikle tamsayı olmayan bir serbestlik derecesine sahiptir . Test sonuçlarını bildirirken bu özgürlük dereceleri nasıl belirtilmelidir?

Çeşitli kaynaklardan * göre "Standart t tabloları danışmadan önce en yakın tam sayıya yuvarlanacak geleneksel olan." - tutucudur yuvarlanması bu yönü olarak mantıklı ** Bazı eski istatistiksel yazılım (örneğin çok yapardı Graphpady Prism versiyonundan önce 6 ) ve bazı çevrimiçi hesap makineleri hala yapıyor. Bu prosedür kullanılmışsa, yuvarlanmış serbestlik derecelerinin raporlanması uygun görünmektedir. (Yine de daha iyi bir yazılım kullanmak daha uygun olabilir!)

Ancak modern paketlerin büyük çoğunluğu kesirli parçayı kullanır, bu durumda bu kesirli parçanın alıntılanması gerekir. İki serbestlikten fazla yere alıntı yapmanın uygun olduğunu göremiyorum, çünkü bir serbestlik derecesinin binde biri p- değeri üzerinde ihmal edilebilir bir etkiye sahip olacaktır .

Google bilginine baktığımda, df'yi bir sayı olarak, bir ondalık basamakla veya iki ondalık basamakla alıntılayan kağıtları görebiliyorum. Ne kadar hassasiyet kullanılacağına dair herhangi bir yönerge var mı? Yazılımı tam kesirli kısmı kullanıldığında, ayrıca, yuvarlatılmış df alıntı gereken aşağı rakamlar istenen sayıda (örn 1 dp veya ile uygun olarak bir tam sayı olarak) muhafazakar hesaplama, ya da benim için daha mantıklı gibi göründüğü gibi, geleneksel olarak ( en yakın ) yuvarlandı, böylece ila 1 dp veya en yakın bütüne?7.5845...7.57.5845 ... 7.6 877.5845...7.68

Düzenleme: tamsayı olmayan df raporlama en teorik olarak sağlam yolu bilmek dışında, aynı zamanda insanların pratikte ne yaptığını bilmek iyi olurdu . Muhtemelen dergiler ve stil rehberlerinin kendi gereksinimleri vardır. APA gibi etkili stil rehberlerinin neye ihtiyacı olduğunu merak ediyorum. Ne ayırt edebileceğimden (kullanım kılavuzu çevrimiçi olarak ücretsiz olarak mevcut değildir), APA, p -değerleri (iki veya üç dp olabilir) ve yüzdeler (yuvarlatılmış) hariç, neredeyse her şeyin iki ondalık basamağa görünmesi gerektiği konusunda genel bir tercihe sahiptir . en yakın yüzde) - regresyon eğimlerini, t istatistiklerini, F istatistiklerini,χ2istatistikleri vb. Bu, ikinci ondalık basamağın çok farklı bir anlamlı rakam içerdiğini ve 2.47'de 982.47'ye göre oldukça farklı bir hassasiyet önerdiğini akılda tutarak, mantıksız örneğimde gördüğüm iki ondalık basamakla Welch df sayısını açıklayabilir. .

örn. Ruxton, GD Eşit olmayan varyans t testi, Student t-testine ve Mann-Whitney U testine , Davranışsal Ekoloji'ye (Temmuz / Ağustos 2006) 17 (4): 688-690 doi: 10.1093 / beheco / ark016

Welch-Satterthwaite yaklaşımının kendisi muhafazakar olabilir veya olmayabilir ve muhafazakar olmadığı bir durumda, serbestlik derecelerinin aşağı yuvarlanması genel olarak telafi garantisi değildir.


1
Gerçek pratik çalışmadım - bu yüzden bu bir yorum değil, bir cevap değil - ama önemli rakamları bildirmeyle ilgili yargıya dayanmasını bekliyorum. Nispeten yüksek df için, genellikle ilk ondalık hanedeki bir değişiklik p-değerini hiç değiştirmez (rapor edilen hassasiyet seviyesine), bu nedenle bir tamsayıya yuvarlama iyidir. Çok düşük df ve aşırı değerleri içinaşabilir böyle durumlarda öne göre sadece bir az anlamlı rakama bildirilmelidir kendisi. t | νt0.01νp|νFν(t)|0.01νp
whuber

@whuber Bu özellikle faydalı bir gözlem, özellikle Glen_b'in cevabı ile birlikte alındığında. için "çok düşük" ne kadar düşüktür ? (Karşılaştığım makalelerin örneğinden şüphem, "gerçek uygulama" nın "iyi uygulama" ile aynı şey olmayabileceğidir! Yönergelerin robotik takibinin yargı kadar etkili olduğundan şüpheleniyorum, bu yüzden ilginç olurdu raporlama kurallarının neler olduğunu bilmek.)ν
Silverfish

Yanıtlar:


10

Gerçek pratiği incelemedim, bu yüzden bu cevap sorunun o yönünü ele alamaz. Genel bir ilke olarak, serbestlik derecelerinin (df) rapor edilmesinde önemli basamakların işlenmesinin, önemli rakamlarla ilgili yargıyı temel almasını beklerim.

İlke tutarlı olmaktır : hassasiyeti, onunla ilişkili başka bir hassasiyette kullanılan hassasiyete uygun miktarda kullanın. Spesifik olarak, değerleri rapor ve olduğunda küçük değeri en yakın katına verilir (örneğin altı yerleri ondalık noktası) sonra, göreceli hassas işlevi tarafından aracılık edilen olduğuy = f ( x ) x h h = 1xy=f(x)xhyfh=12×106yf

suphkh|f(x+k)f(x)|h|ddxf(x)|.

Yaklaşıklık, aralığında sürekli olarak ayırt edilebilir olduğunda geçerlidir .[ x - h , x + h ]f[xh,x+h]

Mevcut başvuruda, , değeri, , serbestlik derecesi vep x νypxν

y=f(x)=f(ν)=Fν(t)

burada , Welch-Satterthwaite istatistiğidir ve , serbestlik derecesine sahip Student dağılımının .F ν t νtFνtν

Nispeten yüksek df , genellikle ilk ondalık basamaktaki bir değişiklik p-değerini hiç değiştirmez (rapor edilen hassasiyet düzeyine), bu nedenle bir tamsayıya yuvarlama iyidir ( ancak çok küçük). Çok düşük df ve istatistik aşırı değerleri için , bir türevinin büyüklükaşabilir böyle durumlarda öne göre sadece bir az ondalık haneli olarak gereken kendisi.νh=1/2h|ddxf(x)|t|νFν(t)|0.01νp

en düşük (makul) df ve aralıkları için türevin büyüklüğünün bu etiketli kontur grafiğiyle kendiniz görün. bu ilgi çekicidir (çünkü düşük p değerlerine yol açabilirler).|t|

şekil

Etiketler, türevin baz-10 logaritmasını gösterir. Bu nedenle, bu grafikte ve arasındaki noktalarda , ondalık noktadan sonra yerinde bildirilen df'nin değiştirilmesi, bildirilen p değerini yalnızca ve sonraki yerler. Örneğin, p değerini (altı ondalık basamağa) yuvarladığınızı varsayın . ve istatistiklerini göz önünde bulundurun . Bunlar log konturunun yakınında bulunur . Bu nedenle , ondalık basamağa bildirilmelidir.- ( k + 1 ) j inci ( j + k ) inci 10 - 6 ν = 2.5 t = 8 - 3 ν 6 + ( - 3 ) = 3k(k+1)jth(j+k)th106ν=2.5t=83ν6+(3)=3

En büyük için açık mavi alanlar endişe vericidir, çünkü küçük değişikliklerin p değeri üzerinde en büyük etkilere sahip olduğunu gösterirler .νkν

Bunu daha yüksek df durumuyla karşılaştırın ( gösterilen ila ):30430

şekil 2

hassasiyeti üzerindeki etkisi arttıkça hızla azalır .p ννpν


1
Bu, kişinin serbestlik derecelerini (+50!) Yuvarlamak için hangi ilkelere uyması gerektiğine dair çok yardımcı bir katkı oldu; Umarım daha sonraki bir cevaplayıcı gerçek uygulama ile ilgili boşlukları doldurabilir.
Silverfish

7

Standart t tablolarına danışmadan önce en yakın tam sayıya yuvarlamak gelenekseldir.

Bir konvansiyon nedeni tablolarda tamsayı df olmamasıdır. Aksi halde bunu yapmak için hiçbir neden yok.

bu ayar muhafazakar olduğundan mantıklı.

İstatistiğin aslında bir t-dağılımı yok, çünkü o kare payda aslında ölçekli bir ki-kare dağılımına sahip değil. Bu, belirli bir örnekte muhafazakar olabilecek veya olmayabilecek bir yaklaşımdır - belirli bir örnekte istatistiğin kesin dağılımını düşündüğümüzde, df aşağı yuvarlamanın muhafazakar olduğu kesin olmayabilir.

(enterpolasyon yoluyla veya bu df ile t-dağılımı için sayıları gerçekten kırarak?)

t-dağılımlarından gelen p-değerleri (cdf'yi bir t-istatistiğine uygulamak) çeşitli oldukça doğru yaklaşımlarla hesaplanabilir, bu nedenle enterpolasyondan ziyade etkili bir şekilde hesaplanırlar.

İkiden fazla ondalık basamağa alıntı yapmanın uygun olduğunu göremiyorum

Katılıyorum.

Ne kadar hassasiyet kullanılacağına dair herhangi bir yönerge var mı?

Bir olasılık, p-değeri için Welch-Satterthwaite yaklaşımının bu genel varyans oranları bölgesinde ne kadar doğru olduğunu araştırmak ve df'de önerilenden daha fazla göreceli doğruluk teklif etmemek olabilir (df'nin payda meydanında ki-kare, sadece ki-kare olmayan bir şeye bir yaklaşım veriyor).


1
Ben "aşağı yuvarlama muhafazakar" olduğunu açık olmalı. Welch-Satterthwaite yaklaşımının kendisi tutucu olabilir veya olmayabilir. Ancak aşağı doğru yuvarlama süreci - eğer yaklaşım başlamak için muhafazakar değilse, aşağı yuvarlandıktan sonra en az daha az kötüdür. Buna karşılık, yuvarlama (örn. "8'e en yakın 7.5845 mermi") kesinlikle muhafazakar bir ayarlama değildir . Bunu ifade etmenin daha iyi bir yolunu bulmakla yapabilirdim, ama umarım amacım açıktır!
Silverfish

"Bir olasılık, p-değeri için Welch-Satterthwaite yaklaşımının o genel varyans oranları bölgesinde ne kadar doğru olduğunu araştırmak olabilir" - bu çok mantıklı ve ilkeli yaklaşım gibi görünüyor. Bu yaygın olarak yapılan bir şey mi? Uygulama için bazı ipuçları iyi olurdu. Uygulamada dergi tarzı yönergeleri genellikle bu konuda son söz var şüpheli! Ama ne dediklerini bilmiyorum - araştırmamda ortaya çıkan gazetelerde kesinlikle çeşitli uygulamalar vardı.
Silverfish

Gelecekteki okuyucuların kafa karışıklığını önlemek için soru gövdesinde yeniden muhafazakar olan yuvarlamayı açıklığa kavuşturmaya çalıştım. Aldığınız için teşekkürler.
Silverfish

Genelde böyle bir şey yapıldığını düşünmüyorum, ama bunun böyle olmaması gerektiğini düşünüyorum. Bir turun neden belirli bir noktaya kadar yuvarlandığını / kesildiğini açıklamanın ne kadarı açık bir şekilde dergiye / editöre / hakemlere bağlı olacaktır.
Glen_b-Monica'yı geri yükle
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.