Ortalama fark neredeyse 0 ise t testi istatistiksel olarak nasıl anlamlı olabilir?


10

Tedaviler arasındaki farkın istatistiksel olarak anlamlı olup olmadığını söylemek için 2 popülasyondaki verileri karşılaştırmaya çalışıyorum. Veri kümeleri normalde iki küme arasında çok az fark olacak şekilde dağılmış görünmektedir. Ortalama fark 0.00017'dir. Ortalamalar arasında fark bulunmayan sıfır hipotezini reddedemeyeceğimi düşünerek eşleştirilmiş bir t testi yaptım, ancak hesaplanan t-değerim, kritik t-değerimden çok daha yüksek.


Ne hakkında öneri istiyorsunuz? N'lerin nedir?
gung - Monica'yı eski

Merhaba, ben nasıl veri hiç farklı görünmüyor gibi görmeye başlamak için yanlış bir şey yaptım, nasıl gerçekten emin değilim. Her iki grubun 335 gözlemi var
Kscicc26

5
Ortalamalardaki farkın standart hatası aynı zamanda standart sapmaların ve numune boyutlarının bir fonksiyonudur. Herhangi bir sürpriz kaydedilmeden önce tüm bu parçaların sorunuzda olması gerekir.
Glen_b-Monica'yı

7
Her fark "neredeyse 0" dır! Sonuç değişkeni insanlar tarafından kazanılan kilo ise ve pound olarak ölçülürse, o zaman 0.00017 gerçekten küçüktür, ancak milyonlarca pound olarak ölçülürse, 0.00017 muazzamdır. Dolayısıyla bu sorunun bir bağlam - yanıtta ölçülmekte olan - ve bir ölçü birimi sağlanana kadar hiçbir anlamı yoktur.
whuber

1
İstatistiksel anlamlılık, İngilizce'nin daha geniş anlamlılık anlamında "önem" anlamına gelmez.
david25272

Yanıtlar:


9

Ortalama fark çok küçük olsa bile, testin önemli olması nedeniyle yanlış bir şey yaptığınıza inanmak için hiçbir neden göremiyorum. Eşleştirilmiş bir t-testinde, önem üç şey tarafından yönlendirilecektir:

  1. ortalama farkın büyüklüğü
  2. sahip olduğunuz veri miktarı
  3. farklılıkların standart sapması

Kuşkusuz, ortalama farkınız çok, çok küçük. Öte yandan, oldukça fazla veriye sahipsiniz (N = 335). Son faktör, farklılıkların standart sapmasıdır. Bunun ne olduğunu bilmiyorum, ancak önemli bir sonuç aldığınızdan, sahip olduğunuz veri miktarı ile küçük ortalama farkın üstesinden gelmek için yeterince küçük olduğunu varsaymak güvenlidir. Bir sezgi oluşturmak için , çalışmanızdaki her gözlem için eşleştirilmiş farkın 0.00017 olduğunu, o zaman farklılıkların standart sapmasının 0 olacağını düşünün. Şüphesiz, tedavinin bir azalmaya yol açtığı sonucuna varmak makul olacaktır ( küçük bir tane).

@Whuber'ın aşağıdaki yorumlarda belirttiği gibi, 0.00017'nin çok küçük bir sayı gibi görünse de, anlamlı olarak küçük olması gerekmez. Bunu bilmek için, öncelikle birimlerin ne olduğunu birkaç şey bilmemiz gerekir. Birimler çok büyükse (örneğin, yıllar, kilometre, vb.), Küçük görünen şey anlamlı derecede büyük olabilir, ancak birimler küçükse (örn. Saniye, santimetre, vb.), Bu fark daha da küçük görünür. İkincisi, küçük bir değişiklik bile önemli olabilir: çok ucuz, tüm popülasyona uygulanması kolay ve hiçbir yan etkisi olmayan bir tür tedavi (örn. Aşı) düşünün. Çok az hayat kurtarsa ​​bile yapmaya değer olabilir.


cevap için teşekkürler! İstatistiklerde çok tecrübeli değilim, bu yüzden almayı beklediğim cevabı alamadığım zaman şaşırmıştım. ortalamalar arasındaki farkların standart hatası: 7.36764E-05. Bunun ne kadar alakalı olduğundan emin değilim ama eminim haha.
Yardımlarınız

Bir şey değil, @ Kscicc26. Farklılıkların standart hatası ve farklılıkların standart sapması aynı şey değildir. (Trajik olarak, olması gerektiği gibi geliyorlar.) SD, farklılıklarınızın ne kadar değiştiğini söylerken, SE, çalışmanızı tekrar tekrar çalıştırırsanız ortalama farkın ne kadar tahmininin değişeceğini söyler. Burada SE'lerle ilgili açıklamamı okumanıza yardımcı olabilir .
gung - Monica'yı eski

i kontrol ve sabah bu iş parçacığında geri alacak!
Kscicc26

2
Bu ortalama fark ne küçük ne de büyüktür: sadece boyutunu değerlendirmek için bir temeliniz yoktur.
whuber

@whuber, bu iyi bir nokta - bu sayıların ne anlama geldiğini bilmiyorum. Ancak OP muhtemelen çok küçük olduğunu düşünüyor. Bu bilgi ile gidiyorum.
gung - Monica'yı eski

9

Bir farkın gerçekten büyük veya küçük olup olmadığını bilmek için bir ölçek ölçeği gerektirir, standart sapma bir ölçek ölçeğidir ve bu skala için kısmen hesaba katılması gereken t testi formülünün bir parçasıdır.

5 yaşındakilerin yüksekliklerini 20 yaşındakilerle (insanlar, aynı coğrafi bölge, vb.) Sezgi bize pratik bir fark olduğunu ve yüksekliklerin inç veya santimetre cinsinden ölçülmesi durumunda farkın anlamlı görüneceğini söylüyor. Fakat yükseklikleri kilometreye çevirirseniz ne olur? veya ışık yılı? fark çok küçük bir sayı olacaktır (ancak yine de farklıdır), ancak (engelleme yuvarlama hatası) t testi, yüksekliğin inç, santimetre veya kilometre olarak ölçülüp ölçülmediği konusunda aynı sonuçları verecektir.

Dolayısıyla, ölçümlerin ölçeğine bağlı olarak 0.00017'lik bir fark çok büyük olabilir.


4

tunlikely to emerge at least as large in another, similar pair of samples selected randomly from the same populations if the null hypothesis of no difference is literally true of those populationst17100,000

pop1=rep(15:20* .00001, 56);pop2=rep(0,336) #Some fake samples of sample size = 336
t.test(pop1,pop2,paired=T)                #Paired t-test with the following output...

t(335)=187,55,p<2.2x10-16

.00001t

Belki de bu anlamlı hipotez anlamlılık testinin gerçek anlamından daha fazla pratik önem ile ilgilenirsiniz. Pratik önem, verilerinizin istatistiksel bağlamdan çok bağlamında anlamına bağlı olacaktır; bu tamamen istatistiksel bir mesele değildir. Buradaki popüler bir sorunun cevabında , bu p'nin yararlı bir örneğini , p-değerlerinin yerleşik görüşlerini barındırarak alıntıladım :

r=.03

Bu "yaşam ve ölüm meselesi", aspirinin kalp krizi üzerindeki etki büyüklüğüydü, temel olarak - pratik olarak önemli anlamı olan sayısal olarak küçük, çok daha az tutarlı farklılıkların güçlü bir örneği. Yararlanabileceğiniz sağlam cevaplara sahip diğer birçok soru, buradaki bağlantıları hak ediyor:

Referans

Rosenthal, R., Rosnow, RL ve Rubin, DB (2000). Davranışsal araştırmalarda kontrastlar ve etki boyutları: Korelasyonel bir yaklaşım . Cambridge Üniversitesi Yayınları.


0

İşte R'deki teorik kavramları gösteren bir örnek. 10.000 kez madeni para sayma olasılığı 10.000 kez .0001 olabilir, 10.000 deneyi madeni para sayma.

t.test (rbinom (10000, 10000, .0001), rbinom (10000, 10000, .00011))

t = -8.0299, df = 19886.35, p-değeri = 1.03e-15 alternatif hipotez: ortalamalardaki gerçek fark yüzde 0 95 güven aralığına eşit değil: -0.14493747 -0.08806253 örnek tahminler: x ortalaması y ortalaması 0.9898 1.1063

Ortalamadaki fark, insan algısı açısından nispeten 0'a kapalıdır, ancak istatistiksel olarak 0'dan çok farklıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.