Bir değerin popülasyon ortalamasından önemli ölçüde daha uzakta olması için istatistiksel test: bu bir Z testi mi yoksa T testi mi?


12

Bir değer, değerler listesiyle karşılaştırıldığında ne kadar önemlidir? Çoğu durumda istatistiksel testler, bir örneklem grubunun bir popülasyonla karşılaştırılmasını içerir. Benim durumumda örnek bir değerle yapılır ve biz bunu popülasyonla karşılaştırırız.

İstatistiksel hipotez testinde belki de en temel sorunla karşılaşan bir amatörüm. Bu sadece bir test değil, yüzlerce test. Bir parametre alanı var ve her nokta için bir önem testi yapmak gerekir. Her parametre kombinasyonu için hem değer hem de arka plan listesi (nüfus) oluşturulur. Sonra bunu p-değeri ile sipariş ediyorum ve ilginç parametre kombinasyonları buluyorum. Aslında, bu p-val'in yüksek olduğu (parametre anlamlı olmayan) parametre kombinasyonlarının bulunması da önemlidir.

Tek bir test yapalım: Seçilen bir kümeden hesaplanmış bir değere ve rastgele bir eğitim seti seçerek hesaplanan bir arka plan değerler kümesine sahibim. Hesaplanan değer 0,35'tir ve arka plan kümesi (muhtemelen?) Normalde ortalama 0,25 ve çok dar bir std (e-7) ile dağıtılır. Aslında dağıtım hakkında bilgi yok, çünkü örnekleri başka bir şeyden hesaplanır, onlar bazı dağıtım rastgele sayı örnekleri değildir, bu yüzden arka plan bunun için doğru kelimedir.

Sıfır hipotezi, "örnek testinin ortalaması, hesaplanan değere eşittir 0.35" olacaktır. Bunu ne zaman Z testi veya T testi olarak düşünmeliyim? Değerin nüfus ortalamasından önemli ölçüde daha yüksek olmasını istiyorum, bu yüzden tek kuyruklu bir test.

Ne bir örnek olarak düşünmek için biraz karışık: Ya bir örnek (gözlem) ve nüfus olarak arka plan listesi var VEYA benim örnek arka plan listesidir ve ben bütün (örneklenmemiş) karşılaştırıyorum sıfır hipotezine göre aynı ortalamaya sahip olan popülasyon. Bu karar verildikten sonra, test sanırım farklı yönlere gidiyor.

Eğer bir T-testi ise, p-değerini nasıl hesaplayabilirim? R / Python / Excel işlevini kullanmak yerine kendim hesaplamak istiyorum (bunu nasıl yapacağımı zaten biliyorum), bu yüzden önce doğru formülü kurmalıyım.

Başlangıç ​​olarak, bir T-testinin biraz fazla genel olduğundan şüpheleniyorum, çünkü benim durumumda T-testi örnek boyutuna bağlanacak ve burada ve s , örnek std ve nüfus std. Bu yüzden iki vakam var: ya benim örneklem büyüklüğüm, "sanırım" nüfusun boyutudur, bir Z testi ile uğraştığım anlamına gelir, ya da nüfus istatistikleri (n ve std) bilinmiyor, ancak dağılım bir şekilde yaklaştı ve gerçekten bir T-testi ile uğraşıyorum. Her durumda aşağıdaki sorularım:

T=Z/s,
Z=X¯σn
s=σ^/σ
  1. Bir p değerini nasıl hesaplayabilirim? (yani bir R / Python / Excel işlevi veya p-değer tablosu araması kullanmıyorum ama aslında bir formüle dayalı olarak hesaplıyoruz, çünkü ne yaptığımı bilmek istiyorum)
  2. Örnek boyutuma göre bir önem eşiğine nasıl karar verebilirim? (bir formül iyi olurdu)

3
Neden test edilmeli? Chebyshev Eşitsizliği, herhangi bir gerçek popülasyonda, en büyük değerin ortalamanın üzerinde SD olması matematiksel olarak imkansız olduğunu, ancak gözlemlediğiniz şeyin bu olduğunu gösterir ( ). Bu nedenle nüfusunuzdan gelmedi, dönem. 1060.35=106x10-7+0.250.35
whuber

1
@grokkaine - Bu soru ilginç sorunlar doğuruyor ve değerli görünüyor, ancak terimlerinizle çok hassas olmaya özen göstererek, biraz düzenlediyseniz daha da değerli buluyorum.
rolando2

Bu sadece bir test değil, yüzlerce test. Bir parametre alanı var ve her nokta için bir önem testi yapmak gerekir. Her parametre kombinasyonu için hem değer hem de arka plan listesi (nüfus) oluşturulur. Sonra bunu p-değeri ile sipariş ediyorum ve ilginç parametre kombinasyonları buluyorum. Aslında, bu p-val'in yüksek olduğu (parametre anlamlı olmayan) parametre kombinasyonlarının bulunması da önemlidir. Yazımı biraz sonra düzenlemeye çalışacağım.
grokkaine

Yanıtlar:


10

İlginç bir soru soruyorsun. İlk önce, 0.35, ortalama 0.25 ve standart sapma 1/10 ^ 7 (e ^ -7 bitinizi bu şekilde yorumluyorum) gözleminiz varsa, gerçekten herhangi bir hipoteze girmeniz gerekmez test egzersizi. 0.35 gözleminiz, ortalamadan birkaç bin standart sapma olacağı ve muhtemelen ortalamadan birkaç milyon standart hata olacağı göz önüne alındığında, 0.25 ortalamasından çok farklıdır.

Z-testi ve t-testi arasındaki fark esas olarak örneklem büyüklüğünü ifade eder. 120'den küçük örneklerde p değerlerini hesaplamak için t testini kullanmalısınız. Örnek boyutları bundan büyük olduğunda, hangisini kullanırsanız çok fazla bir fark yaratmaz. Numune boyutundan bağımsız olarak her iki şekilde hesaplamak ve iki test arasında ne kadar az fark olduğunu gözlemlemek eğlencelidir.

Şeyleri kendiniz hesapladığınız kadarıyla, gözleminiz ile ortalama arasındaki farkı bölerek t statüsünü hesaplayabilir ve bunu standart hataya bölebilirsiniz. Standart hata, standart sapmanın örneklem büyüklüğünün kare köküne bölünmesidir. Şimdi, t statünüz var. Bir p değerini hesaplamak için, t değerinizi test tablosunda aramaktan başka bir alternatif olmadığını düşünüyorum. Basit bir Excel alternatif TDIST (t stat değeri, DF, 1 veya 2 kuyruk p değeri için 1 veya 2) kabul ederseniz hile yapar. Z değerini kullanarak ap değerini hesaplamak için, 1 kuyruk testi için Excel formülü şöyledir: (1 - NORMSDAĞ (Z değeri). Z değeri t statüyle aynıdır (veya ortalamadan uzak standart hata sayısı).

Bir uyarı gibi, bu hipotez testi yöntemleri örneklem büyüklüğüne göre bozulabilir. Diğer bir deyişle, örneklem boyutunuz ne kadar büyük olursa standart hatanız o kadar küçük olur, sonuçta elde ettiğiniz Z değeri veya t statünüz ne kadar yüksek olursa, p değeri o kadar düşük olur ve istatistiksel öneminiz o kadar yüksek olur. Bu mantıkta bir kısayol olarak, büyük numune boyutları yüksek istatistiksel anlamlılığa neden olacaktır. Ancak, büyük örneklem büyüklüğü ile ilişkili yüksek istatistiksel anlamlılık tamamen önemsiz olabilir. Başka bir deyişle, istatistiksel olarak anlamlı bir matematik ifadesidir. Her zaman anlamlı olması gerekmez (Webster sözlüğü başına).

Bu büyük örnek büyüklüğü tuzağından kurtulmak için istatistikçiler Efekt Boyutu yöntemlerine geçtiler. İkincisi, iki hata arasında Standart Hata yerine Standart Sapma arasındaki istatistiksel mesafe birimi olarak kullanılır. Böyle bir çerçeve ile örneklem büyüklüğünün istatistiksel öneminiz üzerinde hiçbir etkisi olmayacaktır. Efekt Boyutu'nu kullanmak da sizi p değerlerinden uzaklaştıracak ve düz İngilizce'de daha anlamlı olabilecek Güven Aralıklarına doğru hareket ettirecektir.


Cevabınız için teşekkürler, örnek olarak neyin göz önüne alınacağı konusunda biraz kafam karıştı: Ya bir örnek (gözlem) ve nüfus olarak arka plan listesi var VEYA örneğim arka plan listesidir ve bunu karşılaştırıyorum sıfır hipotezine göre tüm (örneklenmemiş) popülasyon aynı ortalamaya sahip olmalıdır. Bu karar verildikten sonra, test sanırım farklı yönlere gidiyor.
grokkaine

Sahip olduğunuz tüm gözlemleri örnek olarak kullanın (ne derseniz deyin). Ve, bir gözleminiz ve tanımlanmış olan numunenin ortalaması arasındaki istatistiksel mesafeyi hesaplayın. Numunenizin standart sapmasını ve standart hatasını hesaplayın. Ve gözleminizin ortalamadan istatistiksel uzaklığı: (Gözlem - Ortalama) / Standart hata = t stat. Excel TDIST işlevini (DF, t stat, 1 (bir kuyruk için)) kullanın ve p değerinizi alın.
Sympa

5

Hipotez testi her zaman popülasyonu ifade eder. Örnek hakkında bir açıklama yapmak istiyorsanız, test etmeniz gerekmez (sadece gördüklerinizi karşılaştırın). Sık sık asimptotiklere inanırsınız, örneklem büyüklüğünüz büyük olduğu sürece verilerinizin dağılımı konusunda endişelenmeyin. Z-testi ve T-testi temel olarak test istatistiğini hesaplama açısından aynı şeyi yapar, sadece kritik değerler farklı dağılımlardan elde edilir (Normal ve Student-T). Örnek büyüklüğünüz büyükse, fark marjinaldir.

S1 ile ilgili olarak: n-1 serbestlik dereceli T-dağılımından bakın, burada n örneklem büyüklüğüdür.

S2 ile ilgili olarak: Bir Z testi için eşik değerini istediğiniz önem düzeyine ve T Testi durumunda örnek boyutu üzerindeki önem düzeyine göre hesaplarsınız.

Ama cidden, bazı temelleri gözden geçirmelisiniz.


Cevap için teşekkürler. Aslında kullandığım t-dist'ti, ama "neden" kullandığımı da anlamak istedim. "Büyük" bir örneği nasıl tanımlarsınız ve p-değeri nasıl farklıdır. Daha da önemlisi, bir dağılımın normal veya öğrenci-t olduğunu nasıl anlarız? Bunun için istatistiksel bir test var mı? Belki ikinci ve hmm için kolmogorov-smirnov testini kullanın .. ilk için ne kullanılır?
grokkaine

2
büyük ... kuyu Z ve t n = 60 ile başlayan yakınsak. Her iki testten elde ettiğiniz p değerlerini karşılaştırmanız yeterlidir. T / Normal dağılım varsayımı, temeldeki verilerin dağılımına bağlı değildir. Ortalamanın örnekleme dağılımının normal olduğu varsayımına dayanmaktadır. Test ettiğiniz değişken Gamma dağıtılmış olsa bile, bu hala geçerlidir. N = 200 ya da öylesine ile iyi çalışması gerekir. Yine, tüm bunlar sıkça yapılan istatistiklere dayanmaktadır.
joint_p

Hipotez testi için +1 her zaman popülasyona atıfta bulunurken -1, sorgulayıcının 1 örneğine sahip olduğu noktasını kaçırdığı için -1
Peter Ellis

1
"Ben bir hesaplanan değeri ve rastgele oluşturulan değerlerin bir arka plan kümesi var. Hesaplanan değeri 0.35 olduğunu" gerçekten emin değildi ... Bu bir şekilde 1'den fazla gözlem olduğunu ima düşündüm.
joint_p

diğer paragraflardan yorumlarımı yeniden gönderme: Ben bir örnek olarak dikkate almak ne biraz karışık: Ya bir örnek (gözlem) ve nüfus olarak arka plan listesi var VEYA benim örnek arka plan listesi ve Bunu, sıfır hipotezine göre aynı ortalamaya sahip olması gereken tüm (örneklenmemiş) popülasyonla karşılaştırıyorum. Bu karar verildikten sonra, test sanırım farklı yönlere gidiyor.
grokkaine
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.