SD ortalamadan büyük, negatif olmayan ölçek


9

Laboratuvarımın çalıştırmak istediği çalışmalara çok benzer bir çalışmayı bildiren bir makale verildi. Ancak, ilgi değişkeni olan Süre için, SD'lerin ortalamadan daha büyük olduğunu fark ettim ... çünkü bu dakika cinsinden ölçülen süre asla negatif olamaz ve bu benim için çok garip görünüyor. Bu durumun bildirildiği 2 çalışmada gerçekleşti.

Bunun ötesinde, bu karışık bir tasarım. Kontrol v Tedavi (gruplar arasında) ve Zaman1, Zaman2, Zaman3 (tekrarlanan önlemler). İşte araçlar (SD), N> 200

                       Time1                Time2                  Time3 
Control               15.1 (14.6)          14.4 (14.8)            13.3 (15.7)
Treatment             14.8 (13.2)          10.0 (12.2)            8.2 (9.9)

... bir ANOVA işlettiler ve p <.001 bildirdiler.

Bunu çalışmamız için örneklem büyüklüğünü belirlemek amacıyla bir güç analizinin temeli olarak kullanmam istendi. Bu, verilerin normal olmadığını veya aykırı değerleri gösterdiğine eminim ve buna bağlı olarak örnek boyutunu belirlemede rahat hissetmiyorum. Ben sadece üssün dışında mıyım?


Bunların SD olduğundan ve 3 * SD'ye benzeyen% 95 güven aralığı olmadığından emin misiniz? Bu SD'nin ortalamalarla aynı boyutta olduğu anlaşılıyor. Bu hatalara hangi etkilerin dahil edildiğini ve hatta istatistiğin ne olduğunu bilmediğimiz için örneklem büyüklüğünün ne olduğunu söylemek gerçekten zor. Sadece istatistik sayıyor olsaydı, yani Poisson dağılımı, SD üzerindeki ortalamanın 1 / Sqrt (N) gibi olması gerekirdi. Ancak bu N = 1 (veya en fazla birkaç tane) anlamına gelir. Bu istatistiklerin ne olduğu hakkında bize daha fazla bilgi verebilir misiniz?
Dave31415

Ayrıca, normal dağılımın birbirinden tamamen bağımsız bir ortalama ve SD değeri vardır. Sanırım Poisson dağılımı demek istedin.
Dave31415

2
Negatif olmayan sürelerle, genellikle çarpık bir dağılım beklerdim. Ortalama ile karşılaştırılabilir SD'ler mükemmel bir şekilde mümkündür ve hiçbir şekilde şaşırtıcı değildir. Diğer hesaplamalar için hangi dağılımın daha fazla varsayıldığı daha fazla bilgi olmadan tavsiye edilemez, ancak ilk tahminim olarak Poisson'u değil, gama veya lognormal'i seçerdim.
Nick Cox

@NickCox'un belirttiği gibi, SD ortalamadan daha büyük olmasaydı (sansür olmazsa) w / süreleri şaşırırdım. Weibull dağılımını da düşünebilirsiniz. Güç analizi muhtemelen simülasyon tabanlı olmalıdır. Farklı bir not, bir ANOVA böyle w / veri geçersiz olduğunu tahmin ediyorum.
gung - Monica'yı eski haline getirin

1
negatif olmayan sayılardan oluşan bir veri kümesi için , varyasyon katsayısı - standart sapmanın ortalamaya oranı - kadar büyük değerler alabilir.nO(n) tüm sayılar olduğunda aşırı değerde meydana gelen maksimum değerle 0biri hariç ( ayrıntılar için bu soruya bakın). Bu nedenle, ortalamayı aşan standart sapma, çok fazla açıklama gerektiren istisnai bir durum olarak görülmemelidir.
Dilip Sarwate

Yanıtlar:


5

Negatif olmayan veya kesinlikle pozitif verilerle standart sapmanın ortalamayı aşması kolayca mümkündür

Verilerinizin durumunu standart sapmanın ortalamaya yakın olarak tanımlarım (her değer daha büyük ve daha büyük olanlar genellikle yakındır). Negatif olmayan veriler için, verilerin eğri olduğunu açıkça göstermektedir (örneğin, varyasyon katsayısı = 1 olan gama dağılımı üstel dağılım olacaktır, bu nedenle veriler gama olsaydı üstel bir yere bakarlardı)

Bununla birlikte, bu tür bir örneklem büyüklüğü ile ANOVA bundan çok fazla etkilenmeyebilir; toplanan varyans tahminindeki belirsizlik oldukça küçük olacaktır, bu yüzden CLT (araçlar için) ve Slutsky teoremi (paydadaki varyans tahmini için) arasında bir ANOVA'nın muhtemelen oldukça iyi çalışacağını düşünebiliriz. büyük payda serbestlik derecelerine sahip ANOVA-F'nin iyi bir yaklaşım olacağı asimtotik bir ki-kare olacaktır. (yani makul düzeyde sağlamlığa sahip olmalı ve araçlar sabit olmaktan çok uzak olmadığından, güç, heteroskedastisite tarafından çok fazla etkilenmemelidir)

Bununla birlikte, çalışmanızın daha küçük bir örneklem büyüklüğüne sahip olması durumunda, farklı bir test (belki bir permütasyon testi veya belki bir GLM'yi temel alan çarpık veriler için daha uygun) kullanmaktan daha iyi olabilirsiniz. Testteki değişiklik, düz bir ANOVA için alacağınızdan biraz daha büyük bir örnek boyutu gerektirebilir.

Orijinal verilerle, uygun bir model / analiz altında bir güç analizi yapabilirsiniz. Orijinal verilerin yokluğunda bile, dağıtım (belki de çeşitli) hakkında daha makul varsayımlar yapabilir ve tüm güç eğrisini (veya daha basit olarak sadece tip I hata oranını ve etki boyutundaki gücü) araştırabilir ilgi duyuyor). Makul koşullar altında hangi gücün elde edilebileceği ve örneklem büyüklüğünün ne kadar daha büyük olması gerektiği konusunda fikir veren çeşitli makul varsayımlar kullanılabilir.


4

Verilerin normal olmadığı sonucuna varmış olursunuz. Veriler normal olsaydı, gözlemlerin yaklaşık% 16'sının ortalama eksi standart sapmadan daha az olmasını beklerdik. Ortalamadan büyük bir SD ile bu sayı negatiftir ve negatif sayıların olamayacağını belirtirsiniz, bu nedenle gördüğünüz şey normal olarak dağıtılan verilerle tutarlı değildir. SD değerleri mümkündür, ancak dağıtım çok doğru eğikse (sürelerde yaygındır).

Verilerin normal olacağı varsayımına dayalı bir örnek boyutu seçmenin iyi bir fikir olmadığını kabul ediyorum, ancak süreç hakkında daha fazla bilgi edinebilir ve makul bir varsayım olan doğru bir çarpık dağılım (bir olasılık olarak bir gama dağılımı) bulabilirseniz, örnek boyutunu belirlemenize yardımcı olması için bunu kullanabilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.