Hangi tanımlayıcı istatistikler etki boyutları değildir?


12

Wikipedia diyor

etki büyüklüğü, bir fenomenin gücünün bir ölçüsüdür veya o miktarın örnek tabanlı bir tahminidir. Verilerden hesaplanan etki büyüklüğü, verilerdeki görünür ilişkinin popülasyondaki gerçek bir ilişkiyi yansıtıp yansıtmadığına dair herhangi bir açıklama yapmadan bir ilişkinin tahmini büyüklüğünü taşıyan tanımlayıcı bir istatistiktir.

Daha iyi anlamak için, grafikler ve grafikler hariç, hangi tanımlayıcı istatistiklerin etki boyutu olmadığını merak ediyordum.


Grafik ve grafikler, bir efektin büyüklüğünü, etki büyüklüğü ölçülerinden daha sezgisel yollarla ölçmek için harika olabilir. Aslında takdirde bakınız (kabaca küçük tekabül olacak bazı önlemler hakkında iki grup arasındaki örtüşmeyi d ), bu önemli bir fark bir grubun o üyesi tüm diğer grubun üyeleri daha düşük skorlar anlamına gelmez fark belki daha kolay vs
Gala

Yanıtlar:


18

Efekt boyutları

  • Ortak standartlaştırılmış etki boyutları tipik olarak bir ilişkinin veya etkinin miktarını veya derecesini belirler. En yaygın etki büyüklüğü ölçümleri muhtemelen cohen's d, Pearson r ve olasılık oranıdır (özellikle ikili bir tahmin için).
  • Daha az yaygın etki büyüklüğü ölçümleri:Bununla birlikte, standartlaştırılmış ve standartlaştırılmamış etki büyüklüğü ölçümlerine sahip olabilirsiniz. İlişkilerin derecesini ileten ve özellikle örneklem büyüklüğü ile kontamine olmayan herhangi bir istatistik muhtemelen bir etki büyüklüğü ölçüsüdür. Böylece, Beta katsayıları, R-kare, kovaryans, gruplar arasındaki ham ortalama farkları vb. Tüm etki derecesini yakalar. Bununla birlikte, bazı araştırmacıların etki büyüklüğü ölçülerini biraz körü körüne uyguladıklarını ve daha geniş amacın okuyuculara etki derecesi hissi vermek olduğunu unutuyorum. Dolayısıyla, ortalama farklar veya ham regresyon katsayıları gibi ölçümlerin bir anlamda bir etki büyüklüğü ölçüsü olduğunu fark etmezler. Efekt boyutlarının kör kullanımına başka bir örnek, sezgisel bir yorumu olmayan, ancak bazı ders kitapları tarafından tavsiye edilen efekt boyutu ölçümlerinin kullanımını içerir.

Etki boyutları değil:

  • Çoğu test istatistikleri etkisi boyutları değildir. Örnek: Ki-kare testi, t-testi, z-testi, F-testi. Hem popülasyon etkisinin büyüklüğü arttıkça hem de örnek büyüklüğü arttıkça büyürler. Pek çok açıdan, son yıllarda etki boyutlarının tüm dili vurgulanmıştır çünkü araştırmacılar, test istatistiklerinin etki boyutlarının ne kadar büyük olduğundan ziyade test istatistiklerinin ne kadar büyük olduğuna çok fazla odaklanmıştır. Bu, özellikle küçük etkilerin bile istatistiksel olarak anlamlı olabileceği durumlarda büyük bir örneklem büyüklüğünüz olduğunda önemlidir.
  • Çoğu tek değişkenli istatistik etkisi boyutları değildir. Çoğu amaç için, etki büyüklüğü en az iki değişken arasındaki ilişkiyle ilgilidir. Bu nedenle, numune ortalaması, standart sapma, çarpıklık, basıklık, min, maks, vb. Etki büyüklüğü ölçümleri değildir.
  • İlişki derecesine ait olmayan istatistikler etki büyüklüğü ölçütleri değildir. Örneğin, çok değişkenli normallik testleri, bir matrisin özdeğerleri, vb. Genellikle kelimenin tam anlamıyla bir etkiyi ölçmeyi amaçlamamaktadır.

Daha geniş hususlar

  • Ölçeklendirme hususları: Bir istatistiğin bir etki büyüklüğü ölçüsü olarak kullanılması, büyük ölçüde bir etkinin boyutunu iletme yeteneği ile ilgilidir. Bazen bu, bilinen standartlaştırılmış etki ölçümleri kullanılarak elde edilir (örneğin, cohen's d). Diğer zamanlarda, değişkenlerin ölçeklendirilmesinin dikkatle değerlendirilmesi, etkinin boyutunun daha da net bir yorumunu verebilir. Örneğin, gelir düzeylerine ilişkin bir eğitim programına bakan bir çalışmam olduğunu varsayalım. Eğitim programının geliri .2 standart sapma ile artırdığını veya programın geliri 3.500 ABD Doları artırdığını söyleyebilirim. Her ikisi de faydalıdır; her ikisi de etki boyutu ölçümleridir. Birincisi standartlaştırılmıştır (cohen's d), ikincisi standartlaştırılmamıştır (ham grup ortalama farklılıkları).
  • Etki büyüklüklerinin tahmin edilmesinde hassasiyet: Etki büyüklüğü ölçülerinin (örn., Cohen's d, pearson's r, vb.) Örnek tahminlerini sık sık çıkarıyoruz. Bu bağlam, önem testinin etki boyutu ölçümleriyle karşılaştırılmasına yol açabilir. Bununla birlikte, amaç yine de nüfus etkisi büyüklüğünü kesin ve tarafsız bir şekilde tahmin etmek olmalıdır. Sık görülen bir perspektiften bakıldığında, etki boyutları etrafındaki güven aralıkları bir kesinlik tahmini sağlar. Bayes perspektifinden bakıldığında, etki büyüklükleri üzerinde arka yoğunluklar vardır. Çoğu durumda, tarafsız bir etki boyutu ölçüsü kullandığınızdan emin olmak için dikkat edilmelidir.

1
(+1) Güzel cevap.
chl

Üçüncü ve son noktalar muhtemelen Wikipedia makalesinin yazarlarının nereden geldiğini açıklamaktadır. Psikolojiye verilen önem göz önüne alındığında, etkinin etki büyüklüğünü diğer tanımlayıcı istatistiklerle değil, test istatistikleri ve p-değerleri (yani çıkarımsal istatistikler) ile karşılaştırmak ve etki büyüklüğü ölçümlerinin örnekleme değişkenliği hakkında hiçbir şey söylemediğini vurgulamak gerektiğini düşünüyorum.
Gala

Güzel cevabınız için çok teşekkürler. Yine de bir sorum var: güven aralığı bir etki büyüklüğü ölçüsü olarak kullanılamaz, çünkü doğrudan örneklem büyüklüğü ile ilgili mi demek istiyorsunuz? (güven aralığı ile, bir CI'nın üst ve alt sınırlarına değil, yaygınlık, ortalama vb.
Vic

2
@Vic, bir efekt boyutu ölçüsü üzerinde bir güven aralığına sahip olabilirsiniz, ancak güven aralığının kendisi etki boyutu değildir.
Jeromy Anglim

Çok teşekkürler sevgili Jeromy. Tüm bu yıllar boyunca yanılmışım. :)
Vic

6

İlk olarak, etki boyutları açıklayıcı olduğu kadar açıklayıcı olarak da kullanılabilir. r ve OR'lerin hepsi efekt boyutlarındadır ve kesinlikle çıkarımsal istatistiklerde kullanılır.

Tek değişkenli istatistikler genellikle etkili olmalarına rağmen etki boyutları değildir. Örneğin, evli erkek ve kadınların yaşlarını karşılaştırıyorsanız, erkeklerin ortalama yaşı bir etki büyüklüğü değildir (araçların farkı bir etki büyüklüğü olacaktır). Ancak, bir şeyin ortalamasının 0 olup olmadığını görmek istiyorsanız, ortalama bir etki boyutu olacaktır.

Bir etkiyi ölçüyorsa, bir etki büyüklüğü!


Sanırım bu gerçek @Peter, ancak etki boyutu Cohen tarafından daha dar bir şekilde tanımlanmış bir terimdir: (Ortalama1-Ortalama2) / PooledSD. Bu, biraz önemli gibi ya da sadece istatistiksel olarak önemli olan bir fark gibi görünüyor - istatistiksel bir terimi tanımlamak için ortak kelimelerin kullanılması.
doug.numbers

2
Cohen onu bu şekilde nerede tanımlıyor? Güç Analizi kitabını kastediyorsanız, sanırım bunu diğer efekt boyutlarını dönüştürmek için bir çeşit standart olarak kullanıyor. Ama bu kitaptaki her güç analizi tablosu (ve bir LOT var) bazı etki büyüklüğü kullanıyor (ve hepsi bunu kullanmıyor)
Peter Flom - Monica'yı eski durumuna getirin

1
Cohen'in d'si her zaman anladığım gibi. Açıklandığı gibi en.wikipedia.org/wiki/Effect_size . Ama kesinlikle haklısın, etki büyüklüğü olarak tanımlanan birçok yöntem var.
doug.numbers

4
T testi ve z testi efekt boyutları değildir. aynı etki büyüklüğü, farklı numune boyutları için büyük ölçüde farklı t ve z değerleri verecektir.
Jeromy Anglim

1
@JeromyAnglim haklı; +1. Cevabımı düzenlenebilir
eski durumuna Monica - Peter FLOM
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.