Eşitsiz örnek boyutları: Ne zaman çağrılır


14

Akademik bir dergi makalesini gözden geçiriyorum ve yazarlar, herhangi bir çıkarımsal istatistik raporlamamanın gerekçesi olarak aşağıdakileri yazdı (İki grubun doğasını tanımladım):

Toplamda 2.349 katılımcıdan 25'i (% 1.1) X bildirmiştir . Biz uygun istatistiksel grup karşılaştırmak analizler sunarak kaçınmaya X grubu Y'ye bu sonuçların ağır bu nadir bir sonuç ile tesadüfen tahrik edilebilir beri (diğer 2324 katılımcı).

Sorum şu: Bu çalışmanın yazarları karşılaştırma gruplarına göre havlu atmada haklı mı? Değilse, onlara ne önerebilirim?

Yanıtlar:


20

İstatistiksel testler örneklem büyüklüğü hakkında varsayımlarda bulunmaz. Elbette, çeşitli testlerle (örn. Normallik) farklı varsayımlar vardır, ancak örnek boyutlarının eşitliği bunlardan biri değildir. Kullanılan test başka bir şekilde uygunsuz olmadığı sürece (şu anda bir sorun düşünemiyorum), tip I hata oranı büyük ölçüde eşit olmayan grup boyutlarından etkilenmeyecektir. Dahası, onların cümleleri (aklıma) inanacaklarını ima eder. Böylece, bu konular hakkında kafaları karışır.

Öte yandan, tip II hata oranları çok olacak son derece eşitsiz etkilenebilir s. Test ne olursa olsun bu doğru olacaktır (örneğin, testi, Mann-Whitney - testi veya oranların eşitliği için testi hepsi bu şekilde etkilenecektir). Bunun bir örneği için, buradaki cevabım bölümüne bakın: Farklı örnek boyutlarından ortalamaların karşılaştırılması nasıl yorumlanmalıdır? Bu nedenle, bu konuda "havluya atmada haklı" olabilirler . (Özellikle, etkinin gerçek olup olmadığı konusunda anlamlı olmayan bir sonuç almayı düşünüyorsanız, testin amacı nedir?) t U zntUz

Örnek boyutları birbirinden uzaklaştıkça, istatistiksel güç yakınlaşacaktır . Bu gerçek aslında birkaç insanın hiç duymadığından ve muhtemelen gözden geçirenleri almakta zorlanacağından şüphelenilen farklı bir öneriye yol açıyor (amaçlanan bir suç yok): uzlaşma gücü analizi . Fikir nispeten basittir: Herhangi bir güç analizinde, , , , ve etki büyüklüğü , birbirleriyle ilişkili olarak bulunur. Biri hariç hepsini belirledikten sonra, sonunu çözebilirsiniz. Tipik olarak, insanlar bir adlandırılan yapmak a-priori güç analizi için çözmek ettiği,α β n 1 n 2 d N n 1 = n 2 n 1 n 2 d α β α = .05 β = .20 αααβn1n2dN(genellikle ). Öte yandan, sen çözebilirsiniz , ve ve de çözen (eşit biçimde veya belirttiğiniz takdirde) oranı tip I Birlikte yaşamaya istekli olduklarını II hata oranlarını yazın. Geleneksel olarak, ve , yani tip I hatalarının tip I hatalardan dört kat daha kötü olduğunu söylüyorsunuz. Tabii ki, belirli bir araştırmacı ne için çözebilir, yani katılmıyor olabilir, ancak belirli bir oranını belirlediktenn1=n2n1n2dαβα=.05β=.20αyeterli gücü sağlamak için kullanmanız gerekir. Bu yaklaşım, bu durumdaki araştırmacılar için mantıksal olarak geçerli bir seçenektir, ancak bu yaklaşımın egzotikliğinin, daha önce hiç böyle bir şey duymamış büyük araştırma topluluğunda zor bir satış yapabileceğini kabul ediyorum.


Bu inanılmaz faydalı. Ayrıca , farklı örnek boyutlarındaki araçların karşılaştırmasını nasıl yorumlamalıyım? bu konuyu kendi anlayışımla faydalıdır. Cevabınızı okuduktan sonra, yazarlara uzlaşma gücü analizi yapma olasılığını gündeme getireceğim (alışıldıklarından emin olmadıkları güvenli bir bahis gibi görünüyor) ve belki de güçleriyle ilgili endişelerle ilgili yorumlarında daha spesifik olmayı öneriyorum.
Aaron Duke

2
Bir şey değil, @AaronD. Benim düşünceme göre, onları yanıltıcı olduğu veya konuyu yanlış anladıklarını ima ettikleri için ifadelerini minimumda değiştirmelerini kesinlikle teşvik etmelisiniz. Uzlaşma gücü analizine kalkışmayacaklarını tahmin ediyorum, ama aynı zamanda sadece tanımlayıcı istatistikler (araçlar ve SD'ler) ve uygun güven aralıkları ile bir etki boyutu da bildirebilirler.
gung - Monica'yı eski

6

@Gung'un cevabı mükemmel olsa da, çılgınca farklı grup boyutlarına bakarken dikkate alınması gereken önemli bir sorun olduğunu düşünüyorum. Genel olarak, testin tüm gereklilikleri yerine getirildiği sürece grup boyutlarındaki fark önemli değildir.

Bununla birlikte, bazı durumlarda, farklı grup büyüklüğünün, bu varsayımlara karşı ihlallere karşı testin sağlamlığı üzerinde dramatik bir etkisi olacaktır. Örneğin klasik iki örnekli eşleştirilmemiş t-testi, varyans homojenliğini varsayar ve her iki grup da benzer şekilde boyutlandırıldığında (büyüklük sırasına göre) ihlallere karşı dayanıklıdır. Aksi takdirde, daha küçük gruptaki daha yüksek sapma Tip I hatalarına neden olacaktır. Şimdi t-testi ile bu pek sorun değil çünkü Welch t-testi yaygın olarak kullanılmaktadır ve varyans homojenliği varsaymamaktadır. Bununla birlikte, lineer modellerde benzer etkiler ortaya çıkabilir.

Özetle, bunun hiçbir şekilde istatistiksel analize engel teşkil etmediğini söyleyebilirim, ancak nasıl devam edileceğine karar verirken akılda tutulmalıdır.


8
Buradaki konunun özünün testlerin uygulanabilirliği değil, anlamlılıkları ve yorumlanabilirlikleri olduğuna inanıyorum. Soru "yanıtlayanlar" ile ilgilidir. Bu, sıfır olmayan bir yanıt vermeme olasılığını güçlü bir şekilde düşündürmektedir. Çalışma büyüklüğüne göre küçük bir cevapsızlık oranı (yüzde birin küçük bir kısmı) bile küçük alt gruba göre muazzam bir cevapsızlık oranına eşit olacaktır. Bu, bu kadar küçük olan herhangi bir alt grubun temsil edilebilirliğini sorgulamaktadır. Sonuç olarak, herhangi bir istatistiksel analiz için büyük bir engel.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.