Grup farkı olmayan hipotezler nasıl test edilir?


39

Nümerik bir bağımlı değişkene bakarak (örneğin, istihbarat testi puanları) iki grup (örneğin, erkekler ve kadınlar) ile bir çalışma yaptığınızı ve grup farklılıkları olmadığı hipotezine sahip olduğunuzu hayal edin.

Soru:

  • Grup farklılığı olup olmadığını test etmenin iyi bir yolu nedir?
  • Grup farkı bulunmaması için uygun bir şekilde test etmek için gereken örneklem büyüklüğünü nasıl belirlersiniz?

İlk Düşünceler:

  • Standart bir t testi yapmak yeterli olmaz, çünkü boş hipotezi reddetmek, ilgili parametrenin sıfıra eşit veya yakın olduğu anlamına gelmez; bu özellikle küçük örneklemelerde geçerlidir.
  • % 95 güven aralığına bakabilir ve tüm değerlerin yeterince küçük bir aralıkta olduğunu kontrol edebilirim; belki artı veya eksi 0.3 standart sapmalar.

"Bu boş hipotezi doğru olarak kabul eder" derken ne demek istiyorsun?
Robin Girard

Yanlış beyan etme olasılığını kontrol edebilmek istiyorsanız "bir fark var" ifadesini iki hipotezi ayırmanız gerekir (bu alıntıyı çoktan bahsetmiştim mi? )
Robin Girard

@ Boş hipotez anlamlılık testinin p değerini, boş hipotezin doğru olduğunu varsayarak gözlemlenenden daha fazla veya aşırı veri görme olasılığıdır; ama belki yukarıdaki ifadeyi daha iyi söyleyebilirim.
Jeromy Anglim

@Robin Puanımı daha net hale getirmek için soruyu değiştirdim
Jeromy Anglim

Yanıtlar:


20

Bence denklik testi hakkında soru soruyorsun . Esasen, iki grubun etkili bir şekilde eşdeğer olduğu sonucuna varmanız için ne kadar büyük bir farkın kabul edilebileceğine karar vermeniz gerekir. Bu karar% 95 (veya diğer) güven aralığı limitlerini tanımlar ve bu temelde örneklem büyüklüğü hesaplamaları yapılır.

Konuyla ilgili bir kitap var.

Eşdeğerlik testlerinin çok yaygın bir klinik "eşdeğeri" düşük kaliteli olmayan bir test / denemedir . Bu durumda, bir grubu diğerine (yerleşik bir tedavi) göre "tercih edersiniz" ve testinizi, yeni tedavinin belirli bir istatistiksel kanıt düzeyindeki yerleşik tedaviye göre daha düşük olmadığını gösterecek şekilde tasarlarsınız.

GraphPad.com sitesi için Harvey Motulsky'i kredi kullanmam gerektiğini düşünüyorum ( "Kütüphane" altında ).


16

Bunların çoğu, benim bildiğim kadarıyla en iyi eski frekansçı geleneğe yönlendirilmiş olan bir çeşit denklik testinin daha önce belirtilen ihtimalinin yanı sıra, boş hipotezler, yani bayesian testleri lehine .

Bayes t-testinin bir uygulaması burada bulunabilir: Wetzels, R., Raaijmakers, JGW, Jakab, E., & Wagenmakers, E.-J. (2009). Boş hipoteze karşı ve karşı destek nasıl ölçülür: Varsayılan bir Bayesian t-testinin esnek bir WinBUGS uygulaması. Psychonomic Bülten ve İnceleme, 16, 752-760.

Tüm bunların R'de nasıl yapılacağı hakkında bir ders de var:

http://www.ruudwetzels.com/index.php?src=SDtest


Bayrus t-testine alternatif (belki de daha modern bir yaklaşım) bu yazıda Kruschke tarafından (kodla birlikte) verilmiştir:

Kruschke, JK (2013). Bayesian tahmini, t testinin yerine geçer . Deneysel Psikoloji Dergisi: Genel , 142 (2), 573-603. doi: 10,1037 / a0029146


Bu cevabın bütün destekleri (Kruschke eklenmeden önce) meslektaşım David Kellen'e gitmeli. Bu sorunun cevabını çaldım .


Birisinin Bayesian yaklaşımı sağlayıp sağlamadığını merak ediyordum. Mükemmel. Teşekkürler.
Jeromy Anglim

1
Bu R. için müthiş BayesFactor paketine bir başvuru eklemek için bu cevabı güncellenmesi değebilir
crsh


8

Sizin için yararlı olabilecek birkaç bildiri var:

Tryon, WW (2001). İstatistiksel farklılık, denklik ve belirsizliğin çıkarımsal güven aralıkları kullanarak değerlendirilmesi: Boş hipotez istatistiksel testleri yürütmek için bütünleşik bir alternatif yöntem. Psikolojik Yöntemler, 6, 371-386. ( ÜCRETSİZ PDF )

Ve bir düzeltme:
Tryon, WW ve Lewis, C. (2008). Tryon'un (2001) Azaltma Faktörünü Düzelten İstatistiksel Eşdeğerliği Sağlamada Çıkarımsal Bir Güven Aralığı Yöntemi. Psikolojik Yöntemler, 13, 272-278. ( ÜCRETSİZ PDF )

Ayrıca:

Denizci, MA ve Serlin, RC (1998). İki grup karşılaştırmada E kalifikasyon güven aralığı . Psikolojik Yöntemler, Cilt 3 (4), 403-411.


Bu konuda tonlarca makale ve hatta kitap var.
Michael Chernick

7

Geçenlerde, iki dağıtım arasındaki araçların arasındaki mesafeye dayanarak alternatif bir "denklik testi" yöntemi düşündüm .

İki Gauss dağılımının örtüşmesi için güven aralıkları sağlayan bazı yöntemler vardır :görüntü tanımını buraya girin

O(P1,P2)P1P2

1O(P1,P2)=TV(P1,P2)
P 1 P 2TV(P1,P2)=supA|P1(A)P2(A)|P1 ve .P2

Yani, örneğin, eğer, araçlar daha sonra verilen olasılıklar ve herhangi bir olay daha fazla farklılık yoktur . Kabaca konuşursak, iki dağıtım kadar aynı öngörüleri yapar .P 1 P 2 0,1 % 10O(P1,P2)>0.9P1P20.110%

Bu nedenle, klasik muadili testinde olduğu gibi, ve ortalamaları arasındaki fark için kritik bir değere dayalı bir kabul kriteri kullanmak yerine, bunu tarafından verilen tahminlerin olasılıkları arasındaki fark için kritik bir değere dayanabiliriz . iki dağıtım.μ 2μ1μ2

Bence kriterin “tarafsızlığı” açısından bir avantaj var. in kritik değeri gerçek problemin bir uzmanı tarafından verilmelidir: bu farkın pratik önemi olan ötesinde bir değer olmalıdır. Ancak bazen hiç kimse gerçek sorun hakkında sağlam bir bilgiye sahip değildir ve kritik bir değer sağlayabilecek bir uzman yoktur. hakkında geleneksel bir kritik değerin benimsenmesi , söz konusu fiziki probleme bağlı olmayan bir kriterin bir yolu olabilir.T V ( P 1 , P 2 )|μ1μ2|TV(P1,P2)

Aynı değişkenlikteki Gaussian durumunda, üst üste binme, standartlaştırılmış ortalama farkı .|μ1μ2|σ


Eğer çakışma gösteren herhangi bir kaynak olma var mı kullanılan bazı gerçek sorunlara? Kulağa inanılmaz umut verici geliyor, ancak bana bunun gerçek bir problemde nasıl uygulanacağı açık değil (sonuçlarınızın potansiyel olarak "bu dağıtım X'e oldukça benzer" den birkaç adım atıldığı ve bunun nasıl olacağını görmek biraz zorlaştı. % 10 TV, çıkarımlar üzerindeki etkinin boyutuna dönüşür).
Stumpy Joe Pete,

1
@StumpyJoePete Blogumda aynı ruhta bir şeyler yazdım: stla.github.io/stlapblog/posts/…
Stéphane Laurent

5

Tıp bilimlerinde, iki tek taraflı testlerin (tost) aksine bir güven aralığı yaklaşımı kullanılması tercih edilir. Ayrıca, olayları netleştirmek için nokta tahminlerini, CI'leri ve önceden belirlenmiş bir denklik marjlarını çizmenizi tavsiye ederim.

Sorunuz muhtemelen böyle bir yaklaşımla ele alınacaktır.

CONSORT, aşağılık / eşdeğeri olmayan çalışmalara ilişkin kurallar bu konuda oldukça faydalıdır.

Bkz Piaggio G Elbourne DR, Altman DG, Pocock SJ, Evans SJ ve CONSORT Grubu. Düşüklük ve denklik randomize çalışmalarının raporlanması: CONSORT ifadesinin bir uzantısı. JAMA. 2006, 8 Mart, 295 (10): 1152-60. (Tam metne bağla.)


1
Mutlaka güven aralıklarının tercih edildiğini söylemem. Aslında güven aralıkları hipotez testlerine karşılık gelir. TOST, prosedürde kullanılan iki tek taraflı t testine karşılık gelen iki taraflı güven aralığının kesişmesiyle elde edilen güven aralıklarına bakarak elde edilebilir.
Michael Chernick

4

Evet. Bu denklik testidir. Temel olarak boş ve alternatif hipotezi tersine çevirir ve araçların farkının denklik penceresinde olduğunu göstermek için örnek boyutunu güce dayandırırsınız. Blackwelder "Boş hipotezi kanıtlamak" olarak nitelendirdi. Bu genel olarak jenerik bir ilacın pazarlanan ilaca eşdeğerliğinin test edildiği veya onaylanan bir ilacın yeni bir formülasyonla (genellikle biyoeşdeğerlik olarak adlandırılır) karşılaştırıldığı farmasötik klinik çalışmalarda yapılır. Tek taraflı versiyona aşağılıklık denir. Bazı ilaçlar, yeni ilacın pazarlanan rakipten daha düşük olmadığını göstererek onaylanabilir. Shao ve Pigeot, çapraz tasarımları kullanarak biyoeşdeğerliğe tutarlı bir önyükleme yaklaşımı geliştirdiler.


0

Önyükleme 2 örnek grupları arasındaki farkları (örneğin araçlar arasındaki fark) ve istatistiksel önemini kontrol edin. Farklı bir bağlamda olsa da, bu yaklaşımın daha ayrıntılı bir açıklaması http://www.automated-trading-system.com/a-different-application-of-the-bootstrap/ adresinde bulunabilir.


1
Hiçbir farkın olmadığı null hipotezini kabul etmenin yanlışlığını kapatıyorsunuz ve iki miktarın eşdeğer olduğuna dair kanıt buluyorsunuz .
Alexis
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.