Kutu arsa çentikleri ve Tukey-Kramer aralığı


10

'R' içindeki kutu grafiğindeki "notch" yardım belgesi ( veya orijinal metin ) aşağıdakileri verir:

İki parselin çentikleri üst üste gelmezse, bu iki medyanın farklı olduğuna dair 'güçlü kanıttır' (Chambers et al, 1983, s. 62). Kullanılan hesaplamalar için boxplot.stats sayfasına bakın.

ve ' boxplot.stats ' aşağıdakileri verir:

Çentikler (istenirse) +/- 1.58 IQR / sqrt (n) 'a kadar uzanır. Bu, McGill ve arkadaşlarında (1978, sayfa 16) verilen Chambers ve arkadaşlarının (1983, s. 62) 1.57 formülü ile aynı hesaplamalara dayanıyor gibi görünmektedir. Karşılaştırılan iki medyan için medyanın asimtotik normallerine ve kabaca eşit numune boyutlarına dayanırlar ve numunelerin altta yatan dağılımlarına oldukça duyarsız oldukları söylenir. Fikir, iki medyan arasındaki fark için kabaca% 95 güven aralığı vermek gibi görünüyor.

Şimdi sütunların ortalamalarını karşılaştırmak için Tukey-Kramer testinin JMP sürümünü kullanmayı daha iyi biliyorum. JMP belgeleri bunu verir:

Ortalamalar arasındaki tüm farklılıklar için boyutlandırılmış bir testi gösterir. Bu Tukey veya Tukey-Kramer HSD (dürüstçe önemli fark) testidir. (Tukey 1953, Kramer 1956). Bu test, numune boyutları aynıysa tam bir alfa seviyesi testidir ve numune boyutları farklıysa konservatiftir (Hayter 1984).

Soru: İki yaklaşım arasındaki bağlantının doğası nedir? Birini diğerine dönüştürmenin bir yolu var mı?

Birinin medyan için yaklaşık% 95 CI aradığı ve örtüşme olup olmadığını belirlediği görülüyor; diğeri ise iki örnek kümesinin medyanlarının birbirinin makul bir aralığı içinde olup olmadığını belirlemek için bir "tam alfa testi" dir (örneklerim aynı boyuttadır).

Paketlerden bahsediyorum, ama mantığın arkasındaki matematikle ilgileniyorum.

Yanıtlar:


11

Çentikli kutu çizimine gelince, sorunuzda belirtilen McGill et al [1] referansı oldukça eksiksiz detaylar içeriyor (burada söylediğim her şey orada açıkça belirtilmedi, ancak yine de bunu anlamak için yeterince ayrıntılı).

Aralık sağlam ancak Gauss tabanlı bir aralıktır

Kağıt, çentikler için aşağıdaki aralığı belirtir (burada , örnek medyan ve R , örnek çeyrekler arası aralıktır):MR

M±1.7×1.25R/(1.35N)

nerede:

  • 1.35σσR/1.35σ

  • 1.2514nf02f0f012πσ0.3989σ12Nf0=π/2σ/N1.253σ/N

    N

    Yukarıdaki ikisini birleştirerek, medyanın standart hatasını yaklaşık gösteren asimptotik bir tahmin elde ediyoruz. 1.25R/(1.35N)

  • Tartışmak için geriye kalan tek şey 1.7.

    Bir örneği sabit bir değerle (varsayılmış bir medyan diyelim) karşılaştırırsak,% 5 test için 1.96 kullanacağımızı unutmayın; Sonuç olarak, iki çok farklı standart hatamız olsaydı (biri nispeten büyük, biri çok küçük), bu, kullanılacak faktörle ilgili olurdu (çünkü null doğruysa, fark neredeyse tamamen büyük olandaki varyasyondan kaynaklanacaktır. standart hata ve küçük olan - yaklaşık olarak - etkili bir şekilde sabit olarak değerlendirilebilir).

    1.96/21.386

    rr:11.96/1+1/r

Hepsini (1.35,1.25 ve 1.7) bir araya getirmek yaklaşık 1.57 verir. Bazı kaynaklar, 1.35 veya 1.25'i (veya her ikisini) daha doğru bir şekilde hesaplayarak 1.58 elde eder, ancak 1.386 ve 1.96 arasında bir uzlaşma olarak, 1.7'nin iki önemli rakama bile doğru olmadığı anlamına gelir (sadece bir ballpark uzlaşma değeri), bu nedenle ek hassasiyet anlamsız (onlar da her şeyi 1.6'ya yuvarlayabilir ve onunla yapılabilir).

Burada herhangi bir yerde birden çok karşılaştırma için ayarlama yapılmadığını unutmayın .


Tukey-Kramer HSD'deki bir farkın güven sınırlarında bazı belirgin analojiler vardır :

y¯iy¯j±qα;k;Nk2σ^ε1ni+1nj

Ama unutmayın

  • c.1ni+1njk.1nik.1nj1.961.96/2

  • medyanlara değil, ortalamalara dayanır (yani 1,35)

  • q2

Dolayısıyla, bileşen formunun arkasındaki fikirlerin bir kısmı benzer olsa da, aslında yaptıkları şeyden oldukça farklıdırlar.

[1] McGill, R., Tukey, JW ve Larsen, WA (1978) Kutu grafik çeşitleri. Amerikan İstatistikçi 32, 12-16.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.