Kutu ve bıyık grafiklerini okuma: gruplar arasındaki önemli farklılıkları çözmek mümkün mü?


11

Bu kutu ve bıyık planına baktığımızı varsayalım:

arsa

Perşembe ve Cuma günleri arasında, çoğu zaman uyuduğunda önemli bir fark olduğu görüşünde. Peki bu istatistiksel olarak geçerli bir varsayım mı? İç çeyrek aralıklarının hiçbirinin Perşembe ve Cuma günleri arasında çakışmamasından dolayı önemli farklılıkları fark edebilir miyiz? Perşembe ve Cuma günlerinin üst ve alt bıyıklarının üst üste gelmesine ne dersiniz? Bu analizimizi etkiler mi?

Genellikle böyle bir grafiğe eşlik etmek bir tür ANOVA olacaktır, ancak sadece bir kutu grafiğine bakarak gruplar arasındaki farklılıklar hakkında ne kadar söyleyebileceğimizi merak ediyorum .


Daireler aykırı değerleri temsil eder.
Michael R.Chernick

3
Çizim, numune boyutunun herhangi bir göstergesini kaçırdığı sürece, bu zordur. Ancak, medyanlar için arsa güven aralıklarını dahil ederseniz, bu güven aralıklarını karşılaştırabilirsiniz. Arsada mevcut gibi görünmüyorlar.
kjetil b halvorsen

@kjetilbhalvorsen Bu sadece Google'dan aldığım bir komplo :) ... Ben kendi
komploma

2
CI olmadan, "önemli" farklılıklar hakkında konuşamazsınız. Ancak, Perşembe ve Cuma arasında "dikkate değer" bir fark olduğunu söyleyebilirim. Ya da "en dikkat çekici" fark Perşembe ve Cuma günleri arasında gerçekleşir ..
Ashe

1
Daireler, yakın çeyreğe göre 1,5 IQR'den fazla puanlardır. Kesinlikle ve nesnel olarak aykırı değildirler. Perşembe günü, dağıtımın geri kalanına kıyasla olağanüstü görünmüyor. Cuma günü gerçekten öyle; ve bir araştırmacı veya analist mümkünse kontrol etmek ve açıklamak için bir hikaye olup olmadığını görmek istemelidir. Belki birisi gerçekten uyumadý! Veri noktalarını bu şekilde işaretlemek, onları inceleme ve düşünce için işaretlemektedir. Kovulması gereken şeytanları tanımlamak için istatistiksel bir yöntem değil.
Nick Cox

Yanıtlar:


4

Hayır, yapamazsınız. Örnek boyutları ve çok fazla deneyiminiz varsa tahmin edebilirsiniz - ve tahmininizin doğruluğu örnek boyutuna (etki boyutuna ek olarak) bağlı olacaktır. N = grup başına 1.000.000 ise, çok önemlidir. Grup başına N = 10 ise, çok fazla değil. Grup başına 100'de tahmin etmek daha zordur.

Bunun iyi bir şey olduğunu iddia ediyorum . Bir kutu grafiğiyle ilgili olan şey , istatistiksel önemi tahmin etmeye çalışmak değil , neler olup bittiğine bakmak ve bu konuda mantık yürütmeye çalışmaktır. Hmm. Hafta sonları daha çok uyuyor. Bu ilginç ama şaşırtıcı değil. Saatlerce uykuyu hafta sonu vs değil bir fonksiyonu olarak modelleyebiliriz. Ya da bu paternin değişip değişmediğini görmeye çalışabiliriz. Belki emekli insanlar bu kalıba sahip değillerdir? Vardiyalı işçiler ne olacak? Hafta sonları çalışanlar? Haftanın 7 günü çalışanlar?

Gravür okulundaki en sevdiğim profesör olarak (Herman Friedman) “Araştırmaya devam etmeyi bırak!” Derdi.


1
Bu cevabın gereksiz yere kötümser olduğunu düşünüyorum. Kutu grafikleri aslında grup boyutları hakkında bazı bilgiler içerir, çünkü gerçekten küçük grup boyutları ( ) karakteristik "dejenere" yapılara sahiptir. Bu dağılımlar çok eğik olmadığından ve çok az aykırı olduğundan, IQR (uygun bir kat sayısı) SD için iyi bir vekildir, bu nedenle standart hataları üst sınırlara getirebiliriz. Böylece, sadece arsadan muhafazakar bir kaba ve hazır ANOVA yapılabilir: ve genel ANOVA'nın önemli olduğunu gösterecektir. Ayrıca konservatif post-hoc testler de yapılabilir. N<5
whuber

8

Evet yapabilirsin. En azından yaklaşık olarak.

Bazı uyarılar ve sınırlamalarla birlikte aşağıda nasıl olduğunu (ve aslında önerdiğiniz gibi "kutu üst üste gelme" ile nasıl bir ilişki olduğunu) açıklarım. Ama önce biraz arka plan ve bağlam için birkaç ön konuşalım. (Bence buradaki uygun bir cevap örneğin ayrıntılarına değil, belki de bir kenara biraz bahsetmeyi hak ediyor olsa da - görünür farklılıkların kolayca rastgele varyasyon olarak açıklanıp açıklanamayacağını değerlendirmek için kutu grafikleri kullanma konusuna odaklanmalıdır. .)

Verilere erişiminiz varsa, bu tür görsel karşılaştırma için tasarlanmış çentikli kutu grafikleri çizebilirsiniz .

R çentikli boxplots gösteren resim

Burada çentikli kutu grafik hesaplamaları hakkında bir tartışma var . Çentik aralıkları çakışmıyorsa, karşılaştırılan iki grup% 5 düzeyinde yaklaşık olarak farklıdır; hesaplamalar normal hesaplamaları temel alır, ancak oldukça sağlamdırlar ve bir dizi dağılımda oldukça iyi performans gösterirler. (Resmi bir test olarak kabul edilirse, güç normalde çok yüksek değildir, ancak daha fazla veya daha az "tipik" daha ağır kuyruklu vakalar için oldukça iyi olmalıdır.)

Çentikli kutu grafiklerinin nasıl çalıştığını göz önünde bulundurarak, yalnızca sorudaki gibi bir ekranınız olduğunda işe yarayacak hızlı bir başparmak kuralını ayırt edebilirsiniz. Örnek boyutu 10 olduğunda ve medyan kutunun ortasına yakın yerleştirildiğinde, çentikli bir kutu grafiğindeki çentikler kutunun genişliğindedir, bu nedenle çentik uçları ve kutu kabaca aynı yerdedir.

" " genel kuralının nasıl ortaya çıktığıyla ilgili tartışma için buraya bakın .n=10

Ancak, bu karşılaştırma için kutunun ortasındaki ortancaya ihtiyacınız yoktur; bu sadece kurala nasıl geldiğimizi açıklar. Çentikli kutu grafiklerinden başlamış olsak ve medyan için bir aralığın normal tabanlı bir hesaplamasına rağmen, şimdi sadece "kutu üst üste binme" kuralını ve (herhangi bir başka varsayımla birlikte) sonuçlanacak bir boş değeri düşünüyoruz. kutuları ayırmaya meyilli bazı alternatifler ile aynı sürekli dağılımlar (mutlaka yer değiştirmesi gerekmez, ancak yorumlanması en kolay alternatif budur).n=10

Çeyreklerin olası göreli sıralarının (Tukey'in tanımına yapışan bir kutu grafiğindeki menteşeler), tek gözlemlerde meydana geldikleri örnek boyutlarındaki olasılıkları, sıfırın altındaki dağılım şekline bağlı değildir. Bu durumda (örn . Her numunede ) test testinin bu sürümü dağıtımsızdır . En (bitişik sıra istatistiklerinin ortalamalarının dağıtım şimdi dağılımı şeklinde bir ilişki vardır çünkü) dağıtım serbest değil ama neredeyse dağılım ücretsiz.n=9n = 10n=10

yakın tip I hata oranların=10 : Yaygın olarak kullanılan bir dizi dağılımda (hem simetrik hem de eğri, ağır ve hafif kuyruklu) simülasyon, iki örnekli kutu örtüşme testinin yaklaşık% 2,3 önem seviyesine sahip olduğunu gösterir. (dağılımlar arasında gerçekten çok fazla değişiklik yok) ve yaklaşık% 5,6 testi ( muhtemelen % 5'in altına geri döndü , muhtemelen sipariş istatistiklerinin ortalaması varyansı daha fazla düşürdüğü için bir gözlem kaybı onu artırır). 9 ve 10 örnekleriniz varsa, önem seviyesi% 5'in altındadır.n=10,10n=9,9n=8,8

Diğer örnek boyutları : Örnek boyutlarını biliyorsanız, çentiklerin ekrandan nereye gittiğini anlayabilirsiniz. Örnek boyutlarında bir alt sınırınız varsa, çentik konumlarında bir üst sınır elde edebilirsiniz. Ancak bildiğiniz tek şey en az 10 olsa bile , hızlı bir şekilde kutu üst üste gelip gelmediğini kontrol edebilirsiniz. Çentik aralıklarının genişliği ile orantılıdır, bu nedenle çentiklerin, medyandan her çeyreğin yaklaşık yarısı kadar olması gerektiğini anlayabilirsiniz .nnn=40

Arsaya bakarken:

Sorudaki çizimin görünümünden örnek boyutlarının en az 5 olması gerektiğini söyleyebiliriz; 5'ten az olsaydı, tek tek örnek kutuların daha küçük bir örnek boyutundan oldukları konusunda farklı ipuçları olacaktır (örneğin, her bir kutunun ortanca ölü merkezi olması veya bir aykırı olduğunda bıyık 0 uzunluğunda olması gibi).

Alternatif olarak, kutular (çeyrekleri işaretleyen) birbiriyle örtüşmüyorsa ve örnek boyutu en az 10 ise, karşılaştırılan iki grup% 5 düzeyinde farklı medyanlara sahip olmalıdır (tek bir çift karşılaştırma olarak kabul edilir).

Eğer bilmiyorsanız biz örnek boyutu en az 5 olması gerektiğini bildiğimiz için, 's% 40 yaklaşık her kutu uzatmak eğer, sadece, özellikle, kutular biraz daha büyük aralıklarla yapmak gerekir medyandan uzak dururlar ve yine de örtüşmezler, için önemli bir fark gösterirler - burada sadece kutuyu karşılaştırmak için fark edebileceğimiz daha geniş bir temelden ziyade çentikli-boxplot muhakemesinden bir tartışmaya geri dönerler.nn=5

[Bunun, karşılaştırmaların sayısını hesaba katmadığına dikkat edin, bu nedenle birden fazla karşılaştırma yapıyorsanız, genel tip I hatanız daha büyük olacaktır. Resmi testten ziyade görsel bir inceleme içindir; Bununla birlikte, ilgili fikirler, çoklu karşılaştırmalar için ayarlama da dahil olmak üzere daha resmi bir yaklaşıma uyarlanabilir.]

Eğer ister çözümleyen can , olup olmadığını dikkate almak mantıklı olacaktır gerektiği . Belki de değil; Potansiyel p-hackleme sorunu gerçektir, ancak bunu, örneğin, araştırma konusuyla ilgili yeni veriler toplamaya çalışıp çalışmadığınızı anlamak için kullanıyorsanız ve sahip olduğunuz tek şey bir makalede bir kutu çizimidir - diyelim ki - gürültü nedeniyle varyasyon ile kolayca açıklanabilecek daha fazla şey olup olmadığına dair bir değerlendirme yapabilmek oldukça yararlıdır. Ancak bu konuyu derinlemesine ele almak gerçekten farklı bir soruyu cevaplamak olacaktır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.