Evet yapabilirsin. En azından yaklaşık olarak.
Bazı uyarılar ve sınırlamalarla birlikte aşağıda nasıl olduğunu (ve aslında önerdiğiniz gibi "kutu üst üste gelme" ile nasıl bir ilişki olduğunu) açıklarım. Ama önce biraz arka plan ve bağlam için birkaç ön konuşalım. (Bence buradaki uygun bir cevap örneğin ayrıntılarına değil, belki de bir kenara biraz bahsetmeyi hak ediyor olsa da - görünür farklılıkların kolayca rastgele varyasyon olarak açıklanıp açıklanamayacağını değerlendirmek için kutu grafikleri kullanma konusuna odaklanmalıdır. .)
Verilere erişiminiz varsa, bu tür görsel karşılaştırma için tasarlanmış çentikli kutu grafikleri çizebilirsiniz .
Burada çentikli kutu grafik hesaplamaları hakkında bir tartışma var . Çentik aralıkları çakışmıyorsa, karşılaştırılan iki grup% 5 düzeyinde yaklaşık olarak farklıdır; hesaplamalar normal hesaplamaları temel alır, ancak oldukça sağlamdırlar ve bir dizi dağılımda oldukça iyi performans gösterirler. (Resmi bir test olarak kabul edilirse, güç normalde çok yüksek değildir, ancak daha fazla veya daha az "tipik" daha ağır kuyruklu vakalar için oldukça iyi olmalıdır.)
Çentikli kutu grafiklerinin nasıl çalıştığını göz önünde bulundurarak, yalnızca sorudaki gibi bir ekranınız olduğunda işe yarayacak hızlı bir başparmak kuralını ayırt edebilirsiniz. Örnek boyutu 10 olduğunda ve medyan kutunun ortasına yakın yerleştirildiğinde, çentikli bir kutu grafiğindeki çentikler kutunun genişliğindedir, bu nedenle çentik uçları ve kutu kabaca aynı yerdedir.
" " genel kuralının nasıl ortaya çıktığıyla ilgili tartışma için buraya bakın .n=10
Ancak, bu karşılaştırma için kutunun ortasındaki ortancaya ihtiyacınız yoktur; bu sadece kurala nasıl geldiğimizi açıklar. Çentikli kutu grafiklerinden başlamış olsak ve medyan için bir aralığın normal tabanlı bir hesaplamasına rağmen, şimdi sadece "kutu üst üste binme" kuralını ve (herhangi bir başka varsayımla birlikte) sonuçlanacak bir boş değeri düşünüyoruz. kutuları ayırmaya meyilli bazı alternatifler ile aynı sürekli dağılımlar (mutlaka yer değiştirmesi gerekmez, ancak yorumlanması en kolay alternatif budur).n=10
Çeyreklerin olası göreli sıralarının (Tukey'in tanımına yapışan bir kutu grafiğindeki menteşeler), tek gözlemlerde meydana geldikleri örnek boyutlarındaki olasılıkları, sıfırın altındaki dağılım şekline bağlı değildir. Bu durumda (örn . Her numunede ) test testinin bu sürümü dağıtımsızdır . En (bitişik sıra istatistiklerinin ortalamalarının dağıtım şimdi dağılımı şeklinde bir ilişki vardır çünkü) dağıtım serbest değil ama neredeyse dağılım ücretsiz.n=9n = 10n=10
yakın tip I hata oranların=10 : Yaygın olarak kullanılan bir dizi dağılımda (hem simetrik hem de eğri, ağır ve hafif kuyruklu) simülasyon, iki örnekli kutu örtüşme testinin yaklaşık% 2,3 önem seviyesine sahip olduğunu gösterir. (dağılımlar arasında gerçekten çok fazla değişiklik yok) ve yaklaşık% 5,6 testi ( muhtemelen % 5'in altına geri döndü , muhtemelen sipariş istatistiklerinin ortalaması varyansı daha fazla düşürdüğü için bir gözlem kaybı onu artırır). 9 ve 10 örnekleriniz varsa, önem seviyesi% 5'in altındadır.n=10,10n=9,9n=8,8
Diğer örnek boyutları : Örnek boyutlarını biliyorsanız, çentiklerin ekrandan nereye gittiğini anlayabilirsiniz. Örnek boyutlarında bir alt sınırınız varsa, çentik konumlarında bir üst sınır elde edebilirsiniz. Ancak bildiğiniz tek şey en az 10 olsa bile , hızlı bir şekilde kutu üst üste gelip gelmediğini kontrol edebilirsiniz. Çentik aralıklarının genişliği ile orantılıdır, bu nedenle çentiklerin, medyandan her çeyreğin yaklaşık yarısı kadar olması gerektiğini anlayabilirsiniz .nn−−√n=40
Arsaya bakarken:
Sorudaki çizimin görünümünden örnek boyutlarının en az 5 olması gerektiğini söyleyebiliriz; 5'ten az olsaydı, tek tek örnek kutuların daha küçük bir örnek boyutundan oldukları konusunda farklı ipuçları olacaktır (örneğin, her bir kutunun ortanca ölü merkezi olması veya bir aykırı olduğunda bıyık 0 uzunluğunda olması gibi).
Alternatif olarak, kutular (çeyrekleri işaretleyen) birbiriyle örtüşmüyorsa ve örnek boyutu en az 10 ise, karşılaştırılan iki grup% 5 düzeyinde farklı medyanlara sahip olmalıdır (tek bir çift karşılaştırma olarak kabul edilir).
Eğer bilmiyorsanız biz örnek boyutu en az 5 olması gerektiğini bildiğimiz için, 's% 40 yaklaşık her kutu uzatmak eğer, sadece, özellikle, kutular biraz daha büyük aralıklarla yapmak gerekir medyandan uzak dururlar ve yine de örtüşmezler, için önemli bir fark gösterirler - burada sadece kutuyu karşılaştırmak için fark edebileceğimiz daha geniş bir temelden ziyade çentikli-boxplot muhakemesinden bir tartışmaya geri dönerler.nn=5
[Bunun, karşılaştırmaların sayısını hesaba katmadığına dikkat edin, bu nedenle birden fazla karşılaştırma yapıyorsanız, genel tip I hatanız daha büyük olacaktır. Resmi testten ziyade görsel bir inceleme içindir; Bununla birlikte, ilgili fikirler, çoklu karşılaştırmalar için ayarlama da dahil olmak üzere daha resmi bir yaklaşıma uyarlanabilir.]
Eğer ister çözümleyen can , olup olmadığını dikkate almak mantıklı olacaktır gerektiği . Belki de değil; Potansiyel p-hackleme sorunu gerçektir, ancak bunu, örneğin, araştırma konusuyla ilgili yeni veriler toplamaya çalışıp çalışmadığınızı anlamak için kullanıyorsanız ve sahip olduğunuz tek şey bir makalede bir kutu çizimidir - diyelim ki - gürültü nedeniyle varyasyon ile kolayca açıklanabilecek daha fazla şey olup olmadığına dair bir değerlendirme yapabilmek oldukça yararlıdır. Ancak bu konuyu derinlemesine ele almak gerçekten farklı bir soruyu cevaplamak olacaktır.