ANOVA ne yapar?


60

ANOVA'nın ne olduğunu görsel olarak açıklamanın yolu nedir?

Herhangi bir referans, link (ler) (R paketleri?) Kabul edilecektir.


'Bir psikoloğun istatistiksel programlamadaki çabaları' adlı blogunda Kristoffer Magnusson, D3.js kullanarak tek yönlü anova görselleştirmesine harika bir örnek veriyor: rpsychologist.com/d3-one-way-anova/#comment-1891
Epifunky

Varyans analizinin ne kadar güzel olduğunun bu güzel görüntüsünü buldum. Önceki cevaplar kadar kesin değildir, ancak görselleştirme ile etkileşimli olarak oynayabilirsiniz. Oldukça intersting buldum: students.brown.edu/seeing-theory/regression/index.html#third
Mike

Yanıtlar:


51

Şahsen, hepsinin aynı olduğunu ve lineer modellerin toplam varyansı bölmek için olduğunu göstererek lineer regresyon ve ANOVA'yı tanıtmayı seviyorum: Sonuçta, ilgi faktörleri ile açıklanamayan sonuçlarla açıklanabilecek bir çeşit sapma var. bölüm ('artık' olarak adlandırılır). Genel olarak aşağıdaki çizimi kullanıyorum (toplam değişkenlik için gri çizgi, grup için siyah çizgiler veya kişiye özel değişkenlik):

alt metin

Ayrıca Michael Friendly ve John Fox'tan gelen heplots R paketini de sevdim , fakat aynı zamanda Çok Değişkenli Doğrusal Modellerde Görsel Hipotez Testlerine bakın : R için heplots Paketi .

ANOVA'nın gerçekte ne yaptığını açıklamanın standart yolları, özellikle Doğrusal Model çerçevesinde, gerçekten karmaşık soruların Plane cevaplarında , Christensen tarafından açıklanmaktadır , ancak çok az illüstrasyon vardır. Saville ve Wood'un İstatistiksel yöntemleri: Geometrik yaklaşımın bazı örnekleri vardır, ancak bunlar esas olarak regresyondur. Montgomery'nin çoğunlukla DoE'ye odaklanan Deneme Tasarım ve Analizinde, sevdiğim illüstrasyonlar var ama aşağıya bakınız

alt metin

(bunlar benim :-)

Ancak, Vikipedi'de gösterildiği gibi, karelerin, hataların, vb. Toplamın bir vektör uzayına nasıl döndüğünü görmek istiyorsanız, Doğrusal Modellerde ders kitaplarına bakmanız gerektiğini düşünüyorum . Ekonometride Tahmini ve Çıkarım , Davidson ve MacKinnon tarafından güzel çizimlere sahip görünüyor (1. bölüm aslında OLS geometrisini kapsıyor) ama ben sadece Fransızca çeviriye göz atıyorum ( burada bulunur ). Doğrusal Regresyonun Geometrisi de bazı iyi örneklere sahiptir.

Düzenle :

Ah, ve ben sadece bu makaleyi hatırlıyorum Robert Pruzek, Tek yönlü ANOVA için yeni bir grafik .

Düzenle 2

Ve şimdi, granova paketi (@ gd047 ile belirtilen ve yukarıdaki kağıtla ilişkilendirildi) ggplot'a taşındı, aşağıdaki tek yönlü ANOVA için bir çizime sahip olan granovaGG'ye bakınız.

görüntü tanımını buraya girin


İlk illüstrasyon R kullanılarak mı üretildi?
George Dontas,

@ gd047 Evet. İsterseniz bir yerde çirkin kaynak kodu olmalıdır. İkincisi Metapost'ta yapılır.
chl

3
@ gd047 Pekala, her zamanki gibi, eski kodu ararken bulamadık (grep / find ile yaptığım en iyi çabaya rağmen), bu yüzden bunun için hızlı (hala çirkin) bir R betiği yazdım . Ayrıca MP kodunun bir örneğini de koydum .
chl

Doğrusal regresyon bağlantısının geometrisi ne yazık ki çürümüş görünüyor.
Silverfish

23

Böyle bir şeye ne dersin? alt metin

Crawley'den sonra (2005). İstatistik. R: Wiley kullanarak bir giriş.


1
(+1) Bana şunu hatırlatıyorum plot.design()(ama sizinki daha gelişmiş bir sürümde :-)
chl

En iyisi bu.
Meraklı

13

Şimdiye kadarki cevabınız için teşekkür ederim. Çok aydınlatıcı yerlerdeyken, onları şu anda öğrettiğim kurs için kullanmanın (iyi, TA'ing) öğrencilerim için çok fazla olacağını hissettim. (Tıp bilimlerinde ileri seviyelerdeki öğrenciler için Biyoistatistik dersini öğretmeye yardımcı olurum)

Bu nedenle, ANOVA'yı açıklamak için faydalı bir örnek olduğunu düşündüğüm (her ikisi de simülasyon temelli) iki resim oluşturdum.

Onları geliştirmek için yorum veya önerileri okumaktan mutluluk duyarım.

İlk görüntü, 3 çizime ayrılmış 30 veri noktasının simülasyonunu göstermektedir (MST = Var'ın MSB ve MSW'yi oluşturan verilere nasıl ayrıldığını gösterir:

  • Soldaki grafik, grup başına verilerin dağılım grafiğini gösterir.
  • Ortadaki, MSB için kullanacağımız verilerin nasıl göründüğünü gösterir.
  • Doğru görüntü, MSW için kullanacağımız verilerin nasıl göründüğünü gösterir.

alt metin

İkinci resim, her biri gruplar için farklı bir varyans ve beklenti kombinasyonu için 4 grafik göstermektedir

  • İlk satır sırası düşük varyans için, ikinci satır ise yüksek (er) varyans içindir.
  • İlk parsel kolonu gruplar arasında eşit beklenti içindir, ikinci sütun ise (çok) farklı beklentileri olan grupları göstermektedir.

alt metin


2
H0: μ1=μ2==μk H1:  i,j | μiμjH1¬ H0). Bu fikirleri grafiksel bir ekrana aktarabiliyorsanız - ki burada durum böyle gözüküyor - sanırım neredeyse bitti.
chl

Merhaba chl, olumlu geri bildirimleriniz için teşekkür ederiz (ve önceki ayrıntılı yanıtınız için)! Sanırım bu sınıf için materyal hazırlarken elde ettiğim en büyük eve götürme masajlarının bazıları şunlardır: 1) MSB ve MSW varyans ölçümlerini almak için orijinal verilerin dönüşümü nasıl tanımlanır? 2) MSB / MSW'nin test istatistiğinin aslında tek taraflı (iki taraflı değil) bir test olduğu ve H0'ın MSB olduğu = MSW olduğu. Son olarak, sadece SSW = SST-SSB'nin doğru olduğunu not etmeyi düşündüm (ancak MSW = MST-MSB için nasıl doğru olduğunu göremiyorum).
Tal Galili

1
yij=μ+αi+εijyij=μi+εijyij=yi¯+εij=y¯+(y¯iy¯)+(yijy¯i)(yijy¯)=(y¯iy¯)+(yijy¯i)

12

Bu yazıda bazı güzel grafik türleri topladığımızdan, son zamanlarda bulduğum başka bir tane daha var ve ANOVA'nın nasıl çalıştığını ve F istatistiğinin nasıl üretildiğini anlamanıza yardımcı olabilir. Grafik, R'deki granova paketi kullanılarak oluşturuldu . alt metin


2
(1) Robert Pruzek en makalenin bağlantısını verdi, ama R. mevcut olduğunu bilmiyordum
chl


6

Harika soru Biliyor musun, çok uzun zamandır başımı ANOVA'nın etrafına sarmakla kendimi zorladım. Kendimi daima “içler arası ile” sezgisine dönerken buluyorum ve kafamda bunun nasıl olacağını hayal etmeye çalıştım. Bu sorunun ortaya çıkmasına sevindim ve yukarıdaki cevaplarda bu konudaki çeşitli yaklaşımlara hayran kaldım.

Her neyse, uzun zamandır (yıllarca) Aynı anda birçok yönden aynı anda neler olduğunu görebildiğim bir yerde birkaç arsa toplamak istedim: 1) popülasyonların ne kadar uzakta olduğu, 2) nasıl uzaklarda veri 3) ne kadar büyük olduğunu, olup aralarında karşılaştırıldığında dahilinde ve 4) nasıl do merkezi karşı konsolide bütçe dışında kalan F dağılımları karşılaştırmak?

Gerçekten harika bir dünyada, örneklem boyutunun bazı şeyleri nasıl değiştirdiğini görmek için kaydırıcılarla bile oynayabilirim .

Bu yüzden RStudio'dakimanipulate komutla oynuyordum ve kutsal inek işe yarıyor! İşte parsellerden biri, anlık görüntü, gerçekten:

visualizeANOVA

RStudio'nız varsa yukarıdaki arsa (sürgü ve diğerleri) yapmak için kod alabilirsiniz! Burada Github .

Bir süre bununla oynadıktan sonra, F istatistiğinin grupları, hatta küçük örneklem büyüklükleri için ne kadar iyi ayırt ettiğine şaşırdım. Nüfuslara baktığım zaman, onlar gerçekten o kadar uzak değiller (gözlerime), ancak “içerideki” çubuk, “arada” çubuk tarafından sürekli olarak cüceler. Her gün bir şeyler öğren, sanırım.


3

Tek yönlü ANOVA ile neler olup bittiğini göstermek için, bazen öğrencilerin varyansların içinde ve arasında oynamalarını ve F istatistiği üzerindeki etkilerini gözlemlemelerini sağlayan “İstatistik Uygulamalarına Giriş” yazarları tarafından sunulan bir uygulamayı kullandım. . İşte link (uygulama sayfadaki sonuncudur). Örnek ekran görüntüsü:

görüntü tanımını buraya girin

Kullanıcı, üç veri grubunun dikey yayılımlarını değiştirerek üst kaydırıcıyı kontrol eder. Alttaki kırmızı nokta, p-değerleri grafiği boyunca hareket ederken, aşağıda gösterilen F istatistiği güncellenir.


2

Görünüşe göre gemi cevap olarak çoktan yelken açmış gibi görünüyor ama bence bu giriş niteliğindeki bir kurssa, burada sunulan göstergelerin birçoğunun tanıtım öğrencileri için kavraması çok zor olacak ... veya en azından bölümleme varyansının çok basitleştirilmiş bir açıklamasını sağlayan tanıtım ekranı olmadan kavranması zor. SST toplamının konu sayısı ile nasıl arttığını gösterin. Sonra birkaç konu için şişirildiğini gösterdikten sonra (belki de her gruba birkaç kez ekleyerek), SST = SSB + SSW'yi açıklayın (yine de ben SSE'yi başlangıçtan itibaren SSE olarak adlandırmayı tercih ederim, çünkü IMO sınavında konuya girerken kafa karışıklığını önlüyor ). Sonra onlara, varyasyon bölümlemesinin görsel bir sunumunu gösterin, örneğin SST'nin SSB ve SSW'den nasıl yapıldığını görebileceğiniz şekilde kodlanmış büyük kare bir renk. Sonra,


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.