MANOVA'nın sıfır hipotezi nedir?


11

Arka fon

Farklı gruplar arasındaki (kategorik bir değişken tarafından verilen) bazı sürekli değişkenlerdeki farklılıkları analiz etmek için, tek yönlü bir ANOVA gerçekleştirilebilir. Birkaç açıklayıcı (kategorik) değişken varsa, bir faktöriyel ANOVA gerçekleştirilebilir. Eğer bir grup çeşitli sürekli değişkenlerdeki (yani, birkaç cevap değişkeni) gruplar arasındaki farklılıkları analiz etmek istiyorsa, çok değişkenli bir ANOVA (MANOVA) yapmak zorundadır.

Soru

Birkaç tepki değişkeni üzerinde ANOVA benzeri bir testin nasıl yapılabileceğini pek bilmiyorum ve daha da önemlisi, sıfır hipotezinin ne olabileceğini anlamıyorum. Sıfır hipotezi:

  • "Her yanıt değişkeni için tüm grupların ortalamaları eşittir",

yoksa öyle mi

  • "En az bir yanıt değişkeni için, tüm grupların ortalamaları eşittir",

ya da başka bir şey mi?H0


Bir ANOVA'nın nasıl çalıştığını da soruyor musunuz? Standart bir hatanın ne olduğunu tartışmak bağlamında, temelde burada bir ANOVA'nın arkasındaki temel fikri açıklarım: Standart hata nasıl çalışır?
gung - Monica'yı eski

İki ifadenizden hiçbiri. H0MANOVA'nın çok değişkenli alanda fark olmamasıdır . Çok değişkenli vaka, tek değişkenli olmaktan çok daha karmaşıktır, çünkü sadece varyanslarla değil, kovaryanslarla uğraşmak zorundayız. H0-H1MANOVA'da hipotezleri formüle etmenin birkaç yolu vardır . Wikipedia okuyun.
ttnphns

@ttnphns: Neden ikisi? ANOVA her grubun ortalama değerleri eşit olmasıdır. MANOVA bütün grupların değişkenli araçları eşit olmasıdır. Bu OP'de tam olarak alternatif 1'dir. Kovaryanslar vb . Sıfır hipotezine değil MANOVA'nın varsayımlarına ve hesaplamalarına girer . H 0H0H0
amip

@ amoeba, hoşuma gitmedi For each response variable. Bana öyle geliyor (ya da ben okuyorum) "test her biri üzerinde tek değişkenli olarak yapılır" (ve sonra bir şekilde birleştirilir).
ttnphns

Yanıtlar:


9

Tek yönlü bir sıfır hipotezi , tüm grupların ortalamalarının eşit olmasıdır:Tek yönlü bir sıfır hipotezi , tüm grupların [çok değişkenli] ortalamalarının eşit olmasıdır:Bu, ortalamaların her tepki değişkeni için eşit olduğunu söylemekle eşdeğerdir, yani ilk seçeneğiniz doğrudur .H 0 : μ 1 = μ 2 = . . . = μ k . H 0H0

H0:μ1=μ2=...=μk.
H0
H0:μ1=μ2=...=μk.

Her iki durumda da alternatif hipotezi değerinin reddedilmesidir. Her iki durumda da varsayımlar (a) Gauss grup içi dağılımları ve (b) gruplar arasında eşit varyanslar (ANOVA için) / kovaryans matrisleridir (MANOVA için).H1

MANOVA ve ANOVA'lar arasındaki fark

Bu biraz kafa karıştırıcı görünebilir: MANOVA'nın sıfır hipotezi, tek değişkenli ANOVA koleksiyonu için sıfır hipotezlerinin kombinasyonuyla tamamen aynıdır , ancak aynı zamanda MANOVA yapmanın tek yönlü ANOVA'lar yapmaya eşdeğer olmadığını biliyoruz " sonuçları birleştirmek (çeşitli biçimlerde birleştirmek olabilir). Neden olmasın?

Cevap, tüm tek değişkenli ANOVA'ları çalıştırmanın, aynı sıfır hipotezini test etmesine rağmen, daha az güce sahip olacağıdır. Bir örnek için cevabımı burada görebilirsiniz : Tek değişkenli ANOVA'ların hiçbiri önem kazanmadığında MANOVA nasıl önemli bir fark rapor edebilir? Naif "birleştirme" yöntemi (en az bir ANOVA null değerini reddederse global null değerini reddet) de büyük bir tip I hata oranı enflasyonuna yol açacaktır; ancak doğru hata oranını korumak için akıllı bir "birleştirme" yöntemi seçilse bile, güç kaybı olur.

Test nasıl çalışır?

ANOVA, toplam kareler toplamı gruplar arası kareler toplamı ve grup içi kareler toplamı böler , böylece . Daha sonra oranını hesaplar . Sıfır hipotezi altında, bu oran küçük olmalıdır (yaklaşık ); sıfır hipotezi altında beklenen bu oranın tam dağılımı hesaplanabilir ( ve grup sayısına bağlı olacaktır ). Gözlenen değeri ile bu dağılımın karşılaştırılması bir p-değeri verir.TBWT=B+WB/W1nB/W

Manova toplam dağılım matrisi parçalanır içine gruplar arası matrisi ve grup içi matrisi , böylece . Daha sonra matrisini hesaplar . Sıfır hipotezi altında, bu matris "küçük" olmalıdır ( ); ama ne kadar küçük olduğunu nasıl ölçebiliriz? Özdeğer de MANOVA bakışlar bu matrisin (hepsi olumlu) ait. Yine, sıfır hipotezi altında, bu özdeğerler "küçük" olmalıdır (her yerdeTBWT=B+WW1BIλi1). Ancak bir p-değerini hesaplamak için, bunu null altında beklenen dağılımıyla karşılaştırabilmek için bir sayıya ("istatistik" denir) ihtiyacımız vardır. Bunu yapmanın birkaç yolu vardır: tüm özdeğerlerin ; maksimal özdeğer alır , vb. Her durumda, bu sayı null altında beklenen bu miktarın dağılımı ile karşılaştırılır ve bu da p değeri ile sonuçlanır.λimax{λi}

Test istatistiğinin farklı seçimleri biraz farklı p değerlerine yol açar, ancak her durumda aynı sıfır hipotezinin test edildiğini fark etmek önemlidir.


Ayrıca, birden fazla test için düzeltme yapmazsanız, tek değişkenli ANOVA yaklaşımı da tip I hata enflasyonu verecektir.
gung - Monica'yı eski

1
@gung: Evet, bu da doğru. Bununla birlikte, ANOVA'lardan en az biri boş değeri reddettiği anda, yalnızca boşluğu reddetmekten daha "birleştirmek" daha akıllı olabilir. Demek istediğim, akıllı olanın "birleştirmeye" çalışmasına rağmen, MANOVA'ya kıyasla hala güç kaybedecek (hata oranını şişirmeden testin boyutunu korumayı başarsa bile).
amip

Ama şimdi bu "güç" doğrudan kovaryans kavramıyla ilgili değil mi? Ahlaki, (bir dizi) tek değişkenli test ile sadece SSdifference/SSerrorskaler olan marjinal etki için test yaptığımızdır . MANOVA'da çok değişkenli etki SSCPerror^(-1)SSCPdifferencematristir (toplam kovaryanslar ve muhasebeleştirilen grup içi). Ancak bir test istatistiği içinde tek bir şekilde "birleştirilemeyen" birkaç özdeğer olduğundan, birkaç olası alternatif hipotez vardır. Daha fazla güç - daha teorik karmaşıklık.
ttnphns

@ttnphns, evet, bunların hepsi doğru, ama bence sıfır hipotezinin yazdığım şey olduğu gerçeği değişmiyor (ve soru da buydu). Hangi test istatistiği kullanılırsa kullanılsın (Wilks / Roy / Pillai-Bartlett / Lawley-Hotelling), aynı sıfır hipotezini test etmeye çalışıyorlar. Daha sonra bunu daha ayrıntılı olarak tartışmak için cevabımı genişletebilirim.
amip

1
@gung benden içeri girmemi istedi (neden emin değilim ... 7 yıl önce MANOVA'yı öğrettim ve hiç uygulamadım) - , boş tam bir olumsuzlaması olduğunu olduğunu , ki bu boyutlu boyut uzayında boyutlu bir hiperuzay (eğer şu ana kadar kimsenin tanımlamaktan rahatsız olmayan boyuttur) . Ve OP tarafından verilen seçenek 1'dir. Seçenek 2'nin test edilmesi önemli ölçüde daha zordur. H1H0:μgroup 1==μgroup kpkpp
StasK

8

Birincisi.

Bununla birlikte, yaptığı gibi, orijinal değişkenlerin her birinin ortalamalarını sırayla karşılaştırmak tam anlamıyla değildir. Bunun yerine tepki değişkenleri, temel bileşenler analizine çok benzer bir şekilde doğrusal olarak dönüştürülür . (Burada PCA üzerinde mükemmel bir iplik vardır: Temel bileşen analizi, özvektörler ve özdeğerleri anlamlandırma .) Fark, PCA'nın eksenlerinizi maksimum varyasyon yönleriyle hizalanacak şekilde yönlendirmesidir, oysa MANOVA eksenlerinizi aşağıdaki yönlerde döndürür gruplarınızın ayrılmasını en üst düzeye çıkarın.

Açıkça söylemek gerekirse, bir MANOVA ile ilişkili testlerin hiçbiri ya orijinal uzayda ya da dönüştürülmüş uzayda araçlarla doğrudan bir anlamda tüm araçları birbiri ardına test etmemektedir. Her birinin biraz farklı bir şekilde çalıştığı birkaç farklı test istatistikleri vardır, ancak yine de alanı dönüştüren ayrışmanın özdeğerleri üzerinde çalışma eğilimindedirler. Ancak sıfır hipotezinin doğası gereği, tüm grupların tüm araçlarının her tepki değişkeni için aynı olması, bazı değişkenler üzerinde farklılık gösterebilmeleri değil, en az birinde aynı olmalarıdır.


Ooh ... Yani Manova (grupların ortalaması arasındaki mesafeyi en üst düzeye çıkarmak için) doğrusal bir ayırma analizi yapar ve sonra ilk ekseni yanıt değişkeni olarak kullanarak standart bir anova çalıştırır? Yani, "PC1 açısından - tüm grupların araçları aynıdır". Bu doğru mu? Ho
Remi.b

Birkaç farklı olası test vardır. Sadece 1. ekseni test etmek, aslında testiniz olarak Roy'un en büyük kökünü kullanıyor. Bu genellikle en güçlü test olacaktır, ancak daha sınırlıdır. Hangi testin 'en iyi' olduğu konusunda devam eden bir tartışma var.
gung - Monica'yı eski

Sanırım birden fazla test sorununu önlemek için birkaç ANOVA yerine MANOVA kullanıyoruz. Bir MANOVA yaparak biz sadece a PC1'de bir ANOVA yaparsanız Ama LDR , o zaman hala pvalue bakarak göz önünde bulundurulacak bir çoklu test sorunu var. Bu doğru mu? (Bu daha anlamlı olur. Önceki belirsiz
yorumumu sildim

Bu anlayışlı bir nokta, ama iki sorun var: 1) eksenler artık dik ve birden fazla test ile sorunları değiştirebilir; 2) MANOVA test istatistiklerinin örnekleme dağılımları çoklu eksenleri dikkate alır.
gung - Monica'yı eski

1
@ Remi.b: Bunlar iyi sorular, ancak açık olmak gerekirse: MANOVA, LDA'nın ilk ayırt edici eksenindeki bir ANOVA'ya eşdeğer değildir ! MANOVA ve LDA arasındaki ilişki için buraya bakınız: MANOVA LDA ile nasıl ilişkilidir?
amip
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.