Takip: Karışık bir ANOVA grafiğinde tahmini SE'ler mi yoksa gerçek SE'ler mi?


14

Şu anda bir makale bitiriyorum ve dünden bu soruyu tökezledim, bu da bana aynı soruyu kendime yöneltti. Grafiğime verilerden veya ANOVA'mdan tahmin edilen gerçek standart hatayı sağlamak daha mı iyi?
Dünden gelen soru oldukça spesifik olmadığından ve benimki oldukça spesifik olduğundan, bu takip sorusunu sormanın uygun olacağını düşündüm.

Ayrıntılar:
Bazı bilişsel psikoloji alanında (koşullu akıl yürütme), iki grubu (tümevarımsal ve tümdengelimsel talimatlar, yani, denekler arası manipülasyon) iki iç denek manipülasyonuyla (sorunun türü ve sorunun içeriği, her biri iki faktör seviyesi).

Sonuçlar şuna benzer (ANOVA Çıktısından SE tahminleri olan sol panel, verilerden tahmin edilen SE'lerle sağ panel): alternatif metin
Farklı satırların iki farklı grubu (yani, konular arası manipülasyon) ve denekler manipülasyonları x ekseni üzerinde çizilir (yani 2x2 faktör seviyeleri).

Metinde ANOVA'nın ilgili sonuçlarını ve hatta ortadaki kritik çapraz etkileşim için planlanmış karşılaştırmaları sağlarım. SE'ler okuyucuya verilerin değişkenliği hakkında bazı ipuçları vermek için vardır. SD'leri standart sapmalara ve güven aralıklarına göre tercih ediyorum, çünkü SD'leri çizmek yaygın değildir ve denekler içinde ve arasında CI'leri karşılaştırırken ciddi problemler vardır (aynı kesinlikle SE'ler için geçerli olduğundan, önemli farklılıkları yanlış çıkarmak için çok yaygın değildir. onlardan).

Sorumu tekrarlamak için: ANOVA'dan tahmin edilen SE'leri çizmek daha mı iyi yoksa ham verilerden tahmin edilen SE'leri mi çizmeliyim?

Güncelleme:
Sanırım tahmini SE'lerin ne olduğu konusunda biraz daha net olmalıyım. SPSS'deki ANOVA Çıkışı bana estimated marginal meanskarşılık gelen SE ve CI'leri verir. Sol grafikte çizilen budur. Bunu anladığım kadarıyla, artıkların SD'leri olmalılar. Ancak, kalıntıları kaydederken, SD'leri bir şekilde tahmini SE'lere yakın değildir. Yani ikincil (potansiyel olarak SPSS'ye özgü) bir soru şu olurdu:
Bu SE'ler nelerdir?


GÜNCELLEME 2: Sonunda tek başına sevdiğim (kabul ettiğim cevaba bakın) bir komplo oluşturabilen bir R-fonksiyonu yazmayı başardım. Eğer birinin zamanı varsa, ona bir göz atabilirseniz gerçekten minnettar olurum. İşte burada.


1
Öngörülen değişkeni açıklığa kavuşturabilir misiniz? Bu, katılımcıların yanıt için kullandığı 0-100 arası bir ölçek mi, yoksa bu, katılımcıların "evet, onaylıyorum" (vs. "hayır, onaylamıyorum") denediği deneme oranının bir ölçüsü mü? İkincisi ise, bu verileri oran olarak analiz etmek uygun değildir. Bunun yerine, binomiyal bağlantı işlevine sahip karma efektler modelini kullanarak ham, deneme-deneme verilerini analiz etmelisiniz.
Mike Lawrence

Üzgünüz, bunu atladığımız için: 0-100 yanıt ölçeğidir.
Henrik

Çok fazla 0 veya 100 var mı? Değilse, 100'e bölmeyi ve uçlardaki aralık kısıtlamasını dikkate almak için bir logit dönüşümü yapmayı düşünürüm. Bu, ikili verileriniz olduğunda binomiyal bağlantı işlevi tarafından elde edilen şeydir, ancak burada göründüğünüz gibi yalnızca orantı benzeri verilere sahipseniz faydalıdır. Ancak, 1 veya 0 dönüşümünü kaydedemezsiniz, bu nedenle 100 veya 0'a herhangi bir yanıt atmanız gerekir
Mike Lawrence

Hata! İlk yorumumun% 100 doğru olmadığını fark ettim. Çizilen her ortalama, 0-100 ölçeğinde iki yanıtın ortalamasını temsil eder. Bu verilerde 100'e yakın ve bazıları doğrudan 100'e yakın, ancak 0 ve 0'da çok az olan birçok değer var.
Henrik

1
Diğer veri görselleştirmesi insanlar çubuk grafiklerin insanlığa karşı bir suç olduğunu iddia edebilir: Op
Mike Lawrence

Yanıtlar:


9

İlham verici cevapların ve tartışmamın bir sonucu olarak, herhangi bir model tabanlı parametreye dayanmayan, ancak alttaki verileri sunan aşağıdaki grafikleri oluşturdum.

Sebepler, seçebileceğim standart hatalardan bağımsız olarak standart hatanın model tabanlı bir parametredir. Öyleyse, neden temel verileri sunmuyorsunuz ve böylece daha fazla bilgi aktarmıyorsunuz?

Ayrıca, ANOVA'dan SE seçilirse, benim özel problemlerim için iki problem ortaya çıkar.
Birincisi (en azından benim için) SPSSANOVA Çıktısının SE'lerinin gerçekte ne olduğu belli değil ( yorumlarda bu tartışmaya da bakınız ). Bir şekilde MSE ile ilgilidirler ama tam olarak nasıl bilmiyorum.
İkincisi, yalnızca temel varsayımlar karşılandığında makul olurlar. Bununla birlikte, aşağıdaki grafiklerde görüldüğü gibi, varyans homojenliği varsayımları açıkça ihlal edilmiştir.

Kutu grafikleri olan araziler: alternatif metin

Tüm veri noktalarına sahip grafikler: alternatif metin

İki grubun biraz sola veya sağa yer değiştirdiğine dikkat edin: sola tümdengelim, sağa endüktif. Araçlar hala siyah, arka plandaki veriler veya kutu grafikleri gri renkte gösterilir. Soldaki ve sağdaki araziler arasındaki farklar, araçların noktalar veya kutu grafikleriyle aynı şekilde yer değiştirmesi veya merkezi olarak sunulmalarıdır.
Grafiklerin yetersiz kalitesi ve eksik x ekseni etiketleri için özür dileriz.

Geriye kalan soru, yukarıdaki grafiklerden hangisinin şimdi seçileceğidir. Bunu düşünmeli ve makalemizin diğer yazarına sormalıyım. Ama şu an, "yerinden çıkmış araçlarla noktaları" tercih ediyorum. Ve hala yorumlarla çok ilgileniyorum.


Güncelleme: Bazı programlamalardan sonra nihayet otomatik olarak yerlerinden çıkmış noktaları olan bir arsa oluşturmak için bir R-fonksiyonu yazmayı başardım. Check it out (ve bana yorum göndermek) !


Mükemmel Henrik. Ayrıca "yerinden çıkmış araçlarla noktaları" tercih ediyorum. Nesneleri çizgi parçalarıyla bağlamak çok karışık görünebilir. Yazık. Varyansın homojenliğine gelince, biraz daha sangim. Varyans problemi ham verilerde göründüğü kadar kötü olmayabilir. Çoğunlukla zıtlıkları, grup farklılıkları içinde karşılaştıracağınızdan şüpheleniyorum. Kontrast varyansları ham verilerin varyanslarından daha homojen olacaktır. Farklı varyanslara sahip ham ölçümler karşılaştırılırsa (örn. MP-valiad ve akla yatkın grupta Endüktif ve Tümdengelim), parametrik olmayan bir test yedek olarak kullanılabilir.
Thylacoleo

1
Merkezi anlamlarla puanları seviyorum. Çizgilerin daha doğru bir temsili var. Puanları küçültebilirsiniz.
John

8

Bu tür deneysel tasarımla çıkarımsal amaçlarla tek bir makul hata çubuğu bulamazsınız. Bu açık bir çözümü olmayan eski bir sorundur.

Buradaki tahmini SE'lere sahip olmak imkansız görünüyor. Böyle bir tasarımda S hatası arasında ve içinde iki ana hata türü vardır. Genellikle birbirlerinden çok farklıdırlar ve karşılaştırılamazlar. Verilerinizi temsil edecek iyi bir tek hata çubuğu yoktur.

Verilerden elde edilen ham SE'lerin veya SD'lerin çıkarımsal anlamda değil, tanımlayıcı bir anlamda en önemli olduğu iddia edilebilir. Ya merkezi eğilim tahmininin (SE) kalitesini ya da verilerin değişkenliğini (SD) anlatıyorlar. Bununla birlikte, o zaman bile biraz sersemletir çünkü S içinde test ettiğiniz ve ölçtüğünüz şey o ham değer değil, daha çok S değişkeninin etkisidir. Bu nedenle, ham değerlerin değişkenliğinin raporlanması S etkileri açısından anlamsız veya yanıltıcıdır.

Tipik olarak bu grafiklerde ve efektlerin değişkenliğini gösteren bitişik efekt grafiklerinde hata çubuklarını onaylamamıştım. Bu grafikte son derece makul CI'ler olabilir. Efekt grafiklerinin örnekleri için bkz. Masson ve Loftus (2003). Basitçe ((neredeyse tamamen yararsız) hata çubuklarını gösterdikleri ortalama değerler etrafında ortadan kaldırın ve sadece efekt hata çubuklarını kullanın.

Çalışmanız için önce verileri 2 x 2 x 2 tasarım (2 panel 2x2) olarak tekrar çizirdim ve sonra bir grafiğin hemen bitişikini geçerlilik, güvenilirlik, talimat ve etkileşim etkilerinin güven aralıklarıyla çizdim. Talimat grupları için SD'leri ve SE'leri bir tabloya veya metne yerleştirin.

(beklenen karma etkiler analiz yanıtını beklemek;))

GÜNCELLEME: Tamam, düzenledikten sonra istediğiniz tek şeyin, değerin tahmininin kalitesini göstermek için kullanılacak bir SE olduğu açıktır. Bu durumda model değerlerinizi kullanın. Her iki değer de bir modele dayanmaktadır ve örneğinizde 'gerçek' bir değer yoktur. Verilerinize uyguladığınız modelden olanları kullanın. AMA, şekil başlığındaki okuyucuları bu SE'lerin S efektleri veya etkileşimleriniz için herhangi bir çıkarımsal değere sahip olmadığı konusunda uyartığınızdan emin olun.

GÜNCELLEME2: Sunmuş olduğunuz verilere baktığımızda ... şüphesiz ki ANOVA ile analiz edilmemesi gereken yüzdelere benziyor. İster öyle olsun ister olmasın, 100'de maksimum olan ve uçlarda sapmaları azaltan bir değişkendir, bu yüzden ANOVA ile analiz edilmemelidir. Ben rm.plot çizimlerinizi çok seviyorum. Halen koşullar arasında, ham verileri gösteren ve S değişkenliği arasındaki verileri gösteren koşullar arasında ayrı grafikler yapmaya cazip geldim.


1
Grafiği olduğu gibi çizmek için iyi (istatistiksel olmayan) nedenlerim var: Araştırma sorusunun cevabını doğrudan görüyorsunuz. Ayrıca, aradaki sorunlar hakkında bildiğim gibi çıkarımsal amaçlar için bir hata çubukları aramıyorum. Ama beni Mason & Loftus'a geri döndürdüğüm için karışık bir örneği olduğunu unutmuş olmalıyım. Amacımın işe yarayıp yaramadığını düşünmek zorundayım.
Henrik

7

Bu çok güzel bir denemeye benziyor, tebrikler!

John Christie'ye katılıyorum, karışık bir model, ancak bir ANOVA tasarımında (ve dengeli) düzgün bir şekilde belirtilebilirse, neden bu kadar formüle edilemediğini görmüyorum. Özneler içinde iki faktör ve 1 faktör arasında, ancak özneler arasında faktör (endüktif / tümdengelim), özneler içinde etkileri açıkça etkileşir (değiştirir). Çizilen araçların ANOVA modelinden (LHS) olduğunu ve modelin doğru bir şekilde belirtildiğini varsayıyorum. Aferin - bu önemsiz değil!

Bazı noktalar: 1) "Tahmini" ve "gerçek" "hatası" yanlış bir ikiliktir. Her ikisi de altta yatan bir model alır ve bu temelde tahminler yapar. Model makul ise, model tabanlı tahminleri kullanmanın daha iyi olduğunu savunurum (daha büyük örneklerin bir araya getirilmesine dayanır). Ancak James'in belirttiği gibi, hatalar yaptığınız karşılaştırmaya bağlı olarak değişir, bu nedenle basit bir temsil mümkün değildir.

2) Belki de çok fazla yan kaydırma ile (çok fazla değilse) kutu çizimleri veya bireysel veri noktalarını görmeyi tercih ederim, bu yüzden aynı değere sahip noktalar ayırt edilebilir.

http://en.wikipedia.org/wiki/Box_plot

3) Ortalamanın hatasının bir tahminini çizmeniz gerekiyorsa, asla SD'leri çizmeyin - bunlar numunenin standart sapmasının bir tahminidir ve araçların istatistiksel bir karşılaştırması değil, nüfus değişkenliği ile ilgilidir. Genellikle SE'lerden ziyade% 95 güven aralığı çizmek tercih edilir, ancak bu durumda değil (bkz. 1 ve John'un noktası)

4) Bu verilerle ilgili beni ilgilendiren tek sorun, tek biçimli varyans varsayımının büyük olasılıkla ihlal edildiğidir, çünkü "MP Valid and Stausible" verileri, özellikle tümdengelim halindeki insanlar için% 100 sınırıyla açıkça sınırlanmıştır. Bu konunun ne kadar önemli olduğunu kendi kafamda savuruyorum. Karışık efekt logitine (binom olasılığı) geçmek muhtemelen ideal çözümdür, ancak zor bir sorudur. Başkalarının cevap vermesine izin vermek en iyisi olabilir.


1'deki önerinizi anladığımdan tam olarak emin değilim. Gerçek SE [yani SD / sqrt (n)] ve tahmini SE'nin her ikisi de model tabanlı olduğundan, model tabanlı kullanmanızı öneririz. Peki, Hangisi? Ya da demek istediniz: daha karmaşık modelle (burada: ANOVA) gidin, çünkü her iki model de makul.
Henrik

1. noktaya tamamen katılıyorum
John

Merhaba Henrik, Basit örnek - ND olduğu varsayılan iki grubu (x1, x2) karşılaştırın. Varsayımlar ve modeller: 1) Bağımsız olarak örneklenmiş, farklı varyans. X1, x2 için SE'ler ayrı olarak hesaplanır. Bu, birçok grafik sunumda dolaylı olarak varsayımdır. Tahmini SE'ler farklıdır. 2) Indep., Aynı var. Olağan ANOVA varsayımı. Havuzlanmış RSS kullanarak SE'leri tahmin edin. Tahminler daha doğru ise tahmin daha sağlamdır. 3) Her x1'in bir x2 çifti vardır. X1-x2 olduğu tahmin edilen SE'ler. Onları etkili bir şekilde çizmek için x1-x2 farkını çizmeniz gerekir. 1) ve 2) 'yi karıştırdıktan sonra anlamlı SE'ler veya CI'lar çizerken gerçek bir sorununuz var.
Thylacoleo

Henrik, arsa üzerine bir yorum. Kaç konunuz var? Verileri tek tek çizmenizi ve bireyleri bağlamak için çizgi segmentlerini kullanmanızı şiddetle tavsiye ederim. (Bağlantı çizgileri bağlama araçları yanıltıcıdır.) SE'leri çizmeye gerek yoktur. Fikir istatistiksel analizinizi görsel olarak desteklemektir. Arsa çok karmaşık hale gelmezse, bir okuyucu (örneğin) puanların net çoğunluğunun MP-geçerli-implaustan Endüktif grup için AC-inval-plaus'a ve tümdengelim grubu için aşağıya indiğini görmelidir. Bkz. Jstor.org/stable/2685323?seq=1 Özellikle Şekiller 1 ve 9 alt panelleri.
Thylacoleo

3

Son zamanlarda karışık efekt analizi kullanıyorum ve eşlik eden görsel veri analizi yaklaşımını geliştirmeye çalışırken önyükleme ( burada açıklamama bakın ) kullanıyorum; geleneksel CI'lerin.

Ayrıca, yukarıdaki grafikte yaptığınız gibi birden çok değişkeni aynı görsel estetiğe eşlemekten kaçınırım; x eksenine eşlenmiş 3 değişken (MP / AC, geçerli / geçersiz, mantıklı / mantıksız) var, bu da tasarımı ve desenleri ayrıştırmayı oldukça zorlaştırıyor. Bunun yerine, örneğin, MP / AC'yi x eksenine eşleme, faset sütunları için geçerli / geçersiz ve faset satırları için makul / mantıksız eşleme öneririm. Bunu kolayca elde etmek için R'deki ggplot2'ye bakın, örneğin:

library(ggplot2)
ggplot(
    data = my_data
    , mapping = aes(
        y = mean_endorsement
        , x = mp_ac
        , linetype = deductive_inductive
        , shape = deductive_inductive
)+
geom_point()+
geom_line()+
facet_grid(
    plausible_implausible ~ valid_invalid
)

Mike, paket dilindeR pvals.fnc işlevi, lmer modelinin hipotezlerini değerlendirmek için bir MCMC yapar - ancak rastgele eğimli tasarımları işlemez - beni rastgele eğimlerle MCMC yapmanın bir nedeni olduğundan şüpheleniyor bir şekilde sorunlu, kesin olarak böyle bir sorun olmadığını biliyor musunuz?
russellpierce

İtiraf etmeliyim ki, MCMC'nin nasıl çalıştığını hala çözemedim, bunun yerine önyüklemeyi tercih ettim. Önyükleme, rasgele eğimlerle mümkün olsa da, tahmin ettiğiniz gibi, pvals.fnc, rasgele eğimli modeller için CI yapmanıza izin vermeyebilir, çünkü bu bir nedenle geçersizdir ve ayrıca bu geçersizliğin bu tür modelleri önyükleme. Önyükleme ile önyükleme konusunda herhangi bir sorun olacağını düşünmüyorum, ancak bu sınırlı uzmanlığımın bir işlevi olabilir.
Mike Lawrence
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.