Ana etkileri içermeyen bir modele iki yönlü etkileşim eklemek hiç geçerli mi? Peki ya hipoteziniz sadece etkileşim ile ilgiliyse, yine de ana etkileri dahil etmeniz gerekiyor mu?
Ana etkileri içermeyen bir modele iki yönlü etkileşim eklemek hiç geçerli mi? Peki ya hipoteziniz sadece etkileşim ile ilgiliyse, yine de ana etkileri dahil etmeniz gerekiyor mu?
Yanıtlar:
Tecrübelerime göre, sadece modelde daha yüksek dereceli etkilere bağlıyken tüm düşük dereceli etkilere sahip olmak gerekli değil, aynı zamanda görünüşte alakasız olan ana etkilerin de uygun şekilde (örneğin doğrusal olmayan olmasına izin veren) ana etkilerin olması önemlidir. ilgi etkileşimlerindeki faktörler. Bunun nedeni, ve arasındaki etkileşimlerin , ve ana etkileri için . Etkileşimlere bazen ihtiyaç duyuluyor gibi görünmektedir , çünkü bunlar ihmal edilen değişkenlerle ortaklaşadırlar ya da doğrusal olmayan (örneğin, spline) terimlerden kaçınılmıştır.x 2 x 3 x 4
Hiç geçerli olup olmadığını soruyorsun. Açıklanması sizin için ek analitik yaklaşımlar önerebilecek ortak bir örnek vereyim.
Bir etkileşimin en basit örneği, bir bağımlı değişken ve iki bağımsız değişken olan X , Y şeklinde bir modeldir
ile rastgele terimi değişken sıfır beklentisi olan ve parametreler kullanılarak α , β ' , γ ' , ve δ ' . Bu olmadığı kontrol genellikle faydalıdır δ ' yaklaşır P ' γ ' aynı modele ait bir cebirsel eşdeğer ifade çünkü,
( vb.).
Nereden, herhalde bir sebebi varsa , biz hata terimi bunu emebilir £ değerinin . Bu sadece “saf bir etkileşim” vermekle kalmaz, bunu sabit bir terim olmadan yapar . Bu sırayla logaritma yapmayı şiddetle önerir. Artıklarda bazı heteroscedastisite - yani, daha büyük Z değerleriyle ilişkili artıkların ortalamadan mutlak değerde daha büyük olma eğilimi - bu yöne işaret edecektir. Daha sonra alternatif bir formülasyon keşfetmek isteriz
id ile rasgele hata . Ayrıca, β X ve γ Y'nin 1'e göre daha büyük olmasını beklersek, bunun yerine sadece modeli öneriyoruz
Bu yeni model, önemli bir sadeleştirme olan ikinci dereceden bir ilişkiye ( δ ′ = β ′ γ ′ ) tabi olan dört parametre ( α , β ′ , vb.) sadece tek bir parametreye sahiptir .
Bunun gerekli veya hatta atılması gereken tek adım olduğunu söylemiyorum, ancak modelin bu tür bir cebirsel yeniden düzenlemenin genellikle etkileşimler tek başına önemli göründüğünde göz önünde bulundurmaya değer olduğunu düşünüyorum.
Tukey 13 - özellikle sadece iki ve üç bağımsız değişkenler, etkileşimi ile modellerini keşfetmek için bazı mükemmel yollar, bölümler 10 görünür EDA .
Ders kitaplarında çoğu zaman, bir modelde buna karşılık gelen ana etkileri olmayan bir etkileşimi içermemesi gerektiği belirtilirken, bunun kesinlikle mükemmel olacağı örnekler vardır. Size hayal edebileceğim en basit örneği vereceğim.
Rastgele iki gruba atanan süjelerin iki kere, bir kez başlangıçta (yani, randomizasyondan hemen sonra) ve bir kez T grubu bir çeşit tedavi gördükten sonra ölçülür, C grubu bunu yapmaz. Ardından, bu veriler için tekrarlanan ölçümler modeli, ölçüm vesilesi için temel bir etki (başlangıç için 0 ve takip için 1 olan bir kukla değişken) ve grup kukla (C için 0, T için 1) arasındaki etkileşim terimini içerir. ) ve zaman kukla.
Model kesişmesi daha sonra başlangıçta konuların ortalama puanını tahmin eder (içinde bulundukları grup ne olursa olsun). Ölçüm durum kuklaının katsayısı, kontrol grubundaki başlangıç ile takip arasındaki değişimi gösterir. Etkileşim terimi için katsayı, değişimin tedavi grubunda kontrol grubuna göre ne kadar büyük / küçük olduğunu gösterir.
Burada, grup için ana etkinin dahil edilmesi gerekli değildir, çünkü başlangıçta gruplar, randomizasyon nedeniyle tanım gereği eşdeğerdir.
Tabii ki, grubun ana etkisinin hala dahil edilmesi gerektiği söylenebilir, böylece randomizasyonun başarısız olması durumunda, bu analiz tarafından açıklanacaktır. Ancak, bu iki grubun temel araçlarının birbirine karşı test edilmesine eşdeğerdir. Ve randomize çalışmalarda temel farklılıkları test etmek için kaşlarını çattıran birçok insan var (elbette, onu faydalı bulmaya çalışan pek çok şey var, ama bu başka bir konudur).
Modeldeki ana etkileri korumanın nedeni tanımlanabilirlik içindir. Bu nedenle, amaç etkilerin her biri hakkında istatistiksel çıkarımsa, ana etkileri modelde tutmalısınız. Bununla birlikte, modelleme amacınız yalnızca yeni değerleri öngörmekse, öngörücü doğruluğu iyileştirirse yalnızca etkileşimi dahil etmek tamamen meşrudur.
bu, başkalarının vermiş olduğu cevapların çoğunda zımnidir ancak basit nokta, ürün terimi olmayan modellerin, moderatör ve öngörücü modelinin sadece farklı modellerdir. Anlamaya her vasıta neyi modellediğiniz süreci verildi ve bir model olup olmadığı w moderatör & belirleyicisi yapar o daha mantıklı teorinizi veya hipotezi verilen /. Ürün teriminin anlamlı olduğu ancak yalnızca moderatör ve tahminci dahil edilmediği gözlemi size hiçbir şey söylemez (belki de "önem" için balık avlıyor olmanız dışında), neden onları dışarıda bırakmanın mantıklı bir açıklaması olmadan .
Muhtemelen, modelinizi ne için kullandığınıza bağlıdır. Ancak, hipotezin yalnızca etkileşim ile ilgili olduğu durumlarda bile, ana etkilere sahip modelleri çalıştırmamak ve tarif etmemek için hiçbir neden görmedim.
Stata'yı kullanarak M.Cleves, R.Gutierrez, W.Gould, Y.Marchenko'nun Stata basını tarafından yazılan editörünü kullanarak sorunuzu cevaplamak için kitaptan bir paragraf ödünç alacağım .
Etkileşim etkilerinin yalnızca ilgili ana etkiler de dahil edildiğinde modele dahil edilmesi gerektiğini okumak yaygındır, ancak etkileşim etkilerini kendi başlarına dahil etmenin yanlış bir yanı yoktur. [...] Araştırmacının amacı, eldeki problemi göz önünde bulundurarak veriler için doğru olması muhtemel olanı parametreleştirmek ve sadece reçeteye uymamaktır.
Hem x hem de y , xy ile ilişkilendirilecektir (merkezlemeyi kullanarak bunu önlemek için belirli bir önlem almadıysanız). Bu nedenle, yaklaşımınızla önemli bir etkileşim etkisi elde ederseniz, muhtemelen bir etkileşim olarak gizleyen bir veya daha fazla ana etkiden kaynaklanır. Bu net, yorumlanabilir sonuçlar üretmeyecek. Arzu edilen, bunun yerine, etkileşimin, x , y ve (tercihen bir sonraki adımda) xy dahil olmak üzere, ana etkilerin ne ve üstünde ne kadar açıklayabileceğini görmektir .
Terminolojiye gelince: evet, β 0 “sabit” olarak adlandırılır. Öte yandan, “kısmi” nin regresyonda özel anlamları vardır ve bu yüzden bu terimi stratejinizi tanımlamak için kullanmam.
Mavi ayda bir kez ortaya çıkacak bazı ilginç örnekler bu başlıkta açıklanmaktadır .
Bunun sadece özel bir model belirsizlik durumu olduğunu söyleyebilirim. Bayes bakış açısına göre, bunu basitçe, herhangi başka bir belirsizlikle aynı şekilde ele alırsınız:
Bu, normal nicelikler yerine t-quantiles kullanarak insanların “önemli etkiler” testi yaparken tam olarak yaptığı şeydir. Çünkü "gerçek gürültü seviyesi" konusunda belirsizliğiniz olduğundan, testlerde daha yaygın bir dağıtım kullanarak bunu göz önünde bulundurursunuz. Yani sizin bakış açınızdan “ana etki” aslında sorduğunuz soru ile ilgili bir “sıkıntı parametresi” dir. Yani iki durumu (veya daha genel olarak düşündüğünüz modellere göre) ortalamanız yeterlidir. Bu yüzden (belirsiz) hipotezine sahip olurdum:
Bundan mth modelindeki hipotezin "şartlı sonucu" olduğunu (bu seçilmiş bir "en iyi" model için genellikle göz önünde bulundurulur. ). Bu standart analizin - bir "açıkça en iyi" model - veya - tüm modeller aynı / benzer sonuçları verir. Bununla birlikte, ikisi de karşılanmazsa, Bayes Teoremi, en iyi prosedürün, verilerin ve önceki bilgilerin en çok desteklediği modellere daha fazla ağırlık koyarak sonuçları ortalamak olduğunu söylüyor.P ( M m | D I ) ≈ 1 p ( H ı , n t | D M j I ) ≈ P ( H ı , n t | D M k ı )
İçinde yer alan temel etkiler olmadan bir etkileşim terimini dahil etmek çok nadiren iyi bir fikirdir. CCNY'den David Rindskopf, bu ender durumlar hakkında bazı yazılar yazdı.
Doğada sadece bir etkileşim etkisi ve bunları belirten yasalar içeren çeşitli süreçler vardır. Mesela Ohm kanunu. Psikolojide, örneğin Vroom'un (1964) performans modeline sahipsiniz: Performans = Yetenek x Motivasyon. Şimdi, bu yasa doğru olduğunda önemli bir etkileşim etkisi bulmayı bekleyebilirsiniz. Ne yazık ki, bu durum böyle değil. İki ana etki ve önemsiz bir etkileşim etkisi bulma ile kolayca sonuçlanabilirsiniz (bir gösteri ve daha fazla açıklama için bkz. Landsheer, van den Wittenboer ve Maassen (2006), Sosyal Bilimler Araştırması 35, 274-294). Doğrusal model, etkileşim etkilerini tespit etmek için çok uygun değildir; Ohm lineer modelleri kullandığında kanununu asla bulamayabilirdi.
Sonuç olarak, doğrusal modellerde etkileşim etkilerini yorumlamak zordur. Etkileşim etkisini öngören bir teoriniz varsa, önemsiz bile olsa eklemelisiniz. Teoriniz bunları dışlarsa, ana etkileri görmezden gelmek isteyebilirsiniz, ancak önemli çarpan etkileri çoğu zaman yalnızca çarpma etkisine sahip gerçek bir veri üretme mekanizması durumunda bulunduğundan bunu zor bulacaksınız.
Cevabım: Evet, ana etkileri dahil etmeden modele iki yönlü bir etkileşim eklemek geçerli olabilir. Doğrusal modeller, çok çeşitli veri üretme mekanizmalarının sonuçlarını tahmin etmek için mükemmel araçlardır, ancak formülleri veri üretme mekanizmasının geçerli bir açıklaması olarak kolayca yorumlanamaz.
Bu zor ve son projemde başıma geldi. Bunu şu şekilde açıklardım: bağımsız bir şekilde ortaya çıkan A ve B değişkenlerine sahip olduğunuzu ve iş anlamında A ve B etkileşiminin iyi göründüğünü düşündüğünüzü söyleyelim. Önemli olduğu ortaya çıkan etkileşimi dahil ettiniz, ancak B önemini yitirdi. Modelinizi başlangıçta iki sonuç göstererek açıklarsınız. Sonuçlar başlangıçta B'nin anlamlı olduğunu ancak A ışığında görüldüğünde parlaklığını kaybettiğini gösterecektir. Bu nedenle, B iyi bir değişkendir, ancak yalnızca A farklı düzeylerde (A kategorik bir değişkense) görüldüğünde görülür. Obama, SEAL ordusunun ışığında göründüğü zaman iyi bir lider olduğunu söylüyor. Yani Obama * mühür önemli bir değişken olacak. Ancak, Obama yalnız görüldüğü kadar önemli olmayabilir. (Obama'ya alınma, sadece bir örnek.)
F = m * a, kuvvet kütle çarpımı ivmelenmesine eşittir.
F = m + a + ma veya bu parametrelerin diğer bazı doğrusal kombinasyonları ile temsil edilmez. Gerçekten de, yalnızca kütle ve ivme arasındaki etkileşim fiziksel olarak mantıklı olacaktır.
Asıl etkisi olmayan iki yönlü bir etkileşimi eklemek hiç geçerli mi?
Evet geçerli ve hatta gerekli olabilir. Örneğin 2.'de, ana etki için bir faktör dahil edersiniz (mavi ile kırmızı durumun ortalama farkı) bu, modeli daha da kötüleştirir.
Peki ya hipoteziniz sadece etkileşim ile ilgiliyse, yine de ana etkileri dahil etmeniz gerekiyor mu?
Hipoteziniz, orada ana etkiye bağlı olarak bağımsız olabilir. Ancak, modelin altında yatan süreci en iyi şekilde tanımlaması gerekebilir. Yani evet, denemeli ve denemelisin.
Not: "Sürekli" bağımsız değişken için kodu ortalamanız gerekir (örnekte ölçüm). Aksi takdirde modeldeki etkileşim katsayıları simetrik olarak dağılmayacaktır (örnekteki ilk ölçüm için katsayı yok).
Söz konusu değişkenler kategorikse, o zaman ana etkileri olmayan etkileşimleri dahil etmek, modelin yalnızca bir yeniden ölçülmesidir ve parametre seçimi, modelinizle ne yapmaya çalıştığınıza bağlıdır. Sürekli değişkenlerin diğer sürekli değişkenlerle etkileşimi, kategorik değişkenlerle olan cevher tamamen farklı bir hikayedir. Bakınız: bu skalayı UCLA'nın Dijital Araştırma ve Eğitim Enstitüsü'nden gör.
Evet, nadir olsa da bu geçerli olabilir. Ancak bu durumda, daha sonra gerileyeceğiniz temel etkileri modellemeniz gerekir.
Aslında, bazı modellerde, ilaç testi / klinik modeller gibi yalnızca etkileşim ilginçtir. Bu, örneğin Genelleştirilmiş Psikofizyolojik Etkileşimler (gPPI) modelinin temelidir: y = ax + bxh + ch
nerede x/y
voksel / ilgilenilen bölgeler ve h
blok / olay tasarımları.
Bu modelde, hem a
ve c
dışarı geriledi olacak sadece b
çıkarsama (beta katsayıları) için tutulacaktır. Gerçekten de, hem a
ve c
bizim durumumuzda sahte aktiviteyi temsil eder ve yalnızca b
sahte aktivite, görev ile etkileşim ile izah edilemez neyi temsil eder.
Kısa cevap: Sabit efektlere etkileşim eklerseniz, ana efektler kodunuza özel olarak dahil edilip edilmediğiniz otomatik olarak dahil edilir . Tek fark parametreleme, yani modelinizdeki parametrelerin ne anlama geldiğidir (örneğin grup mu demek veya referans seviyelerinden farklı mı)?
Az önce David Beede'nin çok benzer bir cevap verdiğini gördüm (özür dilerim), ancak lineer cebir perspektifine iyi cevap verenler için bunu bırakacağımı düşündüm.