Bir regresyonda, etkileşim terimi, her iki ilişkili doğrudan etkiyi de ortadan kaldırır. Etkileşimi düşürür mü yoksa sonucu bildirir miyim? Etkileşim, orijinal hipotezin bir parçası değildi.
Bir regresyonda, etkileşim terimi, her iki ilişkili doğrudan etkiyi de ortadan kaldırır. Etkileşimi düşürür mü yoksa sonucu bildirir miyim? Etkileşim, orijinal hipotezin bir parçası değildi.
Yanıtlar:
Bence bu biraz zor; Tahmin ettiğiniz gibi, burada 'ahlaki bir tehlike' var: etkileşime hiç bakmamış olsaydınız, özgür ve net olursunuz, ama şimdi bıraktığınızda veri tarama şüphesi var.
Anahtar, muhtemelen sadece ana etkilerden sadece etkileşim modeline geçtiğinizde etkilerin anlamındaki bir değişikliktir. 'Ana etkiler' için elde ettiğiniz şey, tedavilerinizin ve kontrastlarınızın nasıl kodlandığına çok bağlıdır. R'de varsayılan tedavidir; temel seviyeler olarak ilk faktör seviyelerine (farklı şekilde kodlama yolundan çıkmazsanız, alfabetik sıradaki ilk isimleri olanlara) olanlarla kontrasttır.
Diyelim ki (basitlik için), her bir faktör için iki seviyeye, "kontrol" ve "trt" deyin. Etkileşim olmadan, 'v1.trt' parametresinin anlamı (tedavinin R'nin varsayılanı olduğu varsayılırsa) "'v1.control' ile 'v1.trt' grubu arasındaki ortalama fark ''; 'v2.trt' parametresinin anlamı '' v2.control 've' v2.trt 'arasındaki ortalama farktır.
Etkileşimde, 'v1.trt', 'v1.control' grubunda 'v1.control' ve 'v1.trt' arasındaki ortalama farktır ve benzer şekilde 'v2.trt', v2 grupları arasındaki ortalama farktır. 'v1.control' grubu. Bu nedenle, kontrol gruplarının her birinde oldukça küçük bir tedavi etkisine sahipseniz, ancak tedavi gruplarında büyük bir etkiye sahipseniz, ne gördüğünüzü kolayca görebilirsiniz.
Bununla birlikte, anlamlı bir etkileşim terimi olmadan bunu görebilmemin tek yolu , tüm etkilerin oldukça zayıf olmasından kaynaklanıyor (yani, "kaybedilen etki" ile gerçekten ne demek istediğinizi p = 0.06'dan p = 0.04'e gitmiş olmanız) sihirli önem çizgisi boyunca).
Diğer bir olasılık, 'çok fazla serbestlik derecesi kullanıyor olmanızdır' - yani parametre tahminleri aslında çok fazla değişmez, ancak artık hata terimi, başka bir 4 tahmin etmek zorunda kalarak yeterince şişirilir [= (2- 1) * (5-1)] önemli terimlerinizin önemsiz hale geldiği parametreler. Yine, bunu sadece küçük bir veri seti / nispeten zayıf etkiler ile beklerdim.
Olası bir çözüm, her ne kadar hassas olsa da, kontrastları toplamak için hareket etmektir - 'ortalama etkinin' sizin durumunuz için anlamlı olduğuna ikna olmalısınız. En iyisi verilerinizi çizmek ve katsayılara bakmak ve tahmin edilen parametreler açısından neler olduğunu anlamaktır.
Umarım yardımcı olur.
Değişkenlerin uygun şekilde ifade edildiğinden emin misiniz? İki bağımsız değişken ve X 2'yi göz önünde bulundurun . Problem bildirimi formda formda olduğunuzu iddia ediyor
Kalıntıların varyansının ile arttığına dair bazı kanıtlar varsa , o zaman daha iyi bir model, bir formu olan çarpma hatasını kullanır.
Bu yeniden yazılabilir
yani, değişkenlerinizi formda tekrar ifade ederseniz
o zaman model doğrusaldır ve muhtemelen homoscedastik kalıntıları vardır:
Bu analiz, bazı uygulamalarda bile muhtemel olsa bile, tek etkilerin etkileşimler olarak göründüğü bir modele sahip olmanın nasıl mümkün olduğunu göstermektedir. Bu değişkenler (bağımsız, bağımlı veya her ikisi) size uygun olmayan bir formda sunulduğunda ve logaritmaları modelleme için daha etkili bir hedef olduğunda ortaya çıkar. Değişkenlerin ve ilk artıkların dağılımları, durumun böyle olup olmadığını belirlemek için gerekli olan ipuçlarını sağlar: Değişkenlerin eğri dağılımları ve artıkların heterosistemikliği (özellikle öngörülen değerlerle kabaca orantılı değişkenlere sahip) göstergelerdir.
Bu, tipik olarak, her ikisi de orijinal değişkenlerle güçlü bir şekilde ilişkili olacağından, tipik olarak yüksek çoklu doğrusallığa neden olur. Çoklu doğrusal bağlantıda, bireysel parametre tahminleri, sizin durumunuzdaki gibi diğer değişkenlerin dikkate alındığına bağlıdır. Bir karşı ölçü olarak, değişkenlerin merkezlenmesi, etkileşim göz önüne alındığında genellikle çoklu doğrusallığı azaltır.
Kategorik kestiricilere sahip olduğunuz, ancak "ANOVA" yerine "regresyon" terimini kullandığınız için bu durumun doğrudan sizin için geçerli olup olmadığından emin değilim. Tabii ki ikinci durum esasen aynı modeldir, ancak sadece Ben'in açıkladığı gibi kontrast kodlama şemasını seçtikten sonra.
Bu, bir yorumlama sorunu olabilir, “doğrudan etki” katsayısının gerçekte ne olduğunun yanlış anlaşılması olabilir.
Sürekli yordayıcı değişkenleri olan ve etkileşim terimleri olmayan regresyon modellerinde - yani, diğer terimlerin ürünü olarak yapılan terimler olmadan - her değişkenin katsayısı, regresyon yüzeyinin bu değişken yönündeki eğimidir. Değişkenlerin değerlerinden bağımsız olarak sabittir ve açıkça bu değişkenin etkisinin bir ölçüsüdür.
Etkileşimleri olan modellerde - yani, diğer terimlerin ürünleri olarak yapılan terimlerle - bu yorumlamanın yalnızca herhangi bir etkileşime dahil olmayan değişkenler için daha fazla nitelik olmadan yapılabilir . Etkileşimde yer alan bir değişkenin katsayısı , söz konusu değişkenle etkileşime giren tüm değişkenlerin değerleri sıfır olduğunda ve katsayının önem testi, regresyon yüzeyinin eğimi, yalnızca yordayıcı boşluğunun bu bölgesinde. Alanın o bölgesinde gerçekte veri bulunma zorunluluğu olmadığı için, görünen doğrudan etki katsayısı, verilerin gerçekte gözlemlendiği yordam boşluğu bölgesindeki regresyon yüzeyinin eğimine çok az benzerlik gösterebilir. Bu gibi durumlarda gerçek bir "doğrudan etki" yoktur; En iyi alternatif muhtemelen "ortalama etki" dir: regresyon yüzeyinin, söz konusu değişken yönündeki eğimi, her veri noktasında alın ve tüm veri noktalarının ortalaması alın. Bununla ilgili daha fazla bilgi için, bkz. Neden bağımsız değişkenleri merkezlemek, temel etkilerini ılımlılıkla değiştirebilir?