Aynı veri kümesinde iki doğrusal model çalıştırmak kabul edilebilir mi?


10

Birden fazla grup içeren doğrusal regresyon için (a priori olarak tanımlanan doğal gruplar), aşağıdaki iki soruyu cevaplamak için aynı veri setinde iki farklı model çalıştırmak kabul edilebilir mi?

  1. Her grupta sıfır olmayan bir eğim ve sıfır olmayan kesişme var mı ve grup regresyonu içindeki parametreler nelerdir?

  2. Grup üyeliğine bakılmaksızın, sıfır olmayan bir eğilim ve sıfır olmayan kesişme var mıdır ve gruplar regresyonunda bunun parametreleri nelerdir?

R'de, ilk model lm(y ~ group + x:group - 1), tahmin edilen katsayıların doğrudan her grup için kesişme ve eğim olarak yorumlanabilmesi için ikinci model olacaktır lm(y ~ x + 1).

Alternatif lm(y ~ x + group + x:group + 1), katsayıların karmaşık bir özet tablosuyla sonuçlanan, grup içi eğimler ve kesişimlerin bazı referanslardan gelen eğimler ve kesişimler arasındaki farklardan hesaplanması gerektiğidir. Ayrıca, son grup farkı (bazen) için bir p değeri elde etmek için grupları yeniden sıralamanız ve modeli ikinci kez çalıştırmanız gerekir.

İki ayrı model kullanarak bu, çıkarımı herhangi bir şekilde veya bu standart uygulamayı olumsuz yönde etkiliyor mu?

Bunu bağlama koymak için x'in bir ilaç dozu ve grupların farklı ırklar olduğunu düşünün. Bir doktor için belirli bir ırk için doz-cevap ilişkisini bilmek ilginç olabilir veya ilacın hiç işe yaramadığı, ancak bazen tüm (insan) popülasyon için doz-cevap ilişkisini bilmek de ilginç olabilir. bir halk sağlığı görevlisi için yarış ne olursa olsun. Bu sadece grup içinde ve grup gerilemelerinde nasıl ayrı ayrı ilgilenilebileceğinin bir örneğidir. Bir doz-yanıt ilişkisinin doğrusal olup olmayacağı önemli değildir.


Doğrusal regresyonları kullanmak istediğinizden emin misiniz? Doz-tepki ilişkileri neredeyse hiçbir zaman önemli bir doz aralığında doğrusal değildir.
Michael Lew

@Michael, üzgünüm, bu kötü bir örnekti, sanırım. Bunu genel olarak merak ediyorum. Doz-yanıt ilişkilerinin ayrıntıları engellenmemelidir. Bunu not etmek için soruyu düzenledim.
Jdub

Rastgele bir kesişim, rastgele eğim modeli düşündünüz mü?
varsayılan

Yanıtlar:


2

İlk sorunuzun ve ilk R modelinizin birbiriyle uyumsuz olduğunu düşündüğümü söyleyerek başlayayım. R, biz, ya bir formül geç zaman -1ya da +0biz kesişme bastırırlar. Böylece, kesişmelerin 0'dan önemli ölçüde farklı olup olmadığını söyleyebilmenizi lm(y ~ group + x:group - 1) engeller . Aynı damarda, aşağıdaki iki modelinizde, +1gereksizdir, kesişme otomatik olarak R'de tahmin edilir. Referans hücre kodlamasını ( gruplarını temsil etmek için 'kukla kodlama' olarak da adlandırılır). Yani gruplarıylagg1yeni değişkenleri varsayılan olarak bir grup seçin ve yeni değişkenlerin her birinde o grubun birimlerine 0'lar atayın. Daha sonra her yeni değişken, diğer gruplardan birine üyeliği temsil etmek için kullanılır; belirli bir grup içinde yer alan birimler, karşılık gelen değişkente bir 1 ve başka bir yerde 0'lar ile gösterilir. Katsayılarınız döndürüldüğünde, kesişme 'anlamlı' ise, varsayılan grubunuz sıfırdan farklı bir kesişmeye sahiptir. Ne yazık ki, diğer gruplar için standart anlamlılık testleri, 0'dan farklı olup olmadıklarını değil, varsayılan gruptan farklı olup olmadıklarını size söyleyecektir. 0'dan farklı olup olmadıklarını belirlemek için katsayılarını kesmeye ekleyin ve t-değerlerini almak için toplamı standart hatalarına bölün. Eğimli durum benzer olacaktır: Yani, testiXvarsayılan grubun eğiminin 0'dan önemli ölçüde farklı olup olmadığını ve etkileşim koşullarının bu grupların eğimlerinin varsayılan gruplardan farklı olup olmadığını gösterir. Diğer grupların 0'a karşı eğimleri için testler, tıpkı kesişmeler gibi yapılabilir. Daha da iyisi, grup gösterge değişkenleri veya etkileşim terimleri olmadan 'kısıtlı' bir modele uymak ve bu modeli tam modelle test etmek anova(), böylece gruplarınızın anlamlı bir şekilde farklı olup olmadığını söyleyecektir.

Bu şeyler söylendi, asıl sorunuz tüm bunları yapmanın kabul edilebilir olup olmadığıdır . Buradaki temel sorun çoklu karşılaştırmalar sorunudur . Bu, uzun süredir devam eden ve çok fikirli bir konu. ( Bu anahtar kelime ile etiketlenmiş soruları inceleyerek CV hakkında bu konu hakkında daha fazla bilgi bulabilirsiniz .) Bu konu hakkında görüşler kesinlikle değişse de, analizlerin dikey olması şartıyla, hiç kimse aynı veri seti üzerinde birçok analiz yürütmekten dolayı hata yapmaz. . Genel olarak, bir grup grubunun birbiriyle nasıl karşılaştırılacağını bulmak bağlamında dik kontrastlar düşünülür.gancak burada durum böyle değil; sorunuz alışılmadık (ve bence ilginç). Görebildiğim kadarıyla, veri kümenizi ayrı alt kümelere bölmek ve her biri üzerinde basit olması gereken basit bir regresyon modeli çalıştırmak istiyorsanız. Daha ilginç olan soru, 'çökmüş' analizin bireysel analiz kümesine dik olarak değerlendirilip değerlendirilemeyeceğidir; Ben öyle düşünmüyorum, çünkü çökmüş analizi grup analizlerinin doğrusal bir kombinasyonuyla yeniden oluşturabilmelisiniz. g

Biraz farklı bir soru, bunu yapmanın gerçekten anlamlı olup olmadığıdır. Bir başlangıç ​​analizi yaptığınız ve grupların birbirlerinden oldukça anlamlı bir şekilde farklı olduğunu keşfettiğiniz görüntü; bu ıraksak grupları bir araya getirilmiş bir bütün haline getirmenin ne anlamı var? Örneğin, gruplar, en azından, o zaman, onların yakaladığını üzerinde (her nasılsa) farklılık hayal bazı grup değil bir 0 yakalamayı var. Eğer böyle bir grup varsa, o zaman tüm grup için kesişme sadece o grup ilgili popülasyonda ise olur. Alternatif olarak, bir pozitif ve bir negatif ile sıfır olmayan kesişme ile tam olarak 2 grup olduğunu söyleyelim, o zaman bütün 0ng=0nBu gruplardan, kesişenlerin ıraksamalarının büyüklükleri ile ters orantılıdır. Burada devam edebilirim (çok daha fazla olasılık var), ama asıl nokta, grup boyutlarının parametre değerlerindeki farklarla nasıl ilişkili olduğu hakkında sorular sormanız. Açıkçası, bunlar bana garip sorular.

Yukarıda özetlediğim protokolü izlemenizi öneririm. Yani, kukla gruplarınızı kodlayın. Ardından, tüm mankenleri ve etkileşim terimlerini içeren tam bir model takın. Bu terimler olmadan azaltılmış bir model takın ve iç içe bir model testi yapın. Gruplar bir şekilde farklıysa, grupların nasıl farklılaştığını daha iyi anlamak için (umarım) a-priori (teorik olarak yönlendirilen) dik kontrastları takip edin. (Ve arsa - her zaman, her zaman arsa.)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.