İki doğrusal regresyon modelinin karşılaştırılması


12

Bir mRNA'nın zaman içinde iki farklı koşulda bozunma hızlarını temsil eden iki doğrusal regresyon modelini karşılaştırmak istiyorum. Her model için veriler bağımsız olarak toplanmıştır.

İşte veri seti.

Zaman (saat) günlüğü (Tedavi A) günlüğü (tedavi B)
0 2.02 1.97
0 2.04 2.06
0 1.93 1.96
2 2.02 1.91
2 2.00 1.95
2 2.07 1.82
4 1.96 1.97
4 2.02 1.99
4 2.02 1.99
6 1.94 1.90
6 1.94 1.97
6 1.86 1.88
8 1.93 1.97
8 2.12 1.99
8 2.06 1.93
12 1.71 1.70
12 1.96 1.73
12 1.71 1.76
24 1.70 1.46
24 1.83 1.41
24 1.62 1.42

Bunlar benim modellerim:

Exp1.A.lm<-lm(Exp1$Time~Exp1$(Treatment A))
Exp1.B.lm<-lm(Exp1$Time~Exp1$(Treatment B))
Aramak:
lm (formül = Exp1 $ Zaman ~ Exp1 $ (Tedavi A))

Yüzeyde kalan:
    Min 1Q Medyan 3Q Max 
-6.8950 -1.2322 0.2862 1.2494 5.2494 

katsayılar:
                   Tahmin Std. Hata t değeri Pr (> | t |)    
(Kesişim) 74.68 6.27 11.91 2.94e-10 ***
Exp1 $ (Tedavi A) -36.14 3.38 -10.69 1.77e-09 ***
---
Signif. kodlar: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1

Kalan standart hata: 19 serbestlik derecesinde 2,97
Çoklu R kare: 0.8575, Düzeltilmiş R kare: 0.85 
F-istatistiği: 1 ve 19 DF'de 114.3, p değeri: 1.772e-09

Aramak:
lm (formül = Exp1 $ Zaman ~ Exp1 $ (Tedavi B))

Yüzeyde kalan:
   Min 1Q Medyan 3Q Max 
-7.861 -3.278 -1.444 3.222 11.972 

katsayılar:
                      Tahmin Std. Hata t değeri Pr (> | t |)    
(Kesme Noktası) 88.281 16.114 5.478 2.76e-05 ***
Exp1 $ (Tedavi B) -41.668 8.343 -4.994 8.05e-05 ***
---
Signif. kodlar: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1

Kalan standart hata: 19 serbestlik derecesinde 5.173
Çoklu R kare: 0.5676, Düzeltilmiş R kare: 0.5449 
F-istatistiği: 1 ve 19 DF'de 24.94, p değeri: 8.052e-05

Bu iki modeli karşılaştırmak için şu kodu kullandım.

anova(Exp1.A.lm,Exp1.B.lm)
Varyans Analizi Tablosu

Model 1: Exp1 $ Zaman ~ Exp1 $ Exp1 $ (Tedavi A)
Model 2: Exp1 $ Zaman ~ Exp1 $ Exp1 $ (Tedavi B)
  Res.Df RSS Df Sq F Pr Toplamı (> F)
1 19 167.60                      
2 19 508,48 0 -340,88

Benim sorum ANOVA analizinin neden F istatistiği ve p.val göstermediğidir. Bu naif bir soru ise özür dilerim.

Farklı eğimlere dayanarak, bu iki modelde bozulma oranı farklıdır, ancak bu farkın istatistiksel olarak ne kadar önemli olduğunu bilmek istiyorum. Umarım bu mantıklıdır.


2
ANOVA tablosunun analizle ilişkili serbestlik derecelerini 0 olarak listelediğini fark edebilirsiniz ; her iki modelde de aynı sayıda değişkene sahipsiniz, bu nedenle F veya p değerlerinin hesaplanamamasının nedeni budur.
gung - Monica'yı

5
Uyum iyiliğini kontrol edene kadar bu modelleri karşılaştırmak zahmet etmem. Sanırım ikincisinde ne tepki ne de logaritmasının zamanın doğrusal işlevleri olmadığını göreceksiniz. Bu, eğim tahminlerinin karşılaştırılmasını (ciddi olarak) sorgulamaktadır.
whuber

Yanıtlar:


11

Verileri A ve B ile uzun bir sütunda yeni bir sütun olarak ayarlarsanız, regresyon modelinizi sürekli zaman değişkeni ve nominal "deney" değişkeni (A, B) ile bir GLM olarak çalıştırabilirsiniz. ANOVA'nın çıktısı size parametreler arasındaki farkın önemini verecektir. "kesişme" ortak kesişimdir ve "deney" faktörü, deneyler arasındaki kesişmeler arasındaki farkları (aslında genel araçlar) yansıtır "Zaman" faktörü, ortak eğim olacaktır ve etkileşim, deneyler arasındaki farktır. eğim.

İtiraf etmeliyim ki hile (?) Ve iki parametre setini ve hatalarını almak için modelleri ayrı ayrı çalıştırmalı ve sonra tedaviler arasındaki farkları elde etmek için kombine modeli çalıştırmalıyım (sizin durumunuz A ve B'de) ...


3
Bu akıllıca bir yaklaşım. "Hile" yaptığınızda, hata varyanslarının her modelde yaklaşık olarak aynı olduğunu kontrol ediyor musunuz? Ve önemli ölçüde farklı görünüyorlarsa, bu önerilerinizi nasıl etkiler?
whuber

Bu GLM iyi bir yaklaşımdır ve verileri araştırmak için ayrı modeller takmak, deneyler arasındaki hata farkını değerlendirmenin iyi bir yoludur. Biri gerçekten endişeliyse, GLM modelini, tüm deneysel veriler için ortak bir hata varyansının dolaylı varsayımı yerine gruba özgü hata varyanslarını içerecek şekilde genişletebilirler.
prince_of_pears

Akla gelen başka bir şey, OP'nin deneyler arasındaki bozulma oranlarının birbirinden basit olup olmadığı (mutlak oranı göz ardı ederek) veya bu oranların da istatistiksel olarak (veya pratik olarak) sıfırdan farklı olup olmadığıyla ilgilenip ilgilenmediğidir. Birincisi, tedavi ve zaman arasındaki etkileşim katsayısının sıfıra eşit olduğu hipotezinin bir testidir. İkincisi, her oranın sıfırdan farklı olduğu iki ayrı test (veya bir ortak hipotez testi) yapmaktır. İlkinden önce ikincisini test etmekle daha fazla ilgilenebilirim.
prince_of_pears

5

Her iki model de aynı serbestlik derecesine (yani 19) sahip olduğu için ANOVA analizi bir F istatistiği ve bir p değeri göstermez ve farkı alırsanız sıfır olur! F testini gerçekleştirmek için farkı aldıktan sonra en az bir serbestlik derecesi olmalıdır.


Cevabınızı anladığımdan emin değilim. Kalan serbestlik derecelerinin eşit olması için bir neden var mı? Eğimleri karşılaştırmak için alternatif bir yaklaşım önerisi var mı?
Rooz

n=21(TreatmentA)orExp1dfT=n1=20dfT=dferror+dfregressorsdferror=19

Bunları F-testi dışında karşılaştırmanın birçok yolu vardır. En kolay olanı, özetlerdeki gibi Çoklu R-kare ve Ayarlanmış R-kare kullanmaktır. Daha yüksek R-kare veya Düzeltilmiş R-kare olan model daha iyidir. Burada daha iyi model Exp1 $ (Tedavi A) olan model gibi görünüyor. Ancak, monte edilen modelin yeterliliğini kontrol etmek için modelinizin kalıntılarını kontrol etmeniz gerektiğini unutmayın. Şahsen sadece R-kare kriterlerine güvenmenizi önermiyorum ve doğrusal modeldeki diğer varsayımları da kontrol etmelisiniz. Özellikle kalıntıların otokorelasyonlu olup olmadığına bakın.
Stat
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.