Basit doğrusal regresyon sonuçlarının raporlanması: hangi bilgiler dahil edilmelidir?


11

Genstat'ta bazı (çok) basit doğrusal regresyon gerçekleştirdim ve raporumdaki çıktının özlü ve anlamlı bir özetini eklemek istiyorum. Tam olarak ne veya ne kadar bilgi içermem gerektiğinden emin değilim.

Genstat çıkışımın ana bitleri şöyle görünür:

Summary of analysis 
Source      d.f.    s.s.       m.s.       v.r.    F pr.
Regression    1   8128935.   8128935.    814.41   <.001
Residual     53    529015.      9981.        
Total        54   8657950.    160332.        

Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.

Estimates of parameters 
Parameter    estimate    s.e.     t(53)   t pr.
Constant      41.5      30.7       1.35   0.182
UKHR_Ref       0.8659    0.0303   28.54   <.001

Bunu basitçe şöyle bildirmeyi düşünüyordum:

Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).

ancak bir meslektaşım da en azından root mean squared error(bu durumda gözlemlerin standart hataya eşit olduğuna inanıyorum) yani 99.9?

RMSE dahil olmak üzere ek faydalı bilgiler sunuyor mu?

Ne kadar bilgi rapor edileceğine dair zor ve hızlı kurallar var mı, yoksa oldukça öznel mi?

Çok teşekkürler!


1
"Ne kadar bilgi rapor edileceğine dair zor ve hızlı kurallar var mı" - bu gerçekten regresyondan sonra ne yapmak istediğinize bağlıdır. Kişi sadece korelasyon katsayısından memnun olabilir; bunun üzerinde Durbin-Watson değerine ihtiyaç duyulabilir ve yine de diğeri şapka matrisinin köşegenini görmek isteyebilir ... bu gerçekten bağlıdır.
JM bir istatistikçi değil

2
Bazı kuruluşların kuralları vardır. Örneğin APA yönergelerine bakın .
whuber

Yanıtlar:


6

Basit bir doğrusal regresyon için, her zaman y değişkenine karşı x değişkeninin bir grafiğini, grafiğe süper empoze edilen regresyon çizgisini üretirim (her zaman verilerinizi mümkün olduğunda çizin!). Bu, modelinizin ne kadar iyi uyduğunu ve 1 değişken regresyon için okunması kolay olduğunu söyleyecektir. Bazı teşhis alanlarını (kaldıraç, aşçı mesafesi, artıklar, vb.) Dahil etmek isteyebilirsiniz, ancak zaten sahip olduğunuza eklemek muhtemelen yeterli olacaktır. Bu, xy grafiğinin ne kadar iyi olduğuna ve hedeflediğiniz kitleye ve kitlenizin beklediği tüm protokollere bağlıdır.

R,2 ve RMSE karşılaştırması

± ± 2 R ' 2R,2 göreceli bir ölçüttür, ancak RMSE daha mutlak bir ölçüttür, çünkü çoğu gözlemin takılan çizgiden RMSE içinde olmasını ve neredeyse hepsinin RMSE içinde olmasını beklersiniz. "Açıklayıcı güç" iletmek istiyorsanız muhtemelen daha iyidir ve "tahmini güç" iletmek istiyorsanız, RMSE muhtemelen daha iyidir.±±2R,2


Teşekkürler @probabilityislogic. Raporuma bir komplo ekledim ve kulağa böyle geliyor ve bu durumda orijinal cümlenin yeterli olması gerekiyor. Bence kendimi kontrol ettim ve makul görünseler de, teşhis planları dahil etmenin bu kitle için muhtemelen gereksiz olduğunu düşünüyorum. R2 ve RMSE'nin açıklaması için de teşekkürler - çok yararlı.
JamesS

T-değerleri ve df (ler) ne olacak? Bunlar ne zaman dahil edilmelidir? Bu bölüm her iki içerecek şekilde mantıklı mı yoksa ne?
natty hakkında ceviz

1

Ben β katsayısı artı% 95 CI, p değeri ve ayarlanmış Rsquared bildirmek için kullanın. Ör:

(β = 1.46,% 95 CI [1.19, 1.8], p = 0.001 **, ayarlanmış R2 = 0.48)

Birden fazla regresyon veya faktör değişkenli bir regresyon bildiriyorsanız, katsayıyı,% 95 CI, p değerlerini ve daha sonra ayrı ayrı F (serbestlik derecesi) istatistiklerini, ayarlanmış R2'yi ve modelin p değerini bildiririm.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.