çoklu doğrusal regresyonda p-değerinin anlaşılması


12

Çoklu doğrusal regresyon analizinin p değeri ile ilgili olarak, Minitab'ın web sitesinden giriş aşağıda gösterilmiştir.

Her terim için p değeri, katsayının sıfıra eşit olduğu sıfır hipotezini test eder (etki yok). Düşük bir p değeri (<0.05), sıfır hipotezini reddedebileceğinizi gösterir. Diğer bir deyişle, düşük bir p değerine sahip bir öngörücünün modelinize anlamlı bir ekleme olması muhtemeldir, çünkü öngörücünün değerindeki değişiklikler yanıt değişkenindeki değişikliklerle ilgilidir.

Örneğin, elde edilen bir MLR modelim var . ve dışarı koymak aşağıda gösterilmiştir. Daha sonra bu denklem kullanılarak bir y hesaplanabilir.y=0,46753X1-0,2668X2+1,6193X3+4,5424X4+14.48y

            Estimate      SE        tStat       pValue  
               ________    ______    _________    _________

(Intercept)      14.48     5.0127       2.8886    0.0097836
x1             0.46753     1.2824      0.36458      0.71967
x2             -0.2668     3.3352    -0.079995      0.93712
x3              1.6193     9.0581      0.17877      0.86011
x4              4.5424     2.8565       1.5902       0.1292

X4y2=0,46753X1-0,2668X2+1,6193X3+0X4+14.48yy2X4

Herkes doğru anlayışa yardımcı olabilir mi? Çok teşekkürler!


regresyon rutininin çıktısını gösterebilir misiniz?
Aksakal

P-değeri hesaplama açıklamanız standart değildir. Sizce neden tarif ettiğiniz şekilde hesaplanmalıdır? Çıktıdaki p-değeri, Var-Cov parametre matrisinden hesaplanır. Wald gibi kısıtlama testini yapmak istiyorsanız, tarif ettiğiniz gibi değildir. Modeli 3 değişkenle yeniden tahmin etmeniz, mantıksallık vb. Almanız gerekir
Aksakal

1
Bu girişe göre, sadece bir "önemli" değişkeniniz var - "kesişme" - çünkü sadece p değeri küçüktür. Tırnaktaki naif ve yanıltıcı uygulamanın ötesine geçmek için çoklu regresyon hakkında daha fazla bilgi edinmeniz gerekir. Bu konuda neler öğrenilebileceğini görmek için sitemizdeki ilgili konuları araştırmayı düşünün .
whuber

2
Bu iki sorunun yanıtlarını kontrol edin: - stats.stackexchange.com/questions/5135/… ve - stats.stackexchange.com/questions/126179/… P değerlerinin nasıl hesaplandığını anlamama yardımcı oldular, umarım bunları bulacaksınız yararlı.
Giacomo

Yanıtlar:


7

Bu birkaç nedenden dolayı yanlıştır:

  1. "Olmadan" X4 modeli, diğer değerler için mutlaka aynı katsayı tahminlerine sahip olmayacaktır. İndirgenmiş modeli takın ve kendiniz görün.

  2. Y

  3. Katsayının istatistiksel önemi için yapılan istatistiksel test bir örnek t-testidir. X4 için çoklu katsayıların bir "örneğine" sahip olmadığımız için bu kafa karıştırıcıdır, ancak merkezi limit teoremini kullanarak böyle bir örneğin dağılım özelliklerine dair bir tahminimiz vardır. Ortalama ve standart hata, böyle bir sınırlama dağılımının yerini ve şeklini tanımlar. "Est" sütununu alıp "SE" ile bölüp standart normal dağılımla karşılaştırırsanız, bu size 4. sütundaki p değerlerini verir.

  4. Dördüncü nokta: minitab'ın yardım sayfasına yönelik bir eleştiri. Böyle bir yardım dosyası, bir paragrafta yıllarca süren istatistiksel eğitimi özetleyemedi, bu yüzden her şeye karşı çıkmam gerekmiyor. Ancak, bir "yordayıcı" nın "önemli bir katkı" olduğunu söylemek belirsiz ve muhtemelen yanlıştır. Çok değişkenli bir modele hangi değişkenlerin dahil edileceğinin seçilmesinin mantığı incedir ve istatistiksel akıl yürütmeye değil bilimsel akıl yürütmeye dayanır.


0

İlk p-değerleri yorumunuz doğru görünüyor, yani sadece kesişme noktasının 0'dan önemli ölçüde farklı bir katsayısı var. 0'dan farklı.

Y1 ve y2'nin eşleştirilmiş t testiniz, modellerin birbirinden farklı olduğunu gösterir. Bu beklenecek, bir modelde modelinize biraz katkıda bulunan büyük ama kesin olmayan bir katsayı eklediniz. Bu modellerin p-değerinin birbirinden farklı olduğunu düşünmek için hiçbir neden yoktur, x4 katsayısının p-değerinin 0'dan farklı olması gerekir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.