Tahmin edicilerin çoklu regresyonda önemi: Kısmi ve standart katsayılar


21

Kısmi ile katsayılar arasındaki doğrusal ilişkinin tam ilişkisinin ne olduğunu ve faktörlerin önemini ve etkisini göstermek için yalnızca birini mi yoksa ikisini mi kullanmam gerektiğini merak ediyorum .R,2

Bildiğim kadarıyla summary, katsayıların tahminlerini alıyorum ve anovaher faktör için karelerin toplamı ile - bir faktörün karelerinin toplamının karelerin toplamı artı kalıntıların toplamına bölünmesiyle oranı kısmi (aşağıdaki kod girilmiştir ).R,2R

library(car)
mod<-lm(education~income+young+urban,data=Anscombe)
    summary(mod)

Call:
lm(formula = education ~ income + young + urban, data = Anscombe)

Residuals:
    Min      1Q  Median      3Q     Max 
-60.240 -15.738  -1.156  15.883  51.380 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2.868e+02  6.492e+01  -4.418 5.82e-05 ***
income       8.065e-02  9.299e-03   8.674 2.56e-11 ***
young        8.173e-01  1.598e-01   5.115 5.69e-06 ***
urban       -1.058e-01  3.428e-02  -3.086  0.00339 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 26.69 on 47 degrees of freedom
Multiple R-squared:  0.6896,    Adjusted R-squared:  0.6698 
F-statistic: 34.81 on 3 and 47 DF,  p-value: 5.337e-12

anova(mod)
Analysis of Variance Table

Response: education
          Df Sum Sq Mean Sq F value    Pr(>F)    
income     1  48087   48087 67.4869 1.219e-10 ***
young      1  19537   19537 27.4192 3.767e-06 ***
urban      1   6787    6787  9.5255  0.003393 ** 
Residuals 47  33489     713                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

“Genç” (0.8) ve “kentsel” (-0.1, eskilerin yaklaşık 1 / 8'i, “-” dikkate almaz) katsayılarının büyüklüğü açıklanan varyansla eşleşmiyor ('genç ~ ~ 19500 ve' kentsel ” 6790, yani 1/3).

Bu yüzden verilerimi ölçeklendirmem gerekeceğini düşündüm çünkü bir faktörün menzili başka bir faktörün menzilinden daha genişse, onların katsayılarının karşılaştırılmasının zor olacağını varsaymıştım:

Anscombe.sc<-data.frame(scale(Anscombe))
mod<-lm(education~income+young+urban,data=Anscombe.sc)
summary(mod)

Call:
lm(formula = education ~ income + young + urban, data = Anscombe.sc)

Residuals:
     Min       1Q   Median       3Q      Max 
-1.29675 -0.33879 -0.02489  0.34191  1.10602 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  2.084e-16  8.046e-02   0.000  1.00000    
income       9.723e-01  1.121e-01   8.674 2.56e-11 ***
young        4.216e-01  8.242e-02   5.115 5.69e-06 ***
urban       -3.447e-01  1.117e-01  -3.086  0.00339 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 0.5746 on 47 degrees of freedom
Multiple R-squared:  0.6896,    Adjusted R-squared:  0.6698 
F-statistic: 34.81 on 3 and 47 DF,  p-value: 5.337e-12

anova(mod)
Analysis of Variance Table

Response: education
          Df  Sum Sq Mean Sq F value    Pr(>F)    
income     1 22.2830 22.2830 67.4869 1.219e-10 ***
young      1  9.0533  9.0533 27.4192 3.767e-06 ***
urban      1  3.1451  3.1451  9.5255  0.003393 ** 
Residuals 47 15.5186  0.3302                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1    

Fakat bu gerçekten bir fark yaratmıyor, kısmi ve katsayıların boyutu (bunlar şimdi standart katsayılar ) hala eşleşmiyor:R,2

22.3/(22.3+9.1+3.1+15.5)
# income: partial R2 0.446, Coeff 0.97
9.1/(22.3+9.1+3.1+15.5)
# young:  partial R2 0.182, Coeff 0.42
3.1/(22.3+9.1+3.1+15.5)
# urban:  partial R2 0.062, Coeff -0.34

“Genç” in “kentsel” den üç kat daha fazla varyansı açıkladığını söylemek doğru olur, çünkü “genç” için kısmi “kentsel” in üç katıdır? R,2Neden “genç” katsayısı o zaman “kent” in üç katı değil (işareti yok sayar)?

Bu sorunun cevabını daha sonra bana ilk sorgunun cevabını da söyleyeceğini düşünüyorum: Faktörlerin göreceli önemini göstermek için kısmi veya katsayılar kullanmalı mıyım ? (Etki yönünü görmezden - işareti - şimdilik.)R,2

Düzenle:

Kısmi eta-kare, kısmi dediğim şeyin başka bir ismi gibi görünüyor . etasq {heplots} benzer sonuçlar üreten kullanışlı bir fonksiyondur:R,2

etasq(mod)
          Partial eta^2
income        0.6154918
young         0.3576083
urban         0.1685162
Residuals            NA

Tam olarak ne yapmaya veya göstermeye çalışıyorsun? Tahmini etki? Önem?
IMA

Evet, t ve F testlerini biliyorum. Afaik t ve F testlerinin uygun olmadığı tahmini bir etki göstermek istiyorum.
robert

1
Sorum şu: Kısmi R² veya katsayıları her faktörün sonuç üzerinde ne kadar etkisi olduğunu göstermek için mi kullanmalıyım? İkisinin de aynı yöne işaret ettiğini varsayıyordum. Bunun doğru olmadığını söylüyorsunuz, çünkü verilerde çok kutupluluk var. Pekala, 'genç' faktörü gibi bir açıklama yapmak istediğimde, sonucu x kat daha fazla etkiliyor / faktör 'kentsel' den x kat daha önemliyse, kısmi R² veya katsayılara bakar mıyım?
robert

1
@IMA ile aynı fikirde değilim. Kısmi R karesi, kısmi korelasyonla doğrudan bağlantılıdır; bu, iv ile dv arasındaki sapkın ayarlanmış ilişkileri incelemenin iyi bir yoludur.
Michael M

1
Sorunuzu tekrar ön sayfada görünmesi için düzenledim. İyi bir cevapla çok ilgilenirim; eğer hiçbiri görünmezse bir lütuf bile verebilirim. Bu arada, tüm öngörücüleri standartlaştırdıktan sonra regresyon katsayıları "standartlaştırılmış katsayılar" olarak adlandırılmaktadır. Bu terimi sorunuza daha açık hale getirmek için koydum.
amip diyor Reinstate Monica

Yanıtlar:


10

Kısaca , bir kısmi hem de kullanmak ister de, bağımsız değildir gibi, aynı tahlilde ve standart katsayıları. Standart katsayıları kullanarak ilişkileri karşılaştırmanın genellikle daha sezgisel olduğunu iddia ediyorum, çünkü bunlar kolayca model tanımlamasıyla ilişkili (yani Y = β X ). Kısmi R ' 2 , sırayla, esas belirleyicisi ve bağımlı değişken (dv) arasındaki özgün ortak varyans oranı (yani ilk belirleyicisi için kısmi korelasyon karesi olduğu R x 1 y . X 2 . . . X nR,2Y=βXR,2rx1y.x2...xn). Bundan başka, çok küçük bir hata ile bir uyum için tüm katsayıları kısmi de belirleyicileri göreli öneminin belirlenmesi açısından kullanışlı değildir, bu yüzden, 1 eğilimindedir.R,2


Etki büyüklüğü tanımları

  • standart katsayısı, - katsayıları P olan standart değişken bir model tahmin elde edilen (0 = ortalama, standart sapma = 1).βstdβ
  • Kısmi - kalıntı varyasyon oranı kısıtlanmış model belirleyicisi (prediktörü olmadan tam modeli) ilave edilerek açıklanmıştır. İle aynı:R,2

    • yordayıcı ile bağımlı değişken arasındaki kısmi korelasyonun karesi, modeldeki diğer bütün yordayıcıları kontrol eder. .R,pbirrtbenbirl2=rxbeny.Xxben2
    • kısmi - tip III karelerin toplamının yordayıcıdan yordayıcıya atfedilen karelerin toplamına oranı ve SS efekti / ( SS efekti + SS hatası ) hatasıη2SSEfekt/(SSEfekt+SShata)
  • - farkı R 2 kısıtlı tam modeli arasında. Eşittir:ΔR,2R,2

    • karesel yarı yatay korelasyon rxben(y.Xxben)2
    • kareler tip III toplamı için SS etkisi / SS toplam - kısmi şekilde hesaplanmasını ne R 2 , söz konusu.η2SSEfekt/SSGenel ToplamR,2

Bunların hepsi yakından ilişkilidir, ancak değişkenler arasındaki korelasyon yapısını nasıl ele aldıklarına göre farklılık gösterir. Bu farkı anlamak için biraz daha iyi bize 3 standart (ortalama = 0, SD = 1) değişken olduğunu varsayalım olan korelasyonlar r X Y , r, x Z , r y z . Biz alacak x bağımlı değişken gibi y ve zx,y,zrxy,rxz,ryzxyzbelirleyiciler olarak. Tüm etki büyüklüğü katsayılarını korelasyonlar olarak ifade edeceğiz, böylece korelasyon yapısının her biri tarafından nasıl ele alındığını açıkça görebiliyoruz. İlk önce OLS kullanılarak tahmin edilen regresyon modelindeki katsayıları listeleyeceğiz . Katsayılar için formül: β y = r x y - r y z r z xx=βyY+βzZ karekökR2kısmideğişkenler için eşit olacaktır:

βy=rxy-ryzrzx1-ryz2βz=rxz-ryzryx1-ryz2,
R,kısmi2

R,xy.z2=rxy-ryzrzx(1-rxz2)(1-ryz2)R,xz.y2=rxz-ryzryx(1-rxy2)(1-ryz2)

ile verilir:ΔR,2

R,xyz2-R,xz2=ry(x.z)=rxy-ryzrzx(1-ryz2)R,xzy2-R,xy2=rz(x.y)=rxz-ryzryx(1-ryz2)

Bunların arasındaki fark, ve için paydadır.β belirleyicileri arasındaki tek bir korelasyon vardır. Lütfen çoğu bağlamda (zayıf korelasyonlu tahminciler için) bu ikisinin boyutunun çok benzer olacağını, bu nedenle kararın yorumunuzu çok fazla etkilemeyeceğini unutmayın. Ayrıca, bağımlı değişken ile korelasyon benzer güce sahip olan ve olmayan belirleyicileri çok güçlü oranlarını korelasyon halindeΔR,2 oranları benzer olacaktırβstd.R,kısmi2βstd

anovaR,2lm

AnovacarFtF(1,n)=t2(n)anova(mod)Anova(mod, type = 2) . Bir etkileşim terimi eklerseniz, bunun aynı olması için katsayı ve kısmi R testleri için tip III kareler toplamı ile değiştirmeniz gerekecektir (sadece kullanarak toplamları kontrastları değiştirmeyi unutmayın).options(contrasts = c("contr.sum","contr.poly"))Anova(mod,type=3)R,2etasq()pR,2


Kredi


β=(XX)Xy

1
Haklısın, demek istediğim, tip III SS ve katsayılar için t testlerinin temelde aynı F testini ve p değerini vermesiydi.
Chris Novak

2
@amoeba bazı hesaplamalar yaptıktan sonra önerilerinizi eklemek, iki etki büyüklüğü arasındaki farkları biraz netleştirmek ve OP'nin cevabını daha iyi ele almak için cevabımı düzenlemiştim.
Chris Novak,

1
ΔR,2R,2R,2R,2

1
Teşekkürler, @Chris, cevabınız çok gelişti ve şimdiye kadar oldukça mükemmel (eğer OP olsaydım, kabul ederdim). Argümanını Δ R lehine anladığımdan emin değilim.ΔR,2R,p2ΔR,2R,p2R,21
amip Reinstate Monica

8

Diğer bazı cevaplarda ve yorumlarda daha önce açıklandığı gibi, bu soru en az üç kafa karışıklığına dayanıyordu:

  1. anova()tAnova()car

  2. R,2βstd

  3. Kısmi R kare olarak adlandırdığınız şey kısmi R kare değildir. Kısmi olarak tanımlanır SS etkisiR,2SSEfekt/(SSEfekt+SShata)SSEfekt/SSGenel ToplamR,2SSEfekt

Bu karışıklıklar netleştikten sonra soru, tahminci etki büyüklüğünün veya öneminin en uygun ölçütlerinin ne olduğu sorusudur.


R'de, relaimpogöreceli öneme sahip birkaç önlem içeren bir paket vardır.

library(car)
library(relaimpo)
mod <- lm(education~income+young+urban, data=Anscombe)
metrics <- calc.relimp(mod, type = c("lmg", "first", "last", "betasq", "pratt", "genizi", "car"))

Sorunuzla aynı Anscombeveri kümesini kullanarak , bu aşağıdaki ölçümleri sağlar:

Relative importance metrics: 

              lmg      last      first    betasq       pratt     genizi        car
income 0.47702843 0.4968187 0.44565951 0.9453764  0.64908857 0.47690056 0.55375085
young  0.14069003 0.1727782 0.09702319 0.1777135  0.13131006 0.13751552 0.13572338
urban  0.07191039 0.0629027 0.06933945 0.1188235 -0.09076978 0.07521276 0.00015460

Bu metriklerin bazıları zaten tartışıldı:

  • betasqkare standart katsayılar, elde ettiğiniz değerlerle aynıdır lm().
  • firstSSEfekt/SSGenel ToplamSSEfektanova()
  • last bir artış R,2SSEfekt/SSGenel ToplamSSEfektR,2anova()

R,2

İçinde dört tane daha ölçüm var relaimpo- paket relaimpoelle kuruluysa bir tane (beşinci) mevcut : CRAN sürümü, bu metriği, kulağa gelince çılgınca, yönteminde ABD patenti olan, yazarıyla olan olası bir çelişki nedeniyle hariç tutuyor. . Çevrimiçi olarak R çalıştırıyorum ve buna erişimim yok, bu nedenle herhangi biri manuel olarak yükleyebiliyorsa relaimpo, lütfen bu ek metriği tam olması için yukarıdaki çıktıma ekleyin.

İki ölçüm prattnegatif olabilir (kötü) ve genizibu oldukça belirsizdir.

İki ilginç yaklaşım lmgve car.

SSEfekt/SSGenel ToplamSSEfekt

İkincisi (Zuber & Strimmer, 2011) 'de tanıtıldı ve birçok çekici teorik özelliğe sahip; öngörücüler ilk olarak standartlaştırıldıktan ve ZCA / Mahalanobis dönüşümü ile beyazlatıldıktan sonra (örneğin, yeniden yapılanma hatasını en aza indirirken beyazlatılmış) kare standardize katsayılar karedir.

2:1lmg878:1car

Kaynakça:

  1. Ulrike Grömping'in web sitesinde göreceli önemi ile ilgili referanslar - o yazarıdır relaimpo.

  2. Grömping, U. (2006). R'de Doğrusal Regresyonun Bağıl Önemi: Paket relaimpo . İstatistiksel Yazılım Dergisi 17, Sayı 1.

  3. Grömping, U. (2007). Varyans Ayrışmasına Dayalı Doğrusal Regresyonda Bağıl Önem Tahminleri . Amerikan İstatistiği 61, 139-147.

  4. Zuber, V. ve Strimmer, K. (2010). CAR puanlarını kullanarak yüksek boyutlu regresyon ve değişken seçimi . Genetik ve Moleküler Biyolojide İstatistiksel Uygulamalar 10.1 (2011): 1-27.

  5. Grömping, U. (2015). Regresyon modellerinde değişken önemi . Wiley Disiplinlerarası İncelemeler: Hesaplamalı İstatistik, 7 (2), 137-152. (ücret duvarının arkasında)


Çeşitli önem katsayıları hakkında ek bir değerli bilgi içeren çok güzel bir özet. BTW, bu online R motorunu kullanıyor musunuz pbil.univ-lyon1.fr/Rweb musunuz veya başka bir tane?
ttnphns

1
Kullandığım r-fiddle.org , ama asla başka bir şey denedik ve karşılaştırır bilmiyorum. Yine de oldukça şık görünüyor.
amip Reinstate Monica diyor

Efekt boyutları hakkında çok net bir özet ve ek bilgi (+1)
Chris Novak

4

Sen yazdın:

Sorum şu: Kısmi R² veya katsayıları her faktörün sonuç üzerinde ne kadar etkisi olduğunu göstermek için mi kullanmalıyım?

Burada iki şeyi karıştırmamak önemlidir. İlk olarak, modelin belirtilmesi sorunu var. Lm algoritması, OLS varsayımlarının yerine getirildiğini varsayar. Bu, diğer şeylerin yanı sıra, tarafsız tahminler için, modelden önemli bir NO değişkeninin eksik olabileceği anlamına gelir (nadiren diğer tüm regresörlerle ilgisi olmadığı durumlar hariç).
Bu yüzden, bir model bulmakta, R² veya düzeltilmiş R² üzerindeki ek etki elbette ilgi çekicidir. Örneğin, ayarlanan R² gelişmeyi bırakana kadar regresör eklemenin uygun olduğunu düşünebilirsiniz. Bunun gibi adım adım regresyon prosedürleriyle ilgili ilginç sorunlar var, ancak konu bu değil. Her halükarda modelinizi seçmenizin bir nedeni olduğunu varsayıyorum.

NASIL: Bu R² üzerindeki ek etki, tam olarak çok-yönlülük nedeniyle, regresörün bağımsız değişken üzerindeki gerçek veya toplam etkisiyle aynı değildir: Tam olarak regresörü alırsanız, etkisinin bir kısmı şimdi diğer regresörlere atfedilecektir. bununla ilişkilendirilir. Yani şimdi gerçek etki doğru gösterilmemiştir.

Ve bir başka sorun daha var: Tahminler sadece mevcut tüm diğer regresörleri olan tüm model için geçerlidir. Ya bu model henüz doğru değil ve bu nedenle etki hakkında tartışma anlamsız - ya da doğru ve o zaman bir regresörü ortadan kaldıramazsınız ve yine de OLS yöntemlerini başarı ile kullanabilirsiniz.

Öyleyse: modeliniz ve OLS kullanımı uygun mu? Eğer öyleyse, tahminler sorunuzu yanıtlar - değişkenlerin gerileme / bağımlı değişken üzerindeki etkisine dair en iyi tahmininizdir.
Değilse, ilk işiniz doğru modeli bulmaktır. Bunun için kısmi R² kullanımı bir yol olabilir. Model spesifikasyonu veya aşamalı regresyon araştırması, bu forumda birçok ilginç yaklaşım üretecektir. İşe yarayan verilerinize bağlı olacaktır.


1
Cevabınız dördüncü! "R² üzerindeki bu ek etkinin, regresörün bağımsız değişken üzerindeki gerçek veya toplam etkisiyle aynı olmadığı" ifadenizin tartışmasız olduğundan emin değilim. Paket relaimpo cran.r-project.org/web/packages/relaimpo/relaimpo.pdf , örneğin "doğrusal modellerde göreceli önemi değerlendirmek için" kısmi R² kullanır.
robert

1
R²'nin sadece model seçiminde kullanılması gerektiğine dair bir referans sağlayabileceğinizi düşünüyor musunuz?
robert

1
@ robert: Bunun nedeni, IMA'nın relaimpoverdiği nedenden dolayı kısmi R ^ 2'ye alternatifler sunmak!
Scortchi - Eski Monica

1
@Scortchi: Vay, relaimpopaketin kılavuzuna baktıktan sonra, tahmin edicilerin lineer regresyondaki göreceli önemini ölçmek için farklı yaklaşımların bir dünya olduğunu anladım . Şu anda orada bağlantı verilen bazı makalelere bakıyorum ( bu 2010 baskı öncesi çok iyi görünüyor) ve bu çok karışık! Ödülümü teklif ettiğimde, bu sorunun çok karmaşık olduğunu fark etmedim. CV'de doğru bir şekilde tartışılmamış gibi görünüyor. Bu belirsiz bir konu mu? Öyleyse neden?
amip diyor Reinstate Monica

2
@ amoeba: Bir manşet dışı cevap, "tahmincilerin göreceli öneminin" çoğu amaç için önemli olmadığıdır. Mutluluk duyduğunuz bir modeliniz varsa, günde bir sigara içmek gibi şeylerin kalp krizi geçirme riski açısından beş hamburger yemeye eşdeğer olduğunu söylemek için kullanabilirsiniz - bunun neyin kesin bir şekilde yorumlanmasından gelir modellik yapıyorsun; Modelleri karşılaştırıyorsanız, tüm modelleri karşılaştırırsınız - ölçmek için pahalı olan bir çift tahmin ediciye sahip olanlardan birini söyleyin - ve öngörücü gücün ne ölçüde bölünebileceği konusunda endişelenmenize gerek yok.
Scortchi - Eski Monica

3

Doğrusal regresyon katsayısı ile okuyabileceğiniz kısmi korelasyon arasındaki fark ile ilgili olarak , bu , örneğin,.

Ancak, soruda ifade edilen karmaşa başka bir nitelikte gibi görünüyor. Bu veya bu istatistiksel paket tarafından kullanılan varsayılan kareler toplamı türü hakkında (konu, sitemizde tekrar tekrar tartışılan) görünmektedir. Doğrusal regresyon, ANOVA Tip III SS hesaplamasındakileri kullanır. Birçok ANOVA programında da varsayılan seçenek budur. İçindeR fonksiyonu anova, varsayılan hesaplaşma Tip I SS (belirleyiciler modelinde belirtilen sırayla bağlı bir "sıralı SS") 'dir (Ben sadece varsayalım yüzden R kullanıcı değilim) bana görünür. Bu nedenle, değişkenlerinizi standartlaştırdığınızda ("ölçeklendirildiğinde") gözlemlediğiniz ve kaybolmadığınız tutarsızlık, ANOVA'yı varsayılan Tip I seçeneğiyle belirttiğiniz içindir.

Aşağıda, verilerinizle SPSS'te elde edilen sonuçlar verilmiştir:

görüntü tanımını buraya girin görüntü tanımını buraya girin görüntü tanımını buraya girin görüntü tanımını buraya girin

Bu çıktıları, SS hesaplamasından bağımsız olarak parametrelerin (regresyonel katsayılar) aynı olduğunu seçebilirsiniz. Ayrıca [SSeffect / (SSeffect + SSerror) olan kısmi Eta karesinin ve bizim durumumuzda kısmi R-karesinin tahmin edicilerin sayısal değişkenler olması nedeniyle, “SS tipi katsayılar” tablosunda tamamen aynı olduğunu fark edebilirsiniz. III. SS tipi I olduğunda, “kentsel” olan 3 tahminin sadece sonuncusu aynı değeri korur (.169); Bunun sebebi, tahmin edicilerin girdi sırasının sonuncusu olmasıdır. Tip III SS olması durumunda, girişin sırası regresyonda olduğu gibi önemli değildir. Bu arada, farklılık aynı zamanda p-değerlerinde de gözlenmiştir. Tablolarımda göremeseniz de "Sig" sütununda sadece 3 ondalık basamak bulunduğundan,

ANOVA / linear modelinde farklı "SS tipleri" hakkında daha fazla bilgi almak isteyebilirsiniz. Kavramsal olarak, tip III veya "regresyon" SS tipi temel ve ilkeldir. Diğer SS tipleri (I, II, IV, daha da var) etkilerini daha kapsamlı, regresyon parametrelerinin korelasyonlu tahmin ediciler durumunda izin verdiğinden daha az israf ile değerlendiren özel cihazlardır.

Genel olarak, etki büyüklüğü ve p değerleri, çalışmanın amacı gelecek için model oluşturmak değilse, parametrelerden ve p değerlerinden daha önemlidir. Parametreler tahmin etmenize izin veren şeydir, ancak "etki" veya "etki", "doğrusal tahminin gücünden" daha geniş bir kavram olabilir. Etki veya önemi bildirmek için kısmi Eta karelerinin yanı sıra başka katsayılar da mümkündür. Bunlardan biri bir-biri dışarı bırakma katsayısıdır: bir yordayıcının önemi, yordayıcıdan modelden çıkarılmış olan geriye kalan kareler toplamıdır, normalleştirilmiştir, böylece tüm yordayıcılar için önem değerleri 1'dir.


+1, tartışmaya katıldığınız için teşekkür ederiz. Terminolojik bir sorum var. "Kısmi R kare" SSeffect / (SSeffect + SSerror) olarak tanımlanır. SSeffect / SStotal'ın adı nedir? Anladığım kadarıyla (yanlış yaparsam düzelt beni), eğer tip III SS ayrışımı kullanırsak, bu SSeffect / SStotal, cevap ve bu yordayıcı arasındaki kare kısmi korelasyona eşit olacaktır (diğer tüm yordayıcıları kontrol eder). Bu miktarın bir adı var mı? Kısmi R2, kısmi eta karesine benzer, fakat neden eta karesinin analoğunun ismi yoktur? Bununla kafam karıştı.
amip diyor Reinstate Monica

Hata! Yukarıda biraz saçma yazdığımı düşünüyorum: kare kısmi korelasyon SSeffect / (SSeffect + SSerror), yani kısmi R2, doğru mu? Yine de, SSeffect / SStotal'ı (OP'nin orijinal sorusunda hesaplamaya çalıştığı şeydi!) Nasıl çağıracağınızla ilgili soru kalıyor. Bunu sadece kare kare mi demeli miyiz? Veya "bölümlenmiş R2" (tabii ki tip III SS için, bu "bölümlerin" toplam R2 toplamına dahil olmayacağını anlamak)?
amip diyor Reinstate Monica

1
Evet, SSeffect / SStotal sadece kare karedir. Bu belirli modelde yordayıcının eta karesidir (yordayıcının modelde sadece bir tane olması durumunda marjinal eta karesi = eta karesiyle karıştırılmamalıdır = sürekli yordamlar örneğimizde sıfır dereceli Pearson r ^ 2).
ttnphns

1
Aynen öyle. Parça korelasyonu (belirli bir örneği) eta'dır. Ben düşünüyorum olduğu modelin bu eta aramaya nedenle doğru parçası eta. Sadece "bölüm" veya "yarı çift" eta terimiyle karşılaştığım bir metni hatırlamıyorum. Bunu öğrenirseniz, lütfen bana bildirin.
ttnphns

1
Evet; neden, aynı şekilde düşünüyorum. Fakat r, kısmi r, yarı-r r ilgili eta için özel durumlardır. Bununla birlikte, ikisi arasındaki önemli terminolojik ayrım, bağlamda, genel olarak kategorik (kukla) "doğrusal olmayan" etkinin, tahmin edicinin sayısal kodlanmış gibi doğrusal (veya polinom) etkisi eklediğimiz zaman ortaya çıkar. Burada 3 etki gösteriyoruz: Kombine Etasq = Doğrusal Rsq + Doğrusallıktan sapma.
ttnphns
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.