Çoklu regresyon veya kısmi korelasyon katsayısı? Ve ikisi arasındaki ilişkiler


35

Bu sorunun bir anlam ifade edip etmediğini bile bilmiyorum, ancak çoklu regresyon ve kısmi korelasyon arasındaki fark nedir (korelasyon ve regresyon arasındaki bariz farklar dışında, neyi hedeflediğim değil)?

Aşağıdakileri istiyorum:
İki bağımsız değişkenim ( , ) ve bir bağımlı değişkenim ( ) var. Şimdi bireysel olarak bağımsız değişkenler bağımlı değişkenle ilişkilendirilmez. Ancak, belirli bir için zaman azalır azalır. Öyleyse , çoklu regresyon veya kısmi korelasyon yoluyla bunu analiz ediyor muyum ?x1x2yx1 yx2

Umarım sorumu geliştirmek için düzenleme: Çoklu regresyon ve kısmi korelasyon arasındaki farkı anlamaya çalışıyorum. Yani, , belirli bir azalmaktadır azalır, bu kombine etkisi nedeniyle ve ile (çoklu regresyon) ya da bunun nedeni etkisini çıkarılması için (kısmi korelasyon)?yx1x2x1x2yx1


3
Cevaplamaya çalıştığınız asıl soru nedir?
dediklerinin - Eski Monica

Ayrıca bkz. Çok benzer soru istatistik.stackexchange.com/q/50156/3277 .
ttnphns

Yanıtlar:


32

Çoklu doğrusal regresyon katsayısı ve kısmi korelasyon doğrudan bağlanır ve aynı öneme sahiptir (p-değeri). Kısmi r , beta katsayısı (standardize edilmiş regresyon katsayısı) ile birlikte katsayının standardize edilmesinin başka bir yoludur . Bağımlı değişken Yani, eğer ve Bağımsızlar olan ve sonra1yx1x2

Beta:βx1=ryx1ryx2rx1x21rx1x22

Partial r:ryx1.x2=ryx1ryx2rx1x2(1ryx22)(1rx1x22)

Numaratörlerin aynı olduğunu görüyorsunuz, her iki formül de aynı benzersiz etkisini ölçüyor . İki formülün yapısal olarak nasıl aynı olduğunu ve nasıl olmadığını açıklamaya çalışacağım.x1

Her üç değişkenin de z standardize edildiğini (ortalama 0, varyans 1) varsayalım . Pay daha sonra iki tür arasında kovaryans eşittir artıklar : tahmin sol (a) 'artıkları ile [standart, her iki değişken] ve tahmin kalan (b)' artıkları ile [standart, her iki değişken]. Dahası, artıkların varyansı (a) ; Artıkların (b) varyansı .yx2x1x21ryx221rx1x22

Formülü kısmi ilişki daha sonra açık bir şekilde, düz, Pearson formülünü görünür Pearson: artıklar (a) ve artıklar (b) arasındaki bu durumda hesaplanan, , bildiğimiz kovaryans geometrik ortalaması olmaktadır payda bölünür, iki farklı varyans.rr

Standardize edilmiş katsayısı beta yapısal olarak Pearson , sadece payda kendi benliğindeki bir varyansın geometrik ortalamasıdır . Artıkların varyansı (a) sayılmamıştır; artıkların varyansının ikinci sayımıyla değiştirildi (b). Böylece Beta, iki kalıntının kovaryansı, birinin birinin varyansına bağlı olarak belirlenir (özellikle, ilgi belirleyen kişi, ). Kısmi korelasyon, daha önce farkedildiği gibi, aynı kovaryansın hibrit varyanslarına göre aynı olmasıdır . Her iki katsayı türü, etkisini diğer tahmincilerin ortamında standart hale yollarıdır .rx1x1

Farklılığın bazı sayısal sonuçları. Çoklu regresyonunun R-kare ise ile ve 1 olması umulur sonra bağımlı olan belirleyicilerinin her iki kısmi korelasyonlar 1 mutlak değeri olacaktır (ancak, betalar genellikle 1 olmayacaktır). Aslında, daha önce de belirtildiği gibi, , artıkları ve artıkları arasındaki . Eğer neyi değildir içinde edilir tam olarak neyi değildir içinde sonra içinde bir şey yok ne olduğunu ne deyx1x2ryx1.x2y <- x2x1 <- x2x2y x2x1yx1x2 : tam oturması. Açıklanamayan (göre miktarı ne olursa olsun, bir sol) kısım ( bu bağımsız kısmı tarafından nispeten yüksek yakalanır ise), ile ( ), yüksek olacaktır. , diğer taraftan, yüksek sadece olmak ele açıklanamayan kısmı şartıyla olacak kendisinin önemli bir kısmı olan .x2y1ryx22x11rx1x22ryx1.x2βx1yy


Yukarıdaki formüllerden bir tanesi (ve 2-öngörücülü regresyondan, rasgele sayıdaki tahmincisi olan bir regresyona uzanan ), beta ve karşılık gelen kısmi r arasındaki dönüşüm formülünü elde eder:x1,x2,x3,...

ryx1.X=βx1var(ex1X)var(eyX),

nerede akımı (dışındaki tüm belirleyicileri toplanması anlamına ); regresyon denklemi artıklar olan ile ve regresyon denklemi artıklar olan göre , bu regresyon onları içeri hem de değişken standart .Xx1 y X e x 1XeyXyXex1Xx1X

Not: kısmi korelasyonlarını her bir tahmincisi ile hesaplamamız gerekirse, genellikle iki ek regresyon yapılması gereken bu formülü kullanmayacağız. Aksine, tarama işlemleri (genellikle adım adım ve tüm alt kümeler regresyon algoritmalarında kullanılır) yapılacak veya görüntü karşıtı korelasyon matrisi hesaplanacaktır.yx


1 βx1=bx1σx1σy , ham ve standartlaştırılmış katsayıları ile regresyon arasındaki ilişkidir .bβ


Teşekkür ederim. Fakat hangisine gideceğime nasıl karar verebilirim, örneğin sorumu açıklamak için?
user34927

2
Açıkçası, seçmekte özgürsünüz: payerler aynı, bu yüzden aynı bilgiyi iletiyorlar . (Tam olarak açıklanmayan) sorunuza gelince , " r . 0 olmadığında regr. Coef. 0 olabilir"; msgstr " r . 0 olduğunda regr. coef. 0 olamaz ". Sitede bununla ilgili birçok soru var. Örneğin, istatistik.stackexchange.com/q/14234/3277 ; stats.stackexchange.com/q/44279/3277 .
ttnphns


X1'in sabitlenmesi ("x1 verildi") = X1'in etkisinin giderilmesi (kontrol edilmesi). Çoklu regresyonda "birleşik etki" diye bir şey yoktur (etkileşimi X1 * X2 eklemezseniz). Çok kutuplu regresyondaki etkiler rekabetçidir. Doğrusal regresyon etkileri aslında kısmi korelasyonlardır.
ttnphns

1
Biraz bekleyin, @ user34927. to prove that the DV (Y) is significantly correlated with one of two IVs (X1) if the effect of the other IV (X2) is removedEtkisi nereye kaldırıldı ? X2'yi hem Y hem de X1'den "kaldırırsanız", düzeltiniz. Y ve X1 arasındaki kısmi korelasyondur. X2'yi yalnızca X1'den "kaldırırsanız" düzeltiniz. Y ve X1 arasında adlandırılır kısmını (ya da yarı-kısmi) korelasyonu. Gerçekten hakkında soran o ?
ttnphns

0

Sadece sırtı tesadüfen çarptım. Orijinal cevapta, formülünde faktörü eksik, yani burada ve .βx1SSY/SSX1

βx1=ryx1ryx2 rx1x21rx1x22×SSYSSX1,
SSY=i(yiy¯)2SSX1=i(x1ix¯1)2

formülünü veriyorsun . Cevabım . bβ
ttnphns
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.