Genellikle örnek korelasyonunun karesinin basit doğrusal regresyon için belirleme katsayısına eşdeğer olduğu belirtilir . Bunu kendim gösteremedim ve bu gerçeğin tam bir kanıtını takdir ediyorum.
Genellikle örnek korelasyonunun karesinin basit doğrusal regresyon için belirleme katsayısına eşdeğer olduğu belirtilir . Bunu kendim gösteremedim ve bu gerçeğin tam bir kanıtını takdir ediyorum.
Yanıtlar:
Gösterimde bazı farklılıklar var gibi görünüyor: Basit bir doğrusal regresyonda, genellikle sembolü ile "örnek korelasyon katsayısı" ifadesini gözlemlenen ve değerleri arasındaki korelasyona referans olarak gördüm . Bu cevap için benimsediğim gösterim. Ayrıca, gözlenen ile donatılmış arasındaki korelasyonu ifade etmek için kullanılan aynı cümle ve sembolü gördüm ; Cevabımda bunu "çoklu korelasyon katsayısı" olarak adlandırdım ve sembolünü kullandım . Bu cevap, belirleme katsayısının neden karesi hem de karesi olduğunu ele alıry R R R ', bu nedenle hangi kullanımın amaçlandığı önemli olmamalıdır.
korelasyon ve anlamıyla ilgili bazı basit gerçekler bir kez sonuç cebir tek satırda aşağıdaki Eğer kutulu denkleme aşağı atlamayı tercih edebilir, böylece kurulur. Özellikle kovaryans ve varyansın temel özelliklerini kanıtlamamız gerekmediğini varsayıyorum: R
Kovaryansın simetrik olduğunu ve olduğunu öğrendikten sonra, ikincisinin türetilebileceğini unutmayın . Buradan, korelasyon hakkında başka bir temel gerçek türettik. İçin , ve bu sürece, ve sıfır olmayan sapmaların olması,a ≠ 0 X Y
Burada bir sinyalnum veya işaret işlevi : değeri olan ise ve ise . O da doğrudur eğer , ancak bu durum endişe değil bize: sabit, yani olurdu içinde payda ve korelasyonu hesaplayamayız. Simetri bağımsız değişkenleri bu sonucu genelleştirelim, :sgn ( a ) = + 1 a > 0 sgn ( a ) = - 1 a < 0 sgn ( a ) = 0 a = 0 a X + b Var ( a X + b ) = 0 a ,
Mevcut soruyu cevaplamak için daha genel bir formüle ihtiyacımız olmayacak, ancak durumun geometrisini vurgulamak için bunu ekliyorum: basitçe, değişkenlerden herhangi biri ölçeklendiğinde veya çevrildiğinde korelasyonun değişmediğini belirtir, ancak bir değişken olduğunda işareti tersine çevirir yansıtılır.
Bir gerçeğe daha ihtiyacımız var: sabit bir terim içeren doğrusal bir model için, belirleme katsayısı , gözlemlenen yanıtları ile modelin takılan değerleri arasındaki korelasyon olan çoklu korelasyon katsayısı karesidir . Bu hem çoklu hem de basit regresyonlar için geçerlidir, ancak dikkatimizi basit doğrusal model . Sonuç, ölçeklendirilmiş, muhtemelen yansıtılmış ve çevrilmiş bir versiyonu olduğu gözleminden kaynaklanmaktadır : R, Y, Y -Y = β 0 + β 1 X -Y X
Yani burada işaret tahmini eğimin işaretiyle eşleşir, bu da negatif olmamasını garanti eder . Açıkça .R R 2 = R 2
Önceki argüman, toplam kareleri dikkate almak zorunda kalmadan daha basit hale getirildi. Bunu başarmak için, bir ilişkisi bilgilerini atlanır normalde kare toplamı bakımından düşünmek, ve biz donatılmış ve gözlemlenen tepkiler korelasyon düşünmek için de. Semboller, ilişkisinin totolojik görünmesini sağlar, ancak durum böyle değildir ve modelde kesişme terimi yoksa ilişki bozulur! Farklı bir sorudan alınan ve arasındaki ilişki hakkında geometrik bir argümanın kısa bir taslağını vereceğim : diyagram -boyutlu konu uzayında çizilir R, R, 2 = ( R ' ) 2 R, R' 2 , n x 1 , nBöylece, her eksen (gösterilmemiştir) tek bir gözlem birimini temsil eder ve değişkenler vektörler olarak gösterilir. tasarım matrisinin sütunları , vektör (sabit terim için) ve açıklayıcı değişkenin gözlem vektörüdür, bu nedenle sütun alanı iki boyutlu bir düzdür.
Takılan , gözlenen nin sütun boşluğuna dikey olarak yansıtılmasıdır . Bu, kalıntılarının vektörün düz daireye dik ve dolayısıyla . Nokta ürün . sıfıra ve , böylece hem yanıtlanır hem de gözlemlenir ortalama . Diyagramdaki kesik çizgiler, ve YXe=y - Y 1, n0=1, n⋅e=Σ n i = 1 eı-Yı= ^ Y i +eiΣ n i = 1 ˉ Y -Y - ˉ Y 1 , n , Y θ R , bu nedenle , gözlemlenen ve yerleştirilen yanıtlar için ortalanmış vektörlerdir ve aralarındaki açısının kosinüsü, korelasyonudur .
Bu vektörlerin artık vektörü ile oluşturduğu üçgen dik açılıdır çünkü daire içinde yer alır, ancak dikeydir. Pisagor uygulama:e
Bu, yalnızca karelerin toplamının ayrışmasıdır, . Belirleme katsayısı için konvansiyonel formül olup bu üçgende gerçekten karesidir . Hemen veren formülüne daha aşina olabilirsiniz , ancak daha geneldir ve (daha önce gördüğümüz gibi) ya düşecektir 1 - S S kalıntı 1-sin2θ=cos2θRR2=SS regresyon cos2θ1-SS kalıntı SS regresyon modelde sabit bir terim varsa .
olarak tanımlanan örnek korelasyon katsayısı: eşdeğerdir: e_i) (bkz. Verbeek , §2.4)R, 2 = V ( y i ) r2(yi, y i)=