Veri kümesi kümesi oluşur varsayalım için ve bağımlılığı bakmak istiyorum üzerinde .i = 1 , ... , n, Y x( xben, yben)i = 1 , … , nyx
Eğer değerlerin bulmak varsayalım ve ve ve kareler kalıntı toplamı en aza indirmek
Sonra almak tahmin için herhangi-değeri (mutlaka daha önce gözlenmemiştir) -değeri. Bu doğrusal regresyon. β αβ n Σ i=1(yı-(α+βxi))2. Y = α + β xyxα^β^αβ
Σi = 1n( yben- ( α + βxben) )2.
y^= α^+ β^xyx
Şimdi toplam kareler toplamını
ile serbestlik derecesi, "açıklanmış" ve "açıklanamayan" kısımlara:
ile ve sırasıyla serbestlik derecesi,. Bu bir varyans analizidir ve biri F-istatistik gibi şeyleri dikkate alır.
Bu n-1 N Σ i = 1 ( ( α + β x i ) - ˉ y ) 2 ⏟ açıklandığı+ n Σ i = 1 ( y ı - ( α + β x i ) ) 2 ⏟ açıklanamayan. 1n-2F=∑ n i =
Σi = 1n( yben- y¯)2nerede y¯= y1+ ⋯ + ynn
n - 1Σi = 1n( ( α^+ β^xben) - y¯)2açıkladı + ∑ i = 1n( yben- ( α^+ β^xben) )2açıklanmamış.
1n - 2β=0F= ∑ni = 1( ( α^+ β^xben) - y¯)2/ 1Σni = 1( yben- ( α^+ β^xben) )2/ (n-2).
F-istatistiği sıfır hipotezini test eder .
β= 0
Bir çoğu İlk karşılaştığında şekliyle "Varyans Analizi" belirleyicisi böylece model oturtma olduğuna göre, kategoriktir
olan kategori tanımlar prediktörü değeridir. Varsa kategorileri, sen alırdım F-istatistiğinin içinde payındaki serbestlik derecelerini ve genellikle payda serbestlik derecesi. Ancak, regresyon ve varyans analizi arasındaki ayrım bu tür bir model için hala aynıdır. i k k - 1 , n - k
y= α + βben
benkk - 1n - k
Birkaç ek puan:
- Bazı matematikçiler için yukarıdaki hesap tüm alanın yalnızca yukarıda görüldüğü gibi görünmesini sağlayabilir, bu nedenle hem regresyonun hem de varyans analizinin aktif araştırma alanları olduğu gizemli görünebilir. Buraya göndermek için uygun bir cevaba sığmayacak çok şey var.
- Popüler ve cazip bir hata var, buna "doğrusal" denir, çünkü grafiği bir çizgidir. Bu yanlış. Daha önceki cevaplarımdan biri, en küçük kareler yoluyla bir polinom takarken neden hala “doğrusal regresyon” olarak adlandırıldığını açıklıyor.y= α + βx