Hayır artıklar olan değeri , koşullu üzerinde (eksi ortalama tahmin her noktasında ). Değişebilirsin (istediğiniz herhangi bir şekilde , , ) ve değerlerini buna karşılık gelir içinde belirli bir noktada değerler olmaz değişim. Böylece koşullu dağılımı (yani ) aynı olacaktır. Yani, daha önce olduğu gibi normal olacak veya olmayacak. (Bu konuyu daha iyi anlamak için cevabımı burada okumanıza yardımcı olabilir:X -Y arasından X X X + 10 x - 1 / 5 x / π -Y X X -Y -Y | XYXYXXX+ 10X- 1 / 5X/ πYXXYY| XKalanlar normal olarak dağıtılırsa, ancak Y dağıtılmazsa ne olur? )
Değişen yapabileceği şey (kullandığınız veri dönüşümünün doğasına bağlı olarak) ve arasındaki fonksiyonel ilişkiyi değiştirmektir . doğrusal olmayan bir değişiklikle (örneğin, eğriltmeyi kaldırmak için), daha önce düzgün bir şekilde belirtilen bir model yanlış tanımlanacaktır. doğrusal olmayan dönüşümleri genellikle ve arasındaki ilişkiyi doğrusallaştırmak , ilişkiyi daha yorumlanabilir kılmak veya farklı bir teorik soruyu ele almak için kullanılır. X Y X X X YXXYXXXY
Doğrusal olmayan dönüşümlerin modeli nasıl değiştirebileceği ve modelin cevapladığı sorular (günlük dönüşümüne vurgu yaparak) hakkında daha fazla bilgi için, bu mükemmel CV dizilerini okumanıza yardımcı olabilir:
Doğrusal dönüşümler parametrelerinizin değerlerini değiştirebilir, ancak işlevsel ilişkiyi etkilemez. Hem merkezi Örneğin, ve regresyon, kesenini, çalıştırmadan önce haline gelecek . Benzer şekilde, bir sabitle böldüğünüzde (santimetreden metreye değiştiğini söyleyin) eğim bu sabitle çarpılır (örn. , yani 1 metreden 100 metreden fazla artacaktır). Y, p 0 0 x β 1 ( m ) = 100 x β 1 ( c m ) YXYβ^00Xβ^1 (m)=100×β^1 (cm)Y
Öte yandan, doğrusal olmayan dönüşümler edecek artıkların dağılımını etkiler. Aslında dönüştürülmesi , artıkların normalleştirilmesi için yaygın bir öneridir. Böyle bir dönüşümün onları daha fazla veya daha az normal hale getirip getirmeyeceği, artıkların ilk dağılımına ( ilk dağılımına değil ) ve kullanılan dönüşüme bağlıdır. Ortak bir strateji, Box-Cox dağıtım ailesinin parametresi üzerinden optimize etmektir . Bir uyarı burada uygundur: doğrusal olmayan dönüşümler modeliniz doğrusal olmayan dönüşümler olarak sadece misspecified yapabilirsiniz can. Y Y λ Y XY YYλYX
Şimdi, eğer her ikisi de ve normaldir? Aslında, bu, eklem dağılımının iki değişkenli normal olacağını garanti etmez (bkz. @ Cardinal'in mükemmel cevabı: Eklem dağılımı Gaussian olmayan bir çift Gauss rastgele değişkenine sahip olmak mümkün mü ). YXY
Tabii ki, bunlar oldukça garip olasılıklar gibi görünüyor, öyleyse marjinal dağılımlar normal görünüyorsa ve eklem dağılımı da iki değişkenli normal görünüyorsa, bu artıkların normal olarak da dağıtılmasını gerektiriyor mu? Cevabımda göstermeye çalıştığım gibi, yukarıda bağlandığım gibi, artıklar normal olarak dağıtılırsa, normalliği dağılımına bağlıdır . Bununla birlikte, artıkların normallerinin, marjinallerin normallerinden kaynaklandığı doğru değildir. Şu basit örneği (ile kodlanmış ) düşünün : XYXR
set.seed(9959) # this makes the example exactly reproducible
x = rnorm(100) # x is drawn from a normal population
y = 7 + 0.6*x + runif(100) # the residuals are drawn from a uniform population
mod = lm(y~x)
summary(mod)
# Call:
# lm(formula = y ~ x)
#
# Residuals:
# Min 1Q Median 3Q Max
# -0.4908 -0.2250 -0.0292 0.2539 0.5303
#
# Coefficients:
# Estimate Std. Error t value Pr(>|t|)
# (Intercept) 7.48327 0.02980 251.1 <2e-16 ***
# x 0.62081 0.02971 20.9 <2e-16 ***
# ---
# Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
#
# Residual standard error: 0.2974 on 98 degrees of freedom
# Multiple R-squared: 0.8167, Adjusted R-squared: 0.8148
# F-statistic: 436.7 on 1 and 98 DF, p-value: < 2.2e-16
Grafiklerde, her iki marjinalin de makul göründüğünü ve eklem dağılımının makul şekilde iki değişkenli normal göründüğünü görüyoruz. Bununla birlikte, artıkların homojenliği qq-grafiğinde ortaya çıkar; her iki kuyruk da normal dağılıma göre çok hızlı bir şekilde düşer (aslında olması gerektiği gibi).