Gri bant, regresyon çizgisi için bir güven bandıdır. Ggplot2'nin 1 SE güven bandı mı yoksa% 95 güven bandı mı olduğunu bilmek için yeterince tanıdık değilim, ancak eski olduğuna inanıyorum ( Düzenleme: Açıkçası% 95 CI ). Güven bandı, regresyon çizginiz hakkındaki belirsizliğin bir temsilini sağlar. Bir anlamda, gerçek regresyon çizgisinin o bandın üst kısmı kadar yüksek, alt kısmı kadar düşük veya bant içinde farklı şekilde kıpırdadığını düşünebilirsiniz. (Bu açıklamanın sezgisel olması ve teknik olarak doğru olmadığını unutmayın, ancak tam doğru açıklamanın çoğu insanın izlemesi zordur.)
Regresyon hattını anlamanıza / düşünmenize yardımcı olması için güven bandını kullanmalısınız. Ham veri noktalarını düşünmek için kullanmamalısınız. Regresyon çizgisinin her noktasında ortalamasını temsil ettiğini unutmayın (bunu daha iyi anlamanız gerekirse, cevabımı burada okumanıza yardımcı olabilir: Koşullu Gauss dağılımlarının ardındaki sezgi nedir? ). Öte yandan, gözlemlenen her veri noktasının koşullu ortalamaya eşit olmasını kesinlikle beklemezsiniz. Başka bir deyişle, bir veri noktasının aykırı olup olmadığını değerlendirmek için güven bandını kullanmamalısınız. YX
( Düzenle: bu not ana soru için çevreseldir, ancak OP için bir noktayı açıklığa kavuşturmayı amaçlamaktadır. )
Polinom regresyonu, aldığınız şey düz bir çizgi gibi görünmese de doğrusal olmayan bir regresyon değildir. 'Doğrusal' teriminin matematiksel bağlamda çok özel bir anlamı vardır, özellikle, tahmin ettiğiniz parametrelerin - betaların - hepsi katsayılardır. Polinom regresyonu sadece ortak değişkenlerinizin , , , vb . Olduğu anlamına gelir , yani birbirleriyle doğrusal olmayan bir ilişkiye sahiptirler, ancak betalarınız hala katsayılardır, bu yüzden hala doğrusal bir modeldir . Betalarınız mesela üsse, o zaman doğrusal olmayan bir modeliniz olurdu. XX2X3
Özetle, bir çizginin düz görünüp görünmediği, bir modelin doğrusal olup olmadığı ile ilgisi yoktur. Bir polinom modeli taktığınızda (örneğin ve ), model `` aslında sadece karesi olduğunu '' bilmez . Bunların sadece iki değişken olduğunu 'düşünüyor' (bazı çoklu doğrusallık olduğunu fark etmesine rağmen). Böylece, gerçekte, iki boyutlu bir uzayda (kavisli) bir regresyon çizgisinden ziyade üç boyutlu bir uzaya (düz / düz) bir regresyon düzlemi yerleştirmektedir . Bize düşünmek için bu yararlı değildir, ve o zamandan beri aslında, son derece zor görmeye mükemmel bir fonksiyonudurXX2X2X1X2X. Sonuç olarak, bunu bu şekilde düşünmekten rahatsız olmayız ve arazilerimiz gerçekten düzlemine iki boyutlu projeksiyonlardır . Bununla birlikte, uygun alanda, çizgi aslında bir anlamda 'düz'dür. (X, Y)
Matematiksel bir bakış açısından, tahmin etmeye çalıştığınız parametreler katsayılarsa, model doğrusaldır. Daha fazla açıklığa kavuşturmak için, standart (OLS) doğrusal regresyon modeli ile iki farklı biçimde sunulan basit bir lojistik regresyon modeli arasındaki karşılaştırmayı düşünün:
En üst model OLS regresyonudur ve en alttaki model lojistik regresyondur, ancak farklı şekillerde sunulur. Her üç durumda da, modele uyduğunuzda, tahmin edersiniz . İlk iki model doğrusaldır , çünkü tüm
Y=β0+β1X+ε
ln(π(Y)1−π(Y))=β0+β1X
βββπ(Y)=exp(β0+β1X)1+exp(β0+β1X)
ββs katsayılardır, ancak alt model doğrusal değildir (bu formda), çünkü s üslüdür. (Bu oldukça garip gelebilir, ancak lojistik regresyon
genelleştirilmiş doğrusal modelin bir örneğidir , çünkü doğrusal bir model olarak yeniden yazılabilir. Bununla ilgili daha fazla bilgi için, cevabımı burada okumak yardımcı olabilir:
Logit ve probit modelleri arasındaki fark .)
β