Lineer regresyondaki kesişim neden bastırılır?


20

SAS, SPSS ve belki daha fazlasını içeren bir dizi istatistik paketinde "kesmeyi bastırmak" için bir seçenek vardır. Bunu neden yapmak istiyorsun?

Yanıtlar:


16

Herhangi bir nedenle kesmeyi biliyorsanız (özellikle sıfırsa), zaten bildiğiniz bir şeyi tahmin etmek için verilerinizdeki sapmayı boşa harcayabilir ve tahmin etmeniz gereken değerlere daha fazla güvenebilirsiniz .

Biraz fazla basitleştirilmiş bir örnek, bir alanın (ortalama olarak) bir değişkenin (ortalama olarak) başka bir katının katı olduğunu zaten biliyorsanız ve bu katlamayı bulmaya çalışıyorsanız.


Tamamen anlamıyorum, ama R'de oluşturduğum bir modelde, b ve c arasında etkileşimler yaratan ve kesişmeyi ("- 1") bastırarak lm (a ~ b / c - 1) gibi bir şeyim var. R), daha kolay yorumlanabilir cevaplar alıyorum, temelde kesişim bastırmaz gibi. Bir şekilde, etkileşim bunu mümkün kılar.
Wayne

Aslında aynı olan daha kolay yorumlanabilir cevaplar? Bu bir çelişki gibi görünüyor. Belki bunu yeni bir soru olarak tanıtmalısın?
Nick Sabbe

Ben katsayıları bakarsak, kesişmesine sahip bir var (kesenini) ve bir tempwarmer (benim değişkenlerden biridir geçici olabilir daha sıcak veya daha soğuk ). Katsayıları yorumlamak için, ( kesişmenin ) doğrudan tempcooler ve tempwarmer + (kesişme) 'nin doğrudan yorumlanabilir tempwarmer olduğunu ifade etmeliyim . Kesmeyi bastırırsam, doğrudan tempcooler ve tempwarmer görüyorum . Belki de R'nin formülleri ve doğrusal modelleme tuhaflığı, ama ...
Wayne

12

3 seviyeli kategorik bir ortak değişken düşünün. Bir kesişme varsa, bu 2 gösterge değişkeni gerektirir. Gösterge değişkenleri için genel kodlama kullanılarak, her iki gösterge değişkeni için katsayı referans grubuna göre ortalama farktır. Kesmeyi bastırarak, kategorik eşdeğeri temsil eden sadece 2 yerine 3 değişkeniniz olacaktır. Bir katsayı, o grup için ortalama tahmindir. Bunun nerede yapılacağına dair daha somut bir örnek, Amerika Birleşik Devletleri'nin 50 eyaletini inceleyen siyaset bilimidir. Durumlar için bir kesişim ve 49 gösterge değişkenine sahip olmak yerine, kesişimin bastırılması ve bunun yerine 50 değişkenin olması genellikle tercih edilir.


Katsayıyı bu şekilde yorumlamak çok daha kolay
olasılık

1
Evet, ancak iki veya daha fazla kategorik değişkenle ayrılıyor!
kjetil b halvorsen

2

@Nick Sabbe'nin amacını belirli bir örnekle göstermek.

Bir keresinde bir araştırmacının genişliğinin bir fonksiyonu olarak bir ağacın yaşının bir modelini sunduğunu gördüm. Ağaç sıfır yaşındayken, etkin olarak sıfır genişliğine sahip olduğu varsayılabilir. Bu nedenle, bir engelleme gerekli değildir.


8
Bilgelik veya yokluğu, ilgili bağımlı değişkenin aralığına bağlıdır. Hızlarınız ve durma mesafeleriniz olduğunda araç frenleme verilerini düşünün. Kesişmeli veya kesişmesiz ikinci dereceden bir model sığdırabilirsiniz. İlgilenilen hızlar genellikle yaklaşık 50 km / sa başlar ve örneğin 130 km / saate kadar çıkar. Bir Kuadratik takılması ile sıfıra keseninin zorlama (pratik olarak) önemli eksikliği-of-fit sorunlarını tabi gibi bu durumda kesişim, bence, daha mantıklı. Durdurulmuş bir otomobilin "fren mesafesi" nin sıfır olması, mevcut modelleme problemi ile özellikle ilgili değildir.
kardinal

@cardinal yes Benzer bir noktaya değinmem gerekip gerekmediğini merak ediyordum. Bazı doğrusal olmayan regresyon modelleme bağlamlarında, veri aralığının dışında doğru bir şekilde tahmin eden teorik olarak akla yatkın bir model sağlayan bir modele sahip olmaya daha fazla ilgi duydum (örneğin, öğrenme eğrisi veri hızında, modeller 0 saniyenin altındaki hızları tahmin etmemelidir) ). Bu gibi durumlarda, kesişim noktasını sıfıra sınırlamak, veriler için tahminde bir düşüşe neden olsa bile daha uygun olabilir.
Jeromy Anglim

@cardinal Polinom modellerinin nadiren veri aralığının dışında makul bir şekilde öngördüğüne katılıyorum ve bu nedenle bu tür modellerde kesişimin 0 ile sınırlandırılması nadiren iyi bir fikirdir.
Jeromy Anglim

Yorumlarınız için teşekkürler. Benim sözüm polinom modelleri hedeflemedi. İkinci dereceden seçim basitçe gerçek bir fiziksel motivasyona (yani klasik mekanik) dayanıyordu. Eklemeye çalıştığım nokta, kişinin ilgi modelleme problemini dikkatle ele alması gerektiğiydi; bazen "teorik olarak haksız" olan (veya görünen) bir şey yapmak aslında istatistiksel olarak daha uygundur.
kardinal
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.