Çok sayıda regresyon ve çok değişkenli regresyon arasındaki farkı, minimum sembol / matematik kullanımı ile açıklayın.


Yanıtlar:


54

Çok hızlı bir şekilde şunu söyleyebilirim: 'çoklu', modele (veya eşdeğerde tasarım matrisine) tek bir sonuçla (Y yanıtı) giren öngörücü sayısına uygulanırken, 'çok değişkenli' yanıt vektörleri matrisini ifade eder. Çok değişkenli modelleme ile ilgili tanıtım bölümünü bu düşünceyle başlatan yazarı hatırlayamıyorum, ama bence çok değişkenli analiz için bir R ve S-Plus Arkadaşı kitabındaki Brian Everitt . Bununla ilgili ayrıntılı bir tartışma için, Davranış Bilimleri için Çok Değişkenli Modelleme ve Çok Değişkenli Analiz başlıklı son kitabına bakmayı öneririm .

'Değişken' için, bunun bilinen veya hipotezize edilmiş bir dağılımı izleyen herhangi bir rastgele değişkeni ifade etmenin yaygın bir yolu olduğunu söyleyebilirim, örneğin, normal dağılımdan çizilen bir dizi gözlem olarak gauss değişkenlerinden ( ve ). Olasılık bakımından, bu rasgele olduğu bahsedilen gerçekleşmeleri umulan X'in, ve bunların yaklaşık% 95 aralığında olması beklenmektedir edilir . ^ ı σ 2 μ [ μ - 2 σ ; μ + 2 σ ]Xiμσ2μ[μ2σ;μ+2σ]


1
Coursera.org/learn/machine-learning/home/week/2 bile çoklu regresyon yerine çok değişkenli regresyon terimini kullanıyor…
Franck Dernoncourt

Sanırım aynı karışıklık, Genel Doğrusal Model için GLM terimini kullanan kişilerle (örneğin, nörogörüntüleme çalışmalarında) Genelleştirilmiş Doğrusal Model ile ortaya çıkıyor. Tek bir sonucun olduğu çok değişkenli lojistik regresyon örnekleri görmüştüm ve terim yazar tarafından açıkça tanımlandığı sürece bunun önemli olduğunu sanmıyorum.
chl

39

İşte fikirleri açıklayan birbiriyle yakından ilgili iki örnek. Örnekler biraz ABD merkezli ancak fikirler diğer ülkelere yansıtılabilir.

örnek 1

Bir üniversitenin kabul kriterlerini daha iyi hale getirmek istediğini ve böylece 'daha iyi' öğrenciler aldıklarını varsayalım. Ayrıca, bir öğrencinin not Ortalaması'nın (GPA) üniversitenin öğrenciler için bir performans ölçütü olarak kullanmak istediğini varsayalım. Lise genel not ortalaması (HSGPA), SAT puanları (SAT), Cinsiyet vb. Gibi birçok kritere sahipler ve bu kriterlerden hangisinin GPA ile ilgili olduğunu bilmek istiyorlar.

Çözüm: Çoklu Regresyon

Yukarıdaki bağlamda, bir bağımlı değişken (GPA) vardır ve birden fazla bağımsız değişkeniniz (HSGPA, SAT, Cinsiyet vb.) Vardır. Bağımsız değişkenlerden hangisinin bağımlı değişkeniniz için iyi tahmin edici olduğunu bulmak istiyorsunuz. Bu değerlendirmeyi yapmak için çoklu regresyon kullanırsınız.

Örnek 2

Yukarıdaki durum yerine, kabul ofisinin zaman içindeki öğrenci performansını izlemek istediğini ve kriterlerinden hangisinin zaman içindeki öğrenci performansını artırdığını belirlemek istediğini varsayalım. Başka bir deyişle, bir öğrencinin okulda kaldığı dört yıl boyunca GPA puanları vardır (örneğin, GPA1, GPA2, GPA3, GPA4) ve bağımsız değişkenlerden hangisinin GPA'yı daha iyi tahmin ettiğini bilmek isterler. yıl bazında. Kabul ofisi, aynı bağımsız değişkenlerin dört yıl boyunca performansı öngördüğünü ve böylece kabul kriterleri seçimlerinin öğrenci performansının dört yıl boyunca sürekli olarak yüksek olmasını sağlamayı umduğunu umuyor .

Çözüm: Çok Değişkenli Regresyon

Örnek 2'de, çoklu bağımlı değişkenlere (yani GPA1, GPA2, GPA3, GPA4) ve çoklu bağımsız değişkenlere sahibiz. Böyle bir durumda, çok değişkenli regresyon kullanırsınız.


2
Soruyu örneklerle doğru bir şekilde cevaplayan her zaman bir tane var :)
Tjorriemorrie

% 100 gerçekte anlayabileceğiniz en iyi cevap
Alvis

21

Basit regresyon , bir bağımlı değişken ( ) ve bir bağımsız değişken ( ) ile ilgilidir:yxy=f(x)

Çoklu regresyon (aka değişkenli regresyon) ile ilgilidir , bir bağımlı değişken ve çok sayıda bağımsız değişkenler:y=f(x1,x2,...,xn)

Çok değişkenli regresyon , çoklu bağımlı değişkenlere ve çoklu bağımsız değişkenlere : . Hem bağımlı hem de bağımsız değişkenlerin değişkenlerin matrisi olarak düzenlendiği problemlerle karşılaşabilirsiniz (örneğin, ve ), İfade, büyük harflerin matrisleri gösterdiği şeklinde yazılabilir .y 11 , y 12 , . . . x 11 , x 12 , . . . Y = f ( X )y1,y2,...,ym=f(x1,x2,...,xn)y11,y12,...x11,x12,...Y=f(X)

Daha fazla okuma:


Tanımı anlıyorum. Ancak çok değişkenli bir regresyonun tek değişkenli regresyon sistemi olarak ele alınmasının etkisi nedir?
LKS

@ LKS: Bunu tamamen ayrı bir soruda sormak isteyebilirsiniz.
stackoverflowuser2010


Quora'daki cevap bu sayfaya atıfta bulundu mu? : P
Habeeb Perwad

4

Bence burada ana fikir (ve farklılaştırıcı) denklemin her iki tarafındaki değişkenlerin sayısının yanı sıra, çok değişkenli regresyon için amaç, yanıt değişkenleri (veya genellikle) yanıt değişkenleri arasında korelasyon olduğu gerçeğini kullanmaktır. sonuçlar). Örneğin, tıbbi bir denemede, öngörücüler kilo, yaş ve ırk olabilir ve sonuç değişkenleri kan basıncı ve kolesteroldür. Teorik olarak, iki "çoklu regresyon" modeli oluşturabiliriz, biri ağırlık, yaş ve ırk üzerindeki kan basıncını geriledi, ve aynı faktörler üzerinde kolesterolü gerileyen ikinci bir modeli. Bununla birlikte, alternatif olarak, her ikisini de öngören tek değişkenli bir regresyon modeli oluşturabiliriz.üç öngörü değişkenine bağlı olarak aynı anda kan basıncı ve kolesterol. Çok değişkenli regresyon modelinin, hastalarda kan basıncı ve kolesterol arasındaki korelasyondan daha fazla şey öğrenebileceği ölçüde daha iyi (daha öngörülü) olabileceği fikri.


Harika nokta. Çok değişkenli regresyonun R ile yapılıp yapılamayacağını merak ediyordum. Manova kullanarak çok değişkenli ANOVA yapabilirim, ancak tek değişkenli regresyon gibi katsayıları alamıyorum.
KarthikS

1

Çok değişkenli regresyonda, farklı varyanslara (veya dağılımlara) sahip birden fazla bağımlı değişken vardır. Öngörücü değişkenleri birden fazla veya birden fazla olabilir. Dolayısıyla, bağımlı değişkenler matrisi ile, yani çoklu değişkenler ile çoklu bir regresyon olabilir. Fakat çoklu regresyon derken, tek bir dağılım veya varyansa sahip yalnızca bir bağımlı değişken anlamına gelir. Tahmin değişkenleri birden fazla. Birden fazla özetlemek için birden fazla tahmin değişkenine atıfta bulunulur, ancak çok değişkenli birden fazla bağımlı değişken anlamına gelir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.