Regresyon analizi ve eğri uydurma arasındaki fark


17

Herkes bana regresyon analizi ve eğri uydurma (doğrusal ve doğrusal olmayan) arasındaki gerçek farkları mümkünse bir örnekle açıklayabilir mi?

Hem iki değişken (bağımsız veya bağımlı) arasında bir ilişki bulmaya çalışıyor, hem de önerilen modellerle ilişkili parametreyi (veya katsayıyı) belirlemeye çalışıyor. Örneğin, aşağıdaki gibi bir veri kümem varsa:

Y = [1.000 1.000 1.000 0.961 0.884 0.000] 
X = [1.000 0.063 0.031 0.012 0.005 0.000]

Bu iki değişken arasında bir korelasyon formülü önerilebilir mi? Bu iki yaklaşım arasındaki farkı anlamakta güçlük çekiyorum. Cevabınızı diğer veri kümeleri ile desteklemeyi tercih ederseniz, uygun olması zordur (belki sadece benim için).

Yukarıdaki veriler, resim grubu temsil eder ve , bir eksenlerini alıcı çalışma karakteristiği (ROC) eğrisi, olan gerçek pozitif oran (TPR) ve bir yanlış pozitif oran (FPR).xyyx

Herhangi bir belirli FPR için TPR tahmin (ya da tam tersi) bu noktalar arasında henüz emin değilim, bir eğri uydurmaya çalışıyorum, ya da orijinal sorum başına bir regresyon analizi yapmaya çalışıyorum.

Birincisi, iki bağımsız değişken (TPR ve FPR) arasında böyle bir eğri uydurma işlevi bulmak bilimsel olarak kabul edilebilir mi?

İkincisi, gerçek negatif ve gerçek pozitif vakaların dağılımlarının normal olmadığını biliyorsanız, böyle bir işlevi bulmak bilimsel olarak kabul edilebilir mi?


1
Terimler (maalesef) farklı insanlar tarafından farklı bağlamlarda farklı şekillerde kullanılmaktadır. İnsanların aralarında ayrım yaptıkları bir örneğe bağlantı verebilir misiniz?
gung - Monica'yı eski

Anlamaya çalıştığım, nasıl farklı oldukları ve aralarındaki farkı nasıl ayırt edebileceğim.
Ali Sultan

1
Yeterince adil, ama biri size farklı olmaları gerektiğini söyledi mi?
gung - Monica'yı eski

2
Bu sitede bazı insanlar regresyon olarak kabul edilemeyecek duyularda "eğri uydurma" yı kullanmıştır. Örneğin, bazıları bir yoğunluğu tahmin etmeyi bir histograma "eğri uydurma" biçimi olarak görür.
whuber

Yanıtlar:


22

İstatistiksel olarak düşünülmüş bilimler ve regresyon ve eğri uydurma alanları arasında açık ve tutarlı bir ayrım olduğundan şüpheliyim .

Niteliksiz regresyon doğrusal regresyon ve en küçük kareler kestirimini ifade eder. Bu, diğer veya daha geniş duyuları dışlamaz: gerçekten logit, Poisson, negatif binomiyal regresyon vb.

Eğri uydurma, kelimenin tam anlamıyla bir düzlemde veya en azından düşük boyutlu bir alanda çizilebilecek bir eğri önerir. Regresyon çok sınırlı değildir ve birkaç boyutlu uzayda yüzeyleri tahmin edebilir.

Eğri uydurma doğrusal regresyon ve / veya en küçük kareler kullanabilir veya kullanmayabilir. Bir polinom (güç serisi) veya bir dizi sinüs ve kosinüs terimlerinin takılması veya başka bir şekilde parametrelerde lineer bir fonksiyonel formun uydurulması anahtar anlamında doğrusal regresyon olarak nitelendirilebilir. Doğrusal olmayan regresyon da regresyon olduğunda gerçekten eğri uydurma.

Eğri uydurma terimi, aşağılayıcı, aşağılayıcı, itici veya küçümseyici bir anlamda ("bu sadece eğri uydurma!") Veya (neredeyse tam tersi), belirli fiziksel (biyolojik, ekonomik, her ne olursa olsun) belirli başlangıç ​​veya sınırlayıcı davranış türlerine uyacak şekilde uyarlanmış veya uyarlanmıştır (örneğin her zaman pozitif olmak, bir veya her iki yönde sınırlanmış, monoton, bir bükülme ile, tek bir dönme noktası, salınım, vb.).

Buradaki birkaç bulanık sorundan biri, aynı fonksiyonel formun bazı durumlarda en iyi ampirik ve diğerlerinde mükemmel teori olabilmesidir. Newton, mermilerin yörüngelerinin parabolik olabileceğini ve doğal olarak kuadratikler tarafından yerleştirilebileceğini öğretirken, sosyal bilimlerde yaş bağımlılığına uyulan ikinci dereceden bir veri, genellikle verilerdeki bazı eğriliklerle eşleşen bir şekerleme. Üstel bozulma, radyoaktif izotoplar için gerçekten iyi bir yaklaşımdır ve arazi değerlerinin bir merkezden uzaklıkla düşme şekli için bazen çok çılgın olmayan bir tahmindir.

Örneğiniz benden kesin bir tahmin almıyor. Burada önemli olan nokta, çok küçük bir veri kümesi ve değişkenlerin ne olduğu veya nasıl davranmaları beklendiği hakkında kesin bir bilgi olmaması, bir model formu önermenin sorumsuz veya aptal olabileceğidir. Belki de veriler (0, 0) 'dan keskin bir şekilde yükselmeli ve sonra (1, 1)' e ya da belki başka bir şeye yaklaşmalıdır. Bize söyle!

Not. Ne regresyon ne de eğri uydurma tekli yordayıcılar veya tek parametrelerle (katsayılar) sınırlandırılmamıştır.


2
"Eğri uydurma" bana teorik (örneğin, lowess) bir şeyi ifade eder. Ekonomistler bazen 'grafik' olarak uydurma, teori fonksiyonunu bazı eğri uydurma kullanımlarına benzeyen deride ederler. Doğru anlaşıldığında, (örneğin lowess) hem artıları hem de eksileri olduğunu düşünüyorum. Bununla birlikte, birisinin terimleri açıkça daha fazla bağlam olmadan nasıl ifade ettiğini bilmek zordur.
gung - Monica'yı eski

1
@gung Bence bazı doğal (ve doğal olmayan) bilimlerde benzer kısmen joküler, kısmen ciddi kullanım var. Sorunlardan biri, yeterince parametre verildiğinde, mutlaka çok fazla kıpır kıpır odanızın olması. Sadece ARIMA'ya değil, aynı zamanda verilerin önerildiği her yerde sinüzoidal terimler ve adımlar, rampalar ve sivri uçlara izin veren zaman serisi modellerini hatırlatıyorum.
Nick Cox

İkinci olarak @ gung, eğri uydurma en azından benim için daha parametrik olmayan bir çağrışım var.
Christoph Hanck

1
@ChristophHanck Lütfen buna "parametrik olmayan" getirmeyin! Tartışma zaten yeterince çamurlu!
Nick Cox

1
@gung: Düzeltme spline'larını ve RKHS yöntemlerini genel olarak "eğri uydurma" nın omurgası olarak düşünmek, örneğin "eğri uydurmanın" "regresyon" dan çok daha teorik olduğunu hissediyorum. (Bu cevap için NickCox'a +1)
usεr11852 diyor Reinstate Monic

8

@ NickCox'un mükemmel cevabına (+1) ek olarak, bu biraz bulanık terminoloji konusundaki öznel izlenimlerimi paylaşmak istedim . İki terim arasında oldukça ince bir fark olduğunu düşünüyorum. Bir yandan, regresyon çoğu zaman, her zaman olmasa da, analitik bir çözüm anlamına gelir ( regresörlere referans, bunların parametrelerini , dolayısıyla analitik çözüm hakkındaki argümanımı ). Öte yandan, eğri uydurma mutlaka bir analitik çözüm üretmek anlamına gelmez ve IMHO genellikle bir keşif yaklaşımı olarak kullanılabilir ve kullanılır .


2
Analitik çözümü olan bir şey keşif amacıyla da kullanılamaz mı? Yaptığın muhalefeti alacağımı sanmıyorum.
amip, Reinstate Monica'nın

@ amoeba: Analitik çözümler kesinlikle keşif araştırmaları için de kullanılabilir. Ancak, bahsettiğim nokta, söz konusu terimlerin en popüler zımni özü hakkında .
Aleksandr Blekh
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.