Herkes bana regresyon analizi ve eğri uydurma (doğrusal ve doğrusal olmayan) arasındaki gerçek farkları mümkünse bir örnekle açıklayabilir mi?
Hem iki değişken (bağımsız veya bağımlı) arasında bir ilişki bulmaya çalışıyor, hem de önerilen modellerle ilişkili parametreyi (veya katsayıyı) belirlemeye çalışıyor. Örneğin, aşağıdaki gibi bir veri kümem varsa:
Y = [1.000 1.000 1.000 0.961 0.884 0.000]
X = [1.000 0.063 0.031 0.012 0.005 0.000]
Bu iki değişken arasında bir korelasyon formülü önerilebilir mi? Bu iki yaklaşım arasındaki farkı anlamakta güçlük çekiyorum. Cevabınızı diğer veri kümeleri ile desteklemeyi tercih ederseniz, uygun olması zordur (belki sadece benim için).
Yukarıdaki veriler, resim grubu temsil eder ve , bir eksenlerini alıcı çalışma karakteristiği (ROC) eğrisi, olan gerçek pozitif oran (TPR) ve bir yanlış pozitif oran (FPR).
Herhangi bir belirli FPR için TPR tahmin (ya da tam tersi) bu noktalar arasında henüz emin değilim, bir eğri uydurmaya çalışıyorum, ya da orijinal sorum başına bir regresyon analizi yapmaya çalışıyorum.
Birincisi, iki bağımsız değişken (TPR ve FPR) arasında böyle bir eğri uydurma işlevi bulmak bilimsel olarak kabul edilebilir mi?
İkincisi, gerçek negatif ve gerçek pozitif vakaların dağılımlarının normal olmadığını biliyorsanız, böyle bir işlevi bulmak bilimsel olarak kabul edilebilir mi?