Doğrusal regresyon varsayımlarının gerçekçi olmadığı doğrudur. Ancak, bu tüm istatistiksel modeller için geçerlidir. "Tüm modeller yanlış, ancak bazıları faydalı."
Sanırım daha karmaşık bir model kullanabileceğiniz zaman lineer regresyon kullanmak için hiçbir neden yokmuş izlenimi altındasınız. Bu doğru değildir, çünkü genel olarak, daha karmaşık modeller aşırı donmaya karşı daha savunmasızdır ve daha fazla hesaplama kaynağı kullanırlar, örneğin, gömülü bir işlemci veya web sunucusunda istatistik yapmaya çalışıyorsanız önemlidir. Daha basit modellerin anlaşılması ve yorumlanması da daha kolaydır; Aksine, sinir ağları gibi karmaşık makine öğrenimi modelleri az ya da çok kara kutu olma eğilimindedir.
Bir gün doğrusal regresyon artık pratik olarak yararlı olmasa bile (öngörülebilir gelecekte son derece olası görünmüyor), yine de teorik olarak önemli olacaktır, çünkü daha karmaşık modeller bir temel olarak doğrusal regresyon üzerine inşa etme eğilimindedir. Örneğin, düzenli karışık etkiler lojistik regresyonunu anlamak için önce düz eski doğrusal regresyonu anlamanız gerekir.
Bu, daha karmaşık, daha yeni ve daha parlak modellerin yararlı veya önemli olmadığı anlamına gelmez. Birçoğu. Ancak, daha basit modeller daha yaygın olarak uygulanabilir ve bu nedenle daha önemlidir ve çeşitli modeller sunacaksanız, ilk önce açıkça sunmak mantıklıdır. Bu günlerde kendilerini "veri bilimcileri" veya başka bir şey olarak adlandıran, ancak bir güven aralığının gerçekte olduğu gibi temel şeyleri bile bilmeyen insanlar tarafından yapılan çok sayıda kötü veri analizi var. İstatistik yapma!