Bize ve şeklinde bir dizi veri verildiğini varsayalım . Biz tahmin görevi verilmiştir değerlerine dayalı . İki regresyon tahmin ediyoruz, burada:
Ayrıca, değerlerini değerlerine göre tahmin eden bir regresyon tahmin ediyoruz :
Şimdi biz verildi değerleri varsayalım , o zaman tahmin etmek için iki farklı yöntem olurdu :
Hangisi genel olarak daha iyi olurdu?
İlk denklemin daha iyi olacağını tahmin ediyorum, çünkü veri noktalarının iki formundan bilgi kullanıyor, ikinci denklem ise sadece tahmin değeri olan veri noktalarından bilgi kullanıyor . İstatistik eğitimi sınırlı ve bu nedenle profesyonel tavsiye almak istiyorum.
Ayrıca, genel olarak, eksik bilgi içeren verilere en iyi yaklaşım nedir? Başka bir deyişle, tüm boyutlarında değeri olmayan verilerden en fazla bilgiyi nasıl çıkarabiliriz ?