Ben (Python scikit öğrenmek kullanarak) bir ikili sınıflandırma sorununa saldırmak için kullanacağım özellik vektörleri büyük bir set var. Öngörü hakkında düşünmeye başlamadan önce, eksik verilerin 'rastgele eksik' mi yoksa rastgele olmayan eksik mi olduğunu verinin kalan kısımlarından belirlemeye çalışmakla ilgileniyorum.
Bu soruya yaklaşmanın mantıklı bir yolu nedir?
Daha iyi bir soru, verilerin 'rastgele tamamen eksik olup olmadığını' sormaktır. Bunu yapmanın mantıklı bir yolu nedir?