Konuya bağlı olarak temellere (aykırı değerleri, eksik değerleri, ağırlıklandırmayı, kodlamayı) sahipseniz, açık akademik literatürde çok daha fazlası bulunur. Örneğin, anket araştırmasında (birçok şeyin yanlış gidebileceği ve birçok önyargı kaynağına eğilimli bir konu olan) bulunacak birçok iyi makale bulunmaktadır.
Düzenli kesitsel regresyon için hazırlanırken, işler daha az karmaşık olabilir . Sorun, örneğin çok fazla 'aykırı değer' kaldırmanız ve dolayısıyla modelinizi yapay olarak iyi takmanız olabilir.
Bu nedenle, iyi teknikler öğrenmenin yanı sıra sağduyunuzu da aklınızda bulundurmanızı öneririm. Teknikleri körü körüne değil, doğru uyguladığınızdan emin olun. Diğer cevaplardaki yazılım tartışmasına gelince. Veri kümesi boyutunuza bağlı olarak SPSS'nin veri hazırlama için kötü olmadığını düşünüyorum (SAS hakkında da iyi şeyler duydum). Açılır menüler çok sezgiseldir.
Ancak sorunuza doğrudan bir cevap olarak, akademik literatür konuya ve analize bağlı olarak veri hazırlığınız için çok iyi bir kaynak olabilir veya olmayabilir.