Keşifsel veri analizi (EDA) çoğu zaman, mutlaka ilk hipotez grubuna ait olmayan diğer "izleri" keşfetmeye yol açar. Sınırlı örneklem büyüklüğü ve farklı anketler (sosyo-demografik veriler, nöropsikolojik veya tıbbi ölçekler - örneğin, zihinsel veya fiziksel işleyiş, depresyon / anksiyete düzeyi, belirtiler kontrol listesi) ile toplanan çok sayıda veri içeren çalışmalarda böyle bir durumla karşı karşıyayım. ). EDA'nın, ek sorulara / hipoteze çevrilen bazı beklenmeyen ilişkileri (“beklenmeyen” anlamına gelir; ilk analiz planına dahil edilmediği anlamına gelir) vurgulamaya yardımcı olur.
Gibi, veri overfitting için böyledir dip tarama veya gözetleme genelleme yoktur sonuçlarına yol yapar. Bununla birlikte, çok fazla veri olduğunda, sınırlı bir hipotez seti önermesi (araştırmacı veya hekim için) oldukça zordur.
Küçük örneklemli çalışmalarda EDA'nın tanımlanmasına yardımcı olabilecek kabul edilmiş yöntemler, tavsiyeler ya da kurallar olup olmadığını bilmek istiyorum.