'Outlier', analizden çıkarmak için işleminizin nasıl görünmesini beklediğinize uymayan verileri bir araya toplamak için uygun bir terimdir.
öneririm Aykırı aykırı kaldırma asla (sonradan ihtar) . Geçmişim istatistiksel süreç kontrolüdür, bu nedenle çoğu zaman verilere ve dağılıma bağlı olarak bir çalışma tablosu / taşıma kutusu grafiği / vb.
Aykırı olanlarla ilgili olan şey, 'işleminiz' hakkında her zaman bilgi sağlayacaklarıdır. Genellikle, bir süreç olarak düşündüğünüz şey aslında birçok süreçtir ve sizin için kredi vermekten çok daha karmaşıktır.
Sorunuzdaki örneği kullanarak, bir takım 'süreçler' olabileceğini öneriyorum. nedeniyle varyasyon olacak ...
- bir iletkenlik cihazı tarafından alınan örnekler
- arasında alınan örnekleriletkenlik cihazları
- konu bir sondayı çıkardığında
- konu taşındığında
- bir denek cildindeki vücutta veya farklı örnekleme günlerinde (saç, nem, yağ vb.) farklılıklar
- konular arasındaki farklar
- Ölçümler alan kişinin eğitimi ve personel arasındaki farklılıklar
Bu işlemlerin tümü, verilerde ekstra değişkenlik üretecek ve muhtemelen ortalamayı hareket ettirecek ve dağılımın şeklini değiştirecektir. Bunların birçoğu farklı süreçlere ayrılamayacaksınız.
Böylece veri noktalarının 'aykırı değerler' olarak kaldırılması fikrine gidiyorum ... sadece veri noktalarını kaldırırdım; bunları kesinlikle analizime dahil etmek istemediğim belirli bir 'sürece' bağlayabilirim. Daha sonra dahil olmama nedenlerinin analizinizin bir parçası olarak kaydedildiğinden emin olmanız gerekir, bu nedenle açıktır. İlişkilendirme varsaymayın, veri toplama sırasında gözlemleyerek ekstra notlar almanın anahtarı budur.
İfadenize meydan okurdum, çünkü 'çoğu zaten hatadır', hata olmadığı için, ancak ölçümlerinizde farklı olarak tanımladığınız farklı bir sürecin bir parçası.
Örneğinizde, analiz etmek istemediğiniz ayrı bir işleme atfedilebileceğiniz veri noktalarını dışlamanın makul olduğunu düşünüyorum .