Teklifin içinde çok sayıda kusur var. İşte belki en büyüğüdür.
Veri topladığınızı ve aşağıdaki değerleri gördüğünüzü varsayalım:
2 , 3 , 1
6 / 3 = 2
Sonra bir aykırı gelir:
2 , 3 , 1 , 1000
Yani bunu ortalamanın yerine koyarsın:
2 , 3 , 1 , 2
Sıradaki numara iyi:
2 , 3 , 1 , 2 , 7
Şimdi ortalama 3'tür. Bekle bir dakika, ortalama şimdi 3'tür, ancak dördüncü değer olarak gerçekleştiği için 1000'i ortalama 2 ile değiştirdik. Örneklerin sırasını değiştirirsek ne olur?
2 , 3 , 1 , 7 , 1000
( 2 + 3 + 1 + 7 ) / 4 = 13 / 4
Sorun, 1000 yerine ikame edilen yalancı veri olmasıdır bağımlı diğer veri. Örneklerin bağımsız ölçümleri temsil etmesi gerekiyorsa bu epistemolojik bir sorundur.
Öyleyse, varsayımlarınıza uymayan verileri yalnızca elinizde tutmamanız, aynı zamanda tahrifat yapmanız gibi bariz bir probleminiz var. İstenmeyen bir sonuç olduğunda,nnnnn
Temel olarak, uymayan sonuçları kesmek bir şeydir (ve deneycinin değişen ruh hali değişimlerine göre değil, bir algoritmaya göre tutarlı bir şekilde yapılırsa gerekçelendirilebilir).
Kesin tahrif edici sonuçlar felsefi, epistemolojik ve etik gerekçelerle sakıncalıdır.
Sonuçların nasıl kullanıldığı ile ilgili bazı hafifletici durumlar olabilir. Mesela, aykırı değerlerin bu ortalama ile ikame edilmesinin, kapalı devre bir kontrol sistemi kurmasını sağlayan bazı gömülü bilgisayar algoritmasının bir parçası olduğunu söyleyin. (Bazı sistem çıkışlarını örnekler, daha sonra kontrolü sağlamak için girişleri ayarlar.) Her şey gerçek zamandır ve bu nedenle eksik veriler yerine belirli bir süre boyunca bir şeyler sağlanmalıdır. Bu geçiştirme, aksaklıkların üstesinden gelmeye yardımcı oluyorsa ve sorunsuz çalışmayı sağlıyorsa, hepsi iyi.
İşte dijital telefondan başka bir örnek: PLC (paket kaybı gizleme). Bok olur ve paketler kaybolur, ancak iletişim gerçek zamanlıdır. PLC, doğru alınan paketlerden gelen son adım bilgilerine dayanarak sahte ses parçaları sentezler. Eğer bir konuşmacı ünlü "aaa" demişse ve sonra bir paket kaybolmuşsa, PLC, "aaa" 'yı çerçeve süresi boyunca ekstrapolasyonla eksik paketi doldurabilir (5 veya 10 milisaniye veya her neyse). "Aaa" konuşmacının sesini andırıyor. Bu, kötü olarak kabul edilen değerleri yerine koymak için bir "ortalama" kullanmaya benzer. Bu iyi bir şey; sesin girip çıkmasından daha iyi ve anlaşılırlığa yardımcı oluyor.
Verilerin geçmesi, başarısız işleri örtbas etmek için insanlara yalan söyleme programının bir parçasıysa, bu başka bir şeydir.
Yani, uygulamadan bağımsız olarak düşünemiyoruz: istatistikler nasıl kullanılıyor? Yer değiştirmeler geçersiz sonuçlara yol açar mı? Etik çıkarımlar var mı?