«outliers» etiketlenmiş sorular

Bir aykırı değer, bir veri kümesinin basit bir karakterizasyonuna göre olağandışı veya iyi tanımlanmayan bir gözlemdir. Rahatsız edici bir olasılık, bu verilerin araştırılması amaçlanandan farklı bir popülasyondan gelmesidir.

4
Standart sapmaları kullanarak aykırı değerlerin algılanması
Buradaki sorumu takiben aykırı noktaları saptamak için standart sapmanın kullanımına karşı veya bunun karşısında güçlü görüşler olup olmadığını merak ediyorum (örneğin, 2 standart sapmadan daha fazlası olan herhangi bir veri noktası bir aykırıdır). Bunun çalışmanın bağlamına bağlı olduğunu biliyorum, örneğin, 48 kg veri noktası, bebeklerin kilolarının incelenmesinde kesinlikle bir aykırı …
27 outliers 


4
RANSAC neden istatistiklerde en yaygın şekilde kullanılmıyor?
Bilgisayarla görme alanında, çoğu aykırı verilere veri yerleştirmek için RANSAC (Random Sample Consensus) yöntemini kullandım. Bununla birlikte, istatistikçiler tarafından kullanıldığını hiç görmedim ve her zaman "istatistiksel olarak sağlam" bir yöntem olarak görülmediği izlenimini edindim. Neden böyle? Doğada, rastgele, analiz etmeyi zorlaştırıyor, ancak önyükleme yöntemleri de var. Yoksa sadece bir akademik …

3
Dalgacıkların zaman serisi temelli anomali tespit algoritmalarına uygulanması
Andrew Moore'dan İstatistiksel Veri Madenciliği Dersleri yoluyla çalışmaya başladım (bu alana ilk kez giriş yapan herkese şiddetle tavsiye edilir). Moore'un hastalık salgınlarını tespit etmek için bir algoritma oluşturmada kullanılan tekniklerin çoğunu takip ettiği "Zaman serisi temelli anomali tespit algoritmalarına giriş genel bakış" başlıklı bu son derece ilginç PDF dosyasını okuyarak …



2
Bir gözlem seviyesi Mahalanobis mesafesinin dağılımı
Çok değişkenli normal iid örneğine sahipseniz X1,…,Xn∼Np(μ,Σ)X1,…,Xn∼Np(μ,Σ)X_1, \ldots, X_n \sim N_p(\mu,\Sigma) ve (sıralama vektörü örnek bir noktadan [kare] Mahalanobis mesafe olan matris kullanılarak ağırlığı için), dağılımı ne örnek (Mahalanobis mesafe örnek kovaryans matrisi kullanılarak ortalama )?a Ad2i(b,A)=(Xi−b)′A−1(Xi−b)di2(b,A)=(Xi−b)′A−1(Xi−b)d_i^2(b,A) = (X_i - b)' A^{-1} (X_i - b)aaaAAA ˉ X Sd2i(X¯,S)di2(X¯,S)d_i^2(\bar X,S)X¯X¯\bar XSSS …

4
Çoklu regresyon yapılırken istatistiksel yazılım tarafından aykırı olarak işaretlenmiş durumları silmek mi istiyorsunuz?
Çoklu regresyon analizleri yapıyorum ve verilerimdeki aykırı değerlerin silinip silinmemesi gerektiğinden emin değilim. Endişelendiğim veriler SPSS kutucuklarında "daireler" olarak gözüküyor, ancak yıldız işareti yok (bu onların 'o kadar da' kötü olmadıklarını düşünmeme neden oluyor). Endişelendiğim davalar çıktıdaki "casewise diagnostics" tablosunun altında görünüyor - bu nedenle bu davaları silmeli miyim?

1
Sayım verilerinde aykırı değerlerin algılanması
Birçok farklı sayım verisi seti için aykırı tespiti içeren, basitçe ileri düz bir problem olduğunu düşündüğüm bir şeye sahibim. Spesifik olarak, bir dizi sayım verisindeki bir veya daha fazla değerin, dağıtımdaki geri sayımlara göre beklenenden yüksek veya düşük olup olmadığını belirlemek istiyorum. Şaşırtma faktörü, 3.500 dağıtım için bunu yapmam gerektiği …

2
Bootstrapping - önce aykırı değerleri çıkarmam gerekir mi?
Yeni bir ürün özelliği için ayrı bir test yaptık ve gelirdeki artışın önemli olup olmadığını ölçmek istiyoruz. Gözlemlerimiz kesinlikle normal olarak dağıtılmamıştır (kullanıcılarımızın çoğu harcama yapmaz ve bunu yapanların içinde çok sayıda küçük harcayan ve birkaç çok büyük harcayan kişiye doğru eğilir). Araçları karşılaştırmak, normal olarak dağıtılmayan verilerin konusunu ele …

3
Bir kutu grafiğindeki çarpıklık nasıl değerlendirilir?
Bu verilerden oluşturulan bir kutu grafiğine bakarak çarpıklığa nasıl karar verilir: 340, 300, 520, 340, 320, 290, 260, 330 Bir kitap der ki, "Eğer alt çeyrek medyandan üst çeyreğe göre daha uzaksa, dağılım negatiftir." Diğer bazı kaynaklar aşağı yukarı aynı şeyi söyledi. R kullanarak bir kutu çizimi yaptım. Olumsuz çarpık …

2
Kukla Özelliklerle (ve diğer Ayrık / Kategorik Özelliklerle) Anomali Tespiti
tl; Dr. discreteAnomali tespiti yaparken verilerle başa çıkmanın önerilen yolu nedir ? categoricalAnomali tespiti yaparken verilerle başa çıkmanın önerilen yolu nedir ? Bu yanıt , yalnızca sonuçları filtrelemek için ayrık verilerin kullanılmasını önerir. Belki de kategori değerini yüzdesel gözlem şansı ile değiştirebilir misiniz? giriş Bu benim ilk kez buraya gönderiyorum, …

4
Bir aykırı değer için Box ve Whisker Plot tanımının temeli nedir?
Bir Kutu ve Bıyık grafiği için bir aykırı standart tanımı aralığının dışındaki noktalardır ; burada ve ilk çeyrek ve verinin üçüncü çeyreğidir.{Q1−1.5IQR,Q3+1.5IQR}{Q1−1.5IQR,Q3+1.5IQR}\left\{Q1-1.5IQR,Q3+1.5IQR\right\}IQR=Q3−Q1IQR=Q3−Q1IQR= Q3-Q1Q1Q1Q1Q3Q3Q3 Bu tanımın temeli nedir? Çok sayıda nokta ile mükemmel bir normal dağılım bile aykırı değerlere geri döner. Örneğin, diziyle başladığınızı varsayalım: xseq<-seq(1-.5^1/4000,.5^1/4000, by = -.00025) Bu dizi …

1
Aykırı değerleri ortaya çıkarmak için dışarıda bırakma ortalaması ve standart sapma kullanabilir miyiz?
Diyelim ki normal veri dağıtımı yaptım. Verilerin her bir elemanı için ortalamadan kaç SD olduğunu kontrol etmek istiyorum. Verilerde bir aykırı değer olabilir (muhtemelen sadece bir, ama aynı zamanda iki veya üç olabilir), ancak bu aykırı temelde aradığım şeydir. Şu anda baktığım öğeyi ortalama ve SD'nin hesaplanmasından geçici olarak hariç …

3
Aşırı bir aykırı olan kutu arsa nasıl sunulur?
Bazı verileri sunma konusunda rehberlik edebilirim. Bu ilk grafik, sitokin IL-10 için bir vaka kontrol karşılaştırmasıdır. El ile y eksenini% 99 veri içerecek şekilde ayarladım. Bunu manuel olarak ayarlamamın nedeni, vaka grubunun aşırı bir aykırı değer olmasıdır. Ortak çalışanlarım veri kümemize aykırı bir kaldırma işlemi yapmakta tereddüt ediyorlar. Ben iyiyim, …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.