«outliers» etiketlenmiş sorular

Bir aykırı değer, bir veri kümesinin basit bir karakterizasyonuna göre olağandışı veya iyi tanımlanmayan bir gözlemdir. Rahatsız edici bir olasılık, bu verilerin araştırılması amaçlanandan farklı bir popülasyondan gelmesidir.

3
Veri önişleme ve aykırı algılama tekniklerini kapsayan iyi kitaplar
Başlık ilerledikçe, genel olarak veri önişlemini ve özellikle aykırı algılama tekniklerini kapsayan iyi, güncel bir kitap biliyor mu? Kitabın sadece buna odaklanması gerekmiyor, ancak yukarıda belirtilen konularla kapsamlı bir şekilde ilgilenmeli - bir başlangıç ​​noktası olan ve kağıtların bir listesini alıntılayan bir şeyden memnun olmazdım, çeşitli tekniklerin açıklamaları görünmelidir kitabın …

5
Zaman serisi veri tahmini için bir kez tespit edilen aykırı değerler nasıl düzeltilir?
Zaman serisi verilerinde buldukları / algıladıkları zaman aykırı değerleri düzeltmenin bir yolunu bulmaya çalışıyorum. R'deki nnetar gibi bazı yöntemler, büyük / büyük aykırı değerlere sahip zaman serileri için bazı hatalar verir. Zaten eksik değerleri düzeltmeyi başardım, ancak aykırı değerler hala tahminlerime zarar veriyor ...

2
Anomali tespiti: hangi algoritmayı kullanmalı?
Bağlam: Yazım hatası olabilecek mantıksız verileri filtrelemek için klinik verileri analiz eden bir sistem geliştiriyorum. Şimdiye kadar ne yaptım: Akla yatkınlığı ölçmek için şimdiye kadar denediğim veriyi normalleştirmek ve sonra D setindeki bilinen veri noktalarına olan uzaklığına bağlı olarak p noktası için bir güvenilirlik değeri hesaplamaktı (= eğitim seti): plausibility(p)=∑q∈DGauss(distance(p,q))plausibility(p)=∑q∈DGauss(distance(p,q))\text{plausibility}(p)=\sum_{q\in …

1
ARIMA modelimdeki gözlem 48'e yenilikçi bir aykırı değeri nasıl dahil edebilirim?
Bir veri kümesi üzerinde çalışıyorum. Bazı model tanımlama tekniklerini kullandıktan sonra bir ARIMA (0,2,1) modeliyle çıktım. Orijinal veri setimin 48. gözleminde yenilikçi bir aykırı değer (IO) tespit etmek için R'deki detectIOpaketteki işlevi kullandım .TSA Öngörme amacıyla kullanabilmem için bu aykırı değeri modelime nasıl dahil edebilirim? ARIMAX modelini kullanmak istemiyorum çünkü …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
Üniform ve üniform olmayan kutular ile histogram
Bu soru , üniform ve üniform olmayan bir histogram arasındaki temel farkı açıklar. Ve bu soru , histogramın veri örneklerinin çizildiği dağılımı temsil etme derecesini optimize eden (bir anlamda) tek tip bir histogramın kutu sayısını seçmek için temel kuralı tartışıyor. Üniforma ile üniform olmayan histogramlar hakkında aynı tür bir "iyimserlik" …

4
Çevrimiçi aykırı değer tespiti
Yüksek verimli görüntüleme hattının bir parçası olarak hatalı görüntüleri ve / veya hatalı bölümleri tespit etmek için otomatik olarak bölünmüş mikroskopi görüntülerini işlemek istiyorum. Her ham görüntü ve segmentasyon için hesaplanabilen ve görüntü kusurlu olduğunda "aşırı" hale gelen bir dizi parametre vardır. Örneğin, görüntüdeki bir kabarcık, algılanan "hücrelerden" birinde muazzam …
10 outliers  online 

1
Outlier ve Inlier arasındaki fark
LOF ölçüsünde (Yerel Outlier Faktörü) inlier terimini tökezledim , aykırı değerlerin terimini biliyorum (temelde yalancılar - örneklerin geri kalanı gibi davranmayan durumlar). Anormallik tespiti bağlamında 'İnliers' ne anlama geliyor? ve aykırı değerlerle nasıl ilişkilidir?

2
Tsoutliers paketi ve auto.arima kullanarak tahmin etme ve tahmin yapma
1993'ten 2015'e kadar aylık verilerim var ve bu verilerle ilgili tahmin yapmak istiyorum. Aykırı değerleri tespit etmek için tsoutliers paketini kullandım, ancak veri setimle nasıl tahmin etmeye devam ettiğimi bilmiyorum. Bu benim kodum: product.outlier<-tso(product,types=c("AO","LS","TC")) plot(product.outlier) Bu benim tsoutliers paketinden çıktı ARIMA(0,1,0)(0,0,1)[12] Coefficients: sma1 LS46 LS51 LS61 TC133 LS181 AO183 AO184 …

2
Model oluşturma süreci etkileşimli olduğunda geri test veya çapraz doğrulama
Performansını geri test etmek istediğim bazı öngörülü modellerim var (yani, veri setimi al, önceki bir noktaya "geri sar" ve modelin prospektif olarak nasıl performans göstereceğini görüyorum). Sorun şu ki, bazı modellerim etkileşimli bir süreçle oluşturuldu. Örneğin, Frank Harrell'in Regresyon Modelleme Stratejilerindeki tavsiyeyi takiben, bir modelde, özellikler ve yanıt arasındaki olası …

1
Yerel Aykırı Faktör (LOF) algılama analizi için k-değeri seçme
Üç boyutlu veri kümesi var ve en benzersiz veya garip değerleri belirlemek için yerel aykırı faktör analizi kullanmaya çalışıyorum. LOF analizinde kullanılacak k-değerine nasıl karar verilir? K-değerinin ne belirlediğini anlıyorum ve bu yüzden farklı k'ler kullanarak biraz farklı sonuçlar gördüğüme şaşırmadım, ancak veri setimin beni başkaları üzerinde bir değere doğru …

2
Kesilmiş ortalama ve medyan
Acil servise yapılan tüm çağrıları ve ambulans departmanının yanıt sürelerini içeren bir veri setim var. Kayıt sürelerinde bazı hatalar olduğunu itiraf ettiler, çünkü kayıt yapmaya başlamadıkları (yani değer 0) ya da saati durduramadıkları (böylece değer çok yüksek olabilir). Merkezi eğilimi öğrenmek istiyorum ve aykırı değerlerden kurtulmak için ortanca veya kesilmiş …

6
Anomali tespiti için özellikler nasıl hazırlanır / oluşturulur (ağ güvenliği verileri)
Amacım izinsiz giriş tespiti amacıyla kümeleme / anormallik algılama kullanarak ağ günlüklerini (ör. Apache, syslog, Active Directory güvenlik denetimi vb.) Analiz etmektir. Günlüklerden IP adresi, kullanıcı adı, ana bilgisayar adı, hedef bağlantı noktası, kaynak bağlantı noktası ve benzeri gibi çok fazla metin alanım var (toplam 15-20 alanda). Günlüklerde bazı saldırılar …


1
Aşçının mesafe kesme değeri
Regresyonum üzerinde yüksek etkiye sahip olan aykırı değerleri belirlemek için aşçının mesafesini okuyorum. Cook'un orijinal çalışmasında, etkileyicileri tanımlamak için 1'lik bir kesme oranının karşılaştırılabilir olması gerektiğini söylüyor. Ancak, diğer çeşitli çalışmalar4n4n\frac{4}{n} veya 4n−k−14n−k−1\frac{4}{n-k-1} bir kesme olarak. Çalışmamda, artıklarımın hiçbirinin D değeri 1'den yüksek değil. 4n4n\frac{4}{n} bir kesme olarak (4149=.026)(4149=.026)(\frac{4}{149}= .026), …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.