«outliers» etiketlenmiş sorular

Bir aykırı değer, bir veri kümesinin basit bir karakterizasyonuna göre olağandışı veya iyi tanımlanmayan bir gözlemdir. Rahatsız edici bir olasılık, bu verilerin araştırılması amaçlanandan farklı bir popülasyondan gelmesidir.

1
Tahminlerde tatillerin etkisi nasıl hesaplanır
Haftalık mevsimselliği olan oldukça tahmin edilebilir bir günlük zaman serim var. Tatil olmadığında oldukça doğru görünen (çapraz doğrulama ile onaylanmış) tahminler bulabiliyorum. Ancak, tatiller olduğunda, aşağıdaki sorunlara sahibim: Tüm tarihi tatiller 0 olmasına rağmen, tahminlerimdeki tatiller için sıfırdan farklı sayılar alıyorum. Bu asıl mesele değil. Sorun şu ki ... Tatillerde …

3
Artırma yöntemi neden aykırı değerlere duyarlıdır?
Artırma yöntemlerinin aykırı değerlere duyarlı olduğunu söyleyen birçok makale buldum, ancak nedenini açıklayan bir makale yok. Deneyimlerime göre aykırı değerler herhangi bir makine öğrenimi algoritması için kötüdür, ancak artırma yöntemleri neden özellikle hassastır? Aşağıdaki algoritmalar aykırı değerlere duyarlılık açısından nasıl sıralanır: boost ağacı, rastgele orman, sinir ağı, SVM ve lojistik …

4
Aykırı değerleri kaldırmak için iyi bir form mu?
Yazılım derlemeleri için istatistikler üzerinde çalışıyorum. Başarılı / başarısız ve geçen süre için her yapı için veri var ve biz bu / hafta ~ 200 üretiyoruz. Başarı oranının toplanması kolaydır,% 45'inin herhangi bir hafta geçtiğini söyleyebilirim. Ancak geçen süreyi de toplamak istiyorum ve verileri çok kötü bir şekilde yanlış tanıtmadığımdan …

3
Anomali tespiti için eksik değerlere sahip zaman serilerinde STL
Bazı eksik gözlemleri olan bir dizi iklim verisinde anormal değerleri tespit etmeye çalışıyorum. İnternette arama yaparken birçok mevcut yaklaşım buldum. Bunlardan stl ayrışması, eğilim ve mevsimsel bileşenleri ortadan kaldırmak ve geri kalanını incelemek anlamında çekici görünüyor. STL Okuma : Loess'e Dayalı Mevsimsel Trend Ayrıştırma Prosedürü , stldeğişkenlik atama ayarlarını belirleme …

1
R - serbestlik derecesinde PROC Mixed ve lme / lmer arasındaki farklar
Not: önceki sorumun yasal nedenlerle silinmesi gerektiğinden, bu soru bir gönderidir. Fonksiyonlu SAS PROC MIXED karşılaştırarak birlikte lmegelen nlmeR paketin, bazı çok kafa farklılıklar tökezledi. Daha spesifik olarak, farklı testlerdeki özgürlük dereceleri ve arasında farklılık gösterir PROC MIXEDve lmenedenini merak ettim. Aşağıdaki veri kümesinden başlayın (R kodu aşağıda verilmiştir): ind: …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

3
Çok küçük setlerde aykırı algılama
On iki örnek parlaklık değeri verildiğinde esas olarak kararlı bir ışık kaynağının parlaklığı için olabildiğince doğru bir değer elde etmeliyim. Sensör kusurlu ve ışık zaman zaman daha parlak veya daha karanlık "titreyebilir", bu da göz ardı edilebilir, bu nedenle daha fazla algılama ihtiyacım var (sanırım?). Burada çeşitli yaklaşımları okudum ve …

4
Zaman Serilerinde Aykırı Tespit: Yanlış pozitifler nasıl azaltılır?
Zaman serilerinde aykırı algılamayı otomatikleştirmeye çalışıyorum ve burada Rob Hyndman tarafından önerilen çözümde bir değişiklik kullandım . Diyelim ki, çeşitli ülkelerden bir web sitesine günlük ziyaretleri ölçüyorum. Günlük ziyaretlerin birkaç hundrend veya binlerce olduğu bazı ülkelerde, yöntemim makul çalışıyor gibi görünüyor. Bununla birlikte, bir ülkenin günde sadece 1 veya 2 …

1
Güçlü basıklık tahmini?
Basıklık için normal tahmin ediciyi kullanıyorum, , ama ampirik dağılımımda küçük 'aykırı değerlerin' bile fark ettim yani merkezden uzak küçük zirveler, onu muazzam bir şekilde etkiler. Daha sağlam bir basıklık tahmincisi var mı?K^=μ^4σ^4K^=μ^4σ^4\hat{K}=\frac{\hat{\mu}_4}{\hat{\sigma}^4}

2
Genelleştirilmiş Doğrusal Karışık Modeller: Teşhis
Rastgele bir kesişim lojistik regresyonum var (tekrarlanan ölçümler nedeniyle) ve özellikle aykırı değerler ve etkili gözlemlerle ilgili bazı teşhisler yapmak istiyorum. Göze çarpan gözlemler olup olmadığını görmek için artıklara baktım. Ama aynı zamanda Cook'un mesafesi veya DFFITS gibi bir şeye bakmak istiyorum. Hosmer ve Lemeshow (2000), ilişkili veriler için model …

2
Aykırı değerleri tespit etmek için IQR ne kadar doğrudur
İşlemlerin çalışma sürelerini analiz eden bir komut dosyası yazıyorum. Onların dağıtım emin değilim ama bir sürecin "çok uzun" çalışır olmadığını bilmek istiyorum. Şimdiye kadar son çalışma sürelerinin 3 standart sapmasını kullanıyorum (n> 30), ancak veriler normal değilse (ki bu görünmüyorsa) bunun yararlı bir şey sağlamadığı söylendi. Belirten başka bir aykırı …

1
Anomali tespiti için otomatik özellik seçimi
Anomali tespiti için özellikleri otomatik olarak seçmenin en iyi yolu nedir? Önemli olan çıkış: Ben normalde özellikleri insan uzmanlar tarafından seçilir bir algoritma olarak Anomali Detection tedavi aralık o kadar hatta birçok özellikleri ile siz - ( "anormal çıkış anormal giriş" gibi) olabilir birleştirerek çok daha küçük bir alt kümesi …

3
Ortalama GPS noktasını bulma
Bir nokta popülasyonundan ortalama GPS noktasını bulmak için bir program yazmam gerekiyor. Uygulamada aşağıdakiler olur: Her ay bir kişi aynı statik varlığın bir GPS noktasını kaydeder. GPS'in doğası gereği, bu noktalar her ay biraz farklıdır. Bazen kişi bir hatayı tamamen farklı bir yerde yanlış test yapar. Her GPS noktasının, geçerli …
11 outliers  spatial 

2
Regresyon kullanarak aykırı algılama
Regresyon dışlayıcı tespiti için kullanılabilir. Aykırı değerleri kaldırarak bir regresyon modelini geliştirmenin yolları olduğunu anlıyorum. Ancak buradaki temel amaç bir regresyon modeline uymak değil, regresyon kullanarak yalancıları bulmaktır

2
Etkili artık ve aykırı değer
İlk olarak, cevap için bu sitede arama yaptığımı belirtmeliyim. Soruma cevap veren bir soru bulamadım ya da bilgi seviyem o kadar düşük ki cevabı zaten okuduğumu fark etmedim. AP İstatistik Sınavı için okuyorum. Doğrusal regresyonu öğrenmek zorundayım ve konulardan biri artıklar. İstatistik ve Veri Analizine Giriş sayfasının 253. sayfasında bir …

6
Doğrusal olmayan regresyon için aykırı değerleri belirleme
Akarların fonksiyonel tepkisi alanında araştırma yapıyorum. Rogers tip II fonksiyonunun parametrelerini (saldırı hızı ve işleme süresi) tahmin etmek için bir gerileme yapmak istiyorum. Bir ölçüm veri setim var. Aykırı değerleri en iyi nasıl belirleyebilirim? Regresyonum için R'de (doğrusal olmayan bir regresyon) aşağıdaki komut dosyasını kullanıyorum: (tarih seti, değerler (ilk av …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.