«robust» etiketlenmiş sorular

Genel olarak sağlamlık, bir istatistiğin temel varsayımlarından sapmalara duyarsızlığını ifade eder (Huber ve Ronchetti, 2009).

14
Neden sağlam (ve dirençli) istatistikler klasik tekniklerin yerine geçmedi?
Verileri kullanarak iş sorunlarını çözerken, klasik istatistiklerin altını çizdiği en az bir anahtar varsayımın yaygın olduğu yaygındır. Çoğu zaman, hiç kimse bu varsayımları kontrol etmekte hiçbir sıkıntı çekmez. Örneğin, ortak web metriklerinin çoğunun "uzun kuyruklu" olduğu (normal dağılıma göre) şimdiye dek çok iyi belgelendirildiği anlaşılmaktadır. Diğer bir örnek olarak, çevrimiçi …

3
Zorunlu olmadıkça neden normal regresyonda dağıtılan hata terimlerini (ve homoskedasticity) neden bu kadar önemsiyoruz?
Sanırım birisinin artıkların ve / veya heteroskedastikliğin normal dışı olmasının OLS varsayımlarını ihlal ettiğini söylediğini duyduğumda sinirleniyorum. Bir OLS modelindeki parametreleri tahmin etmek için , bu varsayımların hiçbiri Gauss-Markov teoremi tarafından gerekli değildir. Bunun OLS modeli için Hipotez Testinde nasıl önemli olduğunu görüyorum , çünkü bu şeylerin bize t-testleri, F-testleri …

4
Aykırılıklara dayanıklı hızlı doğrusal regresyon
Aykırı değerlere sahip doğrusal verilerle uğraşıyorum, bunlardan bazıları tahmini regresyon çizgisinden 5 standart sapmadan daha uzak. Bu noktaların etkisini azaltan lineer bir regresyon tekniği arıyorum. Şimdiye dek yaptığım, bütün verileri içeren regresyon çizgisini tahmin etmek, ardından veri noktasını çok büyük kare artıkları ile atmak (ilk% 10'u söyleyin) ve regresyonu bu …

4
R'deki Stata'nın “sağlam” seçeneğini çoğaltma
robustR'deki Stata seçeneğinin sonuçlarını kopyalamaya çalışıyorum. rlmMASS paketini ve lmrob"robustbase" paketinden gelen komutları kullandım. Her iki durumda da, sonuçlar Stata'daki "sağlam" seçeneğinden oldukça farklıdır. Herhangi biri bu bağlamda bir şey önerebilir mi? Stata'da sağlam seçeneği kullandığımda elde ettiğim sonuçlar: . reg yb7 buildsqb7 no_bed no_bath rain_harv swim_pl pr_terrace, robust Linear …

6
Kabaca normal bir dağılımın ölçeğini tahmin etmek için sağlam bir Bayesian modeli ne olurdu?
Bir dizi sağlam tahmin edici vardır . Kayda değer bir örnek, olarak standart sapma ile ilgili olan medyan mutlak sapmadır . Bir Bayesian çerçevesinde , kabaca normal bir dağılımın konumunu (örneğin, aykırıklar tarafından kontamine olmuş bir Normal)) sağlam bir şekilde tahmin etmenin çeşitli yolları vardır; Şimdi benim sorum:σ= M A …

8
Aykırı değerlerin ortalama ile değiştirilmesi
Bu soru internet meraklısı olmayan arkadaşım tarafından soruldu. İstatistik geçmişim yok ve bu soru için internette arama yapıyorum. Soru şudur: aykırı değerlerin ortalama değerle değiştirilmesi mümkün müdür? mümkünse, bu bildirimi yedeklemek için kitap referansı / dergi var mı?

2
% 50 güven aralığı% 95 güven aralığından daha sağlam olarak tahmin ediliyor mu?
Benim sorum , daha güçlü bir şekilde tahmin edilmelerine rağmen,% 95 güven aralıkları yerine% 50 güven aralıklarının kullanılmasını savunan Andrew Gelman'ın blog yazısında bu yorumdan çıkıyor : 3 nedenden dolayı% 50 ila% 95 aralıklarını tercih ederim: Hesaplamalı kararlılık, Daha sezgisel değerlendirme (% 50 aralıkların yarısı gerçek değeri içermelidir), Uygulamalarda, gerçekçi …

2
Neden normal hatalar yerine t hataları kullanmalıyız?
Gelen bu Andrew Gelman tarafından blog post aşağıdaki pasaj vardır: 50 yıl önceki Bayesian modelleri umutsuzca basit görünüyor (tabii ki, basit problemler hariç) ve bugünün Bayesian modellerinin umutsuzca basit görünmesini bekliyorum, bundan dolayı 50 yıl. (Sadece basit bir örnek için: muhtemelen hemen hemen her yerdeki normal hatalar yerine t rutin …

2
Bir glm çalışırken "sistem hesaplama açısından tekil" hatası
Bir glm tahmini yürütmek için robustbase paketini kullanıyorum . Ancak bunu yaptığımda aşağıdaki hatayı alıyorum: Error in solve.default(crossprod(X, DiagB * X)/nobs, EEq) : system is computationally singular: reciprocal condition number = 1.66807e-16 Bu ne anlama / anlama geliyor? Ve nasıl hata ayıklayabilirim? PS. Cevaplamak için herhangi bir şeye (formül / …

4
RANSAC neden istatistiklerde en yaygın şekilde kullanılmıyor?
Bilgisayarla görme alanında, çoğu aykırı verilere veri yerleştirmek için RANSAC (Random Sample Consensus) yöntemini kullandım. Bununla birlikte, istatistikçiler tarafından kullanıldığını hiç görmedim ve her zaman "istatistiksel olarak sağlam" bir yöntem olarak görülmediği izlenimini edindim. Neden böyle? Doğada, rastgele, analiz etmeyi zorlaştırıyor, ancak önyükleme yöntemleri de var. Yoksa sadece bir akademik …

5
Örneklerin dağılımları normal olmadığında bağımsız numuneler t-testi ne kadar sağlamdır?
Örneklerin dağılımları normallikten çıktığında t- testinin "makul derecede sağlam" olduğunu okudum . Tabii ki, önemli olan farklılıkların örnekleme dağılımı. İki grup için verilerim var. Gruplardan biri bağımlı değişkene aşırı eğridir. Örneklem büyüklüğü her iki grup için de oldukça küçüktür (birinde n = 33, diğerinde 45). Bu koşullar altında t- testimin …

4
PCA alanına yeni bir vektör nasıl yansıtılır?
Temel bileşen analizi (PCA) yaptıktan sonra, PCA alanına yeni bir vektör yansıtmak istiyorum (yani PCA koordinat sistemindeki koordinatlarını bulmak). PCA'yı R dilinde kullanarak hesapladım prcomp. Şimdi vektörümü PCA dönme matrisi ile çarpabilmeliyim. Bu matristeki temel bileşenler satır veya sütunlar halinde mi düzenlenmelidir?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
Ağırlıklı mi
MASS paketini Rkullanarak MM ağırlıkları ile sağlam bir doğrusal model tahmin ettim rlm(). `R`` bir sağlamaz model için değer, ama anlamlı bir miktar ise bir tane istiyorum. Ayrıca bir olan herhangi bir anlam olup olmadığını bilmek için ilgi am R 2 gözlem güçlü regresyon değerlendirildiler aynı şekilde toplam ve artan …

5
Aslında hangi sağlam korelasyon yöntemleri kullanılmaktadır?
Çeşitli sağlam korelasyon tekniklerinin performansını farklı dağılımlarla (eğrilmiş, aykırı değerlerle vb.) Karşılaştırdığımda bir simülasyon çalışması yapmayı planlıyorum. İle sağlam , I) çarpık dağılımlar, b) aykırı ve c) ağır kuyrukları bir karşı sağlam olmanın ideal durumu anlamına gelir. Bir temel olarak Pearson korelasyonunun yanı sıra, aşağıdaki daha sağlam önlemleri de dahil …

4
Ortalama ve Medyan özellikler
Birisi bana iki (a) ve (b) ifadesini birbirine bağlayacak matematiksel mantığı açıklayabilir mi? Bir dizi değer verelim (bazı dağılımlar). Şimdi, a) Medyan her değere bağlı değildir [sadece bir veya iki orta değere bağlıdır]; b) Medyan, ondan minimum mutlak sapma toplamı odağıdır. Ve aynı şekilde ve aksine, a) (Aritmetik) ortalama her …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.