«zero-inflation» etiketlenmiş sorular

Belirtilen referans dağılımına kıyasla bir değişkende aşırı 0'lar. Regresyon yaklaşımları, sıfır şişirilmiş modelleri ve engel (2 parçalı) modelleri içerir. Sayım verileri için Poisson veya negatif binom dağılımlarına dayanan sıfır şişirilmiş ve engelli modeller yaygındır (ZIP / ZINB ve HP / HNB).

4
Sayım regresyonu için tanı grafikleri
Hangi sayım değişkenleri (ve belki de resmi testler) sonucun bir sayı değişkeni olduğu gerilemeler için en bilgilendirici buluyor musunuz? Özellikle Poisson ve negatif binom modellerinin yanı sıra her birinin sıfır şişirilmiş ve engelli benzerleri ile ilgileniyorum. Bulduğum kaynakların çoğu, bu parsellerin "nasıl olması gerektiği" hakkında tartışmadan, artıkları ve takılan değerleri …


3
Bir örnek: ikili sonuç için glmnet kullanarak LASSO regresyonu
Ben kullanımı ile serpmek başlıyorum glmnetile LASSO Regresyon ilgi benim sonuç dikotom olduğunu. Aşağıda küçük bir sahte veri çerçevesi oluşturdum: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


1
Poisson vs. geometrik - negatif binom GLM'leri sayı verileri için ne zaman kullanılır?
Sayma verileriyle hangi regresyon tipinin (geometrik, Poisson, negatif binom), GLM çerçevesi dahilinde (8 GLM dağılımının sadece 3'ü kullanılsa da, sayım verileri için kullanılsa da) uygun olduğunda kendime yerleşmeye çalışıyorum. Negatif binom ve Poisson dağılımlarının merkezlerini okudum). Poisson vs. geometrik - negatif binom GLM'leri sayı verileri için ne zaman kullanılır? Şimdiye …

4
Beta regresyonunda 0,1 değerlerle başa çıkmak
[0,1] 'de beta regresyonu ile analiz etmek istediğim verilerim var. Tabii ki 0,1 değerlerini karşılamak için bir şeyler yapılmalıdır. Bir modele uyacak şekilde veri değiştirmeyi sevmiyorum. Ayrıca sıfır ve 1 enflasyonun iyi bir fikir olduğuna inanmıyorum çünkü bu durumda 0'ın çok küçük pozitif değerler olduğunu düşünmeliyim (ama tam olarak hangi …


2
Beta regresyonu yanıt değişkenindeki neden 0 ve 1'lerle tam olarak ilgilenemiyor?
Beta regresyonunun (yani beta dağılımlı GLM ve genellikle logit bağlantı fonksiyonu), kesirler, oranlar veya olasılıklar gibi 0 ve 1 arasında değerler alarak bağımlı değişken değişken yanıtı ele alması önerilir: Bir sonuç için regresyon (oran veya kesir) 0 ile 1 arasında . Bununla birlikte, yanıt değişkeninin en az bir kez 0 …

3
R'de sıfır şişirilmiş negatif binom karışık etkiler modeli
R'de sıfır şişirilmiş negatif binom karışık etkiler model tahmini sağlayan böyle bir paket var mı? Bununla demek istediğim: Pscl paketindeki zeroinfl işlevinde olduğu gibi sıfır enflasyon için binom modelini belirtebileceğiniz sıfır enflasyon: zeroinfl (y ~ X | Z, dist = "negbin") burada Z sıfır enflasyon modelinin formülüdür; Modelin sayım kısmı …

1
Negatif olmayan sıfır şişirilmiş sürekli veriler nasıl modellenir?
Şu anda family = gaussiansıfırdan daha düşük değerler alamaz, sıfır şişirilmiş ve sürekli bir biyolojik çeşitlilik göstergesine doğrusal bir model ( ) uygulamak çalışıyorum . Değerler 0 ile 0,25 arasında değişir. Sonuç olarak, modelin kalıntılarında kurtulmayı başaramadığım oldukça açık bir desen var: Bunu çözmek için herhangi bir fikri olan var …

3
Negatif olmayan veriler için sıfırlar halinde toplanan bir model (Tweedie GLM, sıfır şişirilmiş GLM, vb.) Kesin sıfırları tahmin edebilir mi?
Bir Tweedie dağılımı, parametresi (ortalama-varyans ilişkisindeki üs) 1 ile 2 arasında olduğunda, çarpık bir nokta kütlesine sahip eğri verileri modelleyebilir .ppp Benzer şekilde sıfır şişirilmiş (aksi halde sürekli veya ayrık olsun) bir model çok sayıda sıfır içerebilir. Neden bu tür modellerle tahmin yaptığımda veya takılan değerleri hesapladığımda, tahmin edilen tüm …

3
Sıfır şişirilmiş dağılımlar, bunlar gerçekten nedir?
Sıfır şişirilmiş dağılımları anlamak için uğraşıyorum. Onlar neler? Amaç ne? Eğer çok sıfırlı verilerim varsa, o zaman önce sıfır olasılığını hesaplamak için bir lojistik gerileme sığdırabilirim ve sonra tüm sıfırları kaldırabilirim ve sonra dağıtım seçimimi kullanarak düzenli bir gerileme sığdırabilirim (örneğin poisson). Sonra birisi bana "hey, sıfır şişirilmiş dağıtım kullan" …

1
Sıfır şişirilmiş Poisson regresyonu
Diyelim ki bağımsız veY =( Y1, … , Yn)'Y=(Y1,…,Yn)′ \textbf{Y} = (Y_1, \dots, Y_n)' Yben= 0Yben= kolasılıkla p ben+ ( 1 - pben) e- λbenolasılıkla ( 1 - p ben) e- λbenλkben/ k!Yi=0with probability pi+(1−pi)e−λiYi=kwith probability (1−pi)e−λiλik/k!\eqalign{ Y_i = 0 & \text{with probability} \ p_i+(1-p_i)e^{-\lambda_i}\\ Y_i = k & \text{with …

1
Karma efektli sayım verileri için iyi bir model bulmakta sorun - ZINB veya başka bir şey?
Yalnız arı bolluğu ile ilgili çok küçük bir veri setim var, analiz etmekte zorlanıyorum. Sayım verileri ve neredeyse tüm sayımlar bir tedavide, diğer tedavide sıfırların çoğu ile. Ayrıca çok yüksek birkaç değer vardır (altı alanın ikisinde birer tane), bu nedenle sayımların dağılımı son derece uzun bir kuyruğa sahiptir. R'de çalışıyorum. …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.