«separation» etiketlenmiş sorular

Ayrılma, kategorik bir sonucun bazı sınıfları, diğer değişkenlerin doğrusal bir kombinasyonu ile mükemmel bir şekilde ayırt edilebildiğinde meydana gelir.

8
Lojistik regresyonda kusursuz ayrılıkla nasıl başa çıkılır?
Sıfırları ve hedef değişkendekileri mükemmel bir şekilde ayıran bir değişkeniniz varsa, R aşağıdaki "mükemmel veya yarı mükemmel ayrılma" uyarı mesajını verecektir: Warning message: glm.fit: fitted probabilities numerically 0 or 1 occurred Modeli hala alıyoruz, ancak katsayı tahminleri şişiriliyor. Bununla pratikte nasıl başa çıkıyorsunuz?

1
R'deki lojistik regresyon, mükemmel ayrılma ile sonuçlandı (Hauck-Donner fenomeni). Şimdi ne olacak?
50 sürekli açıklayıcı değişken kullanarak ikili sonucu tahmin etmeye çalışıyorum (değişkenlerin çoğunun aralığı ila ∞ arasındadır ). Veri setimin neredeyse 24.000 satırı var. R'de koşarken , alıyorum:−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: fitted probabilities numerically 0 or 1 occurred Mükemmel ayrılmanın olabileceğini gösteren diğer yanıtları …

2
Lojistik regresyon modeli yakınsak değil
Havayolu uçuşlarıyla ilgili bazı verilerim var (adı verilen bir veri çerçevesinde flights) ve uçuş süresinin önemli ölçüde gecikmeli varış olasılığı (10 veya daha fazla dakika) üzerinde bir etkisi olup olmadığını görmek istiyorum. Uçuş regülatörü olarak uçuş süresi ve her uçuşun yanıt olarak önemli ölçüde geciktirilip geciktirilmeyeceği (bir demet Bernoullis) yanıtı …
39 r  logistic  separation 


1
boyutlarındaki rastgele noktaların doğrusal olarak ayrılabilmesi olasılığı nedir ?
Verilen nnn veri noktası, her bir ddd özellikleri, n/2n/2n/2 olarak etiketlenir 000 , diğer n/2n/2n/2 olarak işaretlenmiştir 111 . Her özellik rastgele [0,1] arasında bir değer alır [0,1][0,1][0,1](tekdüze dağılım). İki sınıfı ayırabilen bir hiper düzlemin bulunma olasılığı nedir? İlk önce en kolay durumu ele alalım, yani d=1d=1d = 1 .

1
Firth lojistik regresyon ile model seçimi
Çalıştığım küçük bir veri setinde ( ) birkaç değişken bana mükemmel bir öngörü / ayrılık verir . Bu yüzden , konuyla ilgilenmek için Firth lojistik regresyon kullanıyorum .n ∼ 100n~100n\sim100 En iyi modeli AIC veya BIC ile seçersem , bu bilgi kriterlerini hesaplarken olasılığa Firth cezasını da dahil etmeli miyim?

1
Mükemmel regresyon davası için lojistik regresyonun neden işe yaramayacağına dair sezgisel bir açıklama var mı? Düzenleme eklemek neden bunu düzeltir?
Lojistik regresyonda mükemmel ayrılma hakkında birçok iyi tartışmamız var. Bu şekilde, R lojistik regresyon mükemmel ayırma (Hauck-Donner fenomeni) ile sonuçlanmıştır. Şimdi ne olacak? ve lojistik regresyon modeli yakınsama yapmaz . Şahsen hala neden bir sorun olacağı ve düzenlileştirme eklemenin sorunu çözeceği için sezgisel olmadığını hissediyorum. Bazı animasyonlar yaptım ve faydalı …

3
Destek Vektör Makineleri ve hiper düzlem için Sezgi
Projemde ikili sınıflandırmayı (1 veya 0) tahmin etmek için bir lojistik regresyon modeli oluşturmak istiyorum. 2'si kategorik olmak üzere 15 değişkenim var, geri kalanı sürekli ve ayrık değişkenlerin bir karışımı. Bir lojistik regresyon modeline uymak için SVM, algılayıcı veya doğrusal programlama kullanarak doğrusal ayrılabilirliği kontrol etmem önerildi. Bu, burada lineer …

1
GBM kullanarak GBM paketi ve Caret
Model kullanarak ayar yapıyordum caret, ancak gbmpaketi kullanarak modeli yeniden çalıştırıyorum . Anladığım kadarıyla caretpaketin kullandığı gbmve çıktı aynı olmalı. Bununla birlikte, sadece hızlı bir test çalıştırması data(iris), değerlendirme metriği olarak RMSE ve R ^ 2 kullanılarak modelde yaklaşık% 5 tutarsızlık gösterir. Kısmi bağımlılık grafiklerini kullanmak için en iyi model …

1
Firth Lojistik Regresyonunu Kuramsal Olarak Anlamak
Firth lojistik regresyonunu (lojistik regresyonda mükemmel / tam veya yarı-tam ayrımı ele alma yöntemi) anlamaya çalışıyorum, böylece basitleştirilmiş terimlerle başkalarına açıklayabilirim. Herkes Firth tahmininin MLE'de yaptığı değişikliğin açık bir açıklaması var mı? En iyi şekilde Firth (1993) 'i okudum ve puan fonksiyonuna bir düzeltme uygulandığını anlıyorum. Ben düzeltmenin kökeni ve …


1
R / mgcv: te () ve ti () tensör ürünleri neden farklı yüzeyler üretir?
mgcvİçin paket Rtensör ürün etkileşimleri uydurma için iki işlevi vardır: te()ve ti(). İkisi arasındaki temel işbölümünü anlıyorum (doğrusal olmayan bir etkileşime uymak ve bu etkileşimi ana etkilere ve etkileşime ayırmak). Anlamadığım şey neden te(x1, x2)ve ti(x1) + ti(x2) + ti(x1, x2)(biraz) farklı sonuçlar üretebilir. MWE (uyarlanmıştır ?ti): require(mgcv) test1 <- …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
Lojistik regresyonda muazzam katsayılar - ne anlama geliyor ve ne yapmalı?
Lojistik regresyon sırasında muazzam katsayılar alıyorum, aşağıdaki katsayılara bakın krajULKV: > summary(m5) Call: glm(formula = cbind(ml, ad) ~ rok + obdobi + kraj + resid_usili2 + rok:obdobi + rok:kraj + obdobi:kraj + kraj:resid_usili2 + rok:obdobi:kraj, family = "quasibinomial") Deviance Residuals: Min 1Q Median 3Q Max -2.7796 -1.0958 -0.3101 1.0034 2.8370 …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.