«stratification» etiketlenmiş sorular

İlgili popülasyonun, örneklemeden önce tüm birimlerde bilinen özelliklere dayalı olarak alt gruplara ("tabakalar") bölündüğü bir örnekleme tekniği.

3
Tabakalı çapraz onaylamayı anlama
Tabakalı çapraz doğrulama ile çapraz doğrulama arasındaki fark nedir ? Wikipedia diyor ki: Gelen tabakalı k-kat çapraz doğrulama ortalama cevap değeri her kat içinde yaklaşık olarak eşit olduğu şekilde, katlar seçilir. İkili bir sınıflandırma söz konusu olduğunda, bu, her katlamanın kabaca iki sınıf etiket türünün aynı oranlarını içerdiği anlamına gelir. …

2
Neden tabakalı çapraz doğrulama kullanılır? Bu neden varyansa bağlı faydaya zarar vermez?
Bana, özellikle cevap sınıfları dengesiz olduğunda, tabakalı çapraz doğrulama kullanmanın faydalı olduğu söylendi. Çapraz onaylamanın bir amacı, orijinal eğitim verisi örneğimizin rastgelelik durumunun hesaba katılmasına yardımcı olmaksa, her bir katlamanın kesinlikle aynı sınıf dağılımına sahip olmasını sağlamak, orijinal eğitim setinizin temsili bir sınıf dağılımına sahip olduğundan emin olmadığınız sürece, buna …

1
Sınıflandırmada eğitim verilerinin üretilmesi için tabakalı ve rastgele örneklemenin faydaları
Orijinal veri kümesini sınıflandırma için eğitim ve test setine bölerken rastgele örnekleme yerine tabakalı örnekleme kullanmanın herhangi bir / bazı avantajları olup olmadığını bilmek istiyorum. Ayrıca, tabakalı örnekleme sınıflandırıcıya rastgele örneklemeden daha fazla yanlılık getirir mi? Veri hazırlama için tabakalı örnekleme kullanmak istediğim uygulama, orijinal veri kümesinin üzerinde eğitilmiş bir …

1
Tabakalar ve katmanlar arası etkileşimli Cox-modelin takılması iki Cox modelin takılmasından farklı mıdır?
Olarak doğrusal regresyon Stratejileri Harrell (ikinci baskı) ile bir bölüm (S. 20.1.7) temel etkisi sağkalım biz (aşağıdaki örnekte olduğu yaş) ve tahmin etmek isteyen bir kovaryat arasındaki etkileşim de dahil olmak üzere Cox modelleri tartışılması ve orada ana etkisini tahmin etmek istemediğimiz değişken (aşağıdaki örnekte cinsiyet). Somut olarak: bir popülasyonda …

2
Ampirik dağıtım alternatifi
ÖDÜL: Ödülün tamamı, aşağıda kestirimci kullanan veya bahseden yayınlanmış herhangi bir makaleye referans sağlayan birine verilecektir .F~F~\tilde{F} Motivasyon: Bu bölüm muhtemelen sizin için önemli değildir ve bunun ödülünüzü almanıza yardımcı olmayacağından şüpheleniyorum, ancak birisi motivasyonu sorduğundan, üzerinde çalıştığım şey bu. İstatistiksel grafik teorisi problemi üzerinde çalışıyorum. Standart yoğun grafik sınırlayıcı …

1
Rasgele ormanlarla (veya başka bir sınıflandırıcıyla) katmanlı sınıflandırma
Yani, yaklaşık 60 x 1000 matrisim var. 1000 özellikli 60 nesne olarak bakıyorum; 60 nesne 3 sınıfa ayrılır (a, b, c). Her sınıfta 20 nesne ve gerçek sınıflandırmayı biliyoruz. Bu 60 eğitim örneği seti üzerinde denetimli öğrenme yapmak istiyorum ve hem sınıflandırıcı doğruluğu (ve ilgili metrikler) hem de 1000 özellikte …

2
R randomForest'te değiştirilmiş örnekleme
RandomForest uygulaması, değiştirme ile örnekleme yaparken bile gözlem sayısının ötesinde örneklemeye izin vermez. Bu neden? İyi çalışıyor: rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE) rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE) Yapmak istediğim şey: rf <- randomForest(Species ~ ., iris, sampsize=c(51, 1, 1), replace=TRUE) Error in …

3
Çok seviyeli model ve her seviye için ayrı modeller
Çok seviyeli modellemeye karşı ayrı model çalıştırmanın avantajları ve dezavantajları nelerdir? Daha özel olarak, bir çalışmanın, ülkedeki doktor uygulamalarında yuvalanmış hastaları incelediğini varsayalım. Üç seviyeli iç içe bir modele kıyasla her ülke için ayrı modeller çalıştırmanın avantajları / dezavantajları nelerdir?

1
Anova () ve drop1 () neden GLMM'ler için farklı cevaplar verdi?
Formun bir GLMM var: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kullandığımda , araç paketinden veya drop1(model, test="Chi")kullandığımdan farklı sonuçlar alıyorum . Bu son ikisi aynı cevapları verir.Anova(model, type="III")summary(model) Bir grup uydurma veri kullanarak, bu iki yöntemin normalde farklı olmadığını gördüm. Dengeli doğrusal …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

2
Sınıflandırma için eğitim setinden kopyaları kaldırın
Diyelim ki bir sınıflandırma problemi için birkaç satırım var: X1, . . .XN-, YX1,...XN,YX_1, ... X_N, Y Nerede X1, . . . ,XN-X1,...,XNX_1, ..., X_N özellikler / öngörücüler ve YYY satırın özellik kombinasyonunun ait olduğu sınıftır. Birçok özellik kombinasyonu ve sınıfları bir sınıflandırıcı sığdırmak için kullandığım veri kümesinde tekrarlanır. Ben …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.