«gini» etiketlenmiş sorular

Gini katsayısı, bir sınıflandırıcının gelir eşitsizliğini ve ayrımcı gücünü ölçmek için kullanılır. Herkesin geliri aynı ise, Gini katsayısı = 0. Bir kişinin tüm geliri varsa, Gini katsayısı = 1. Diğer tüm değerler arada bir yerdedir.

2
GINI skoru ile log-olabilirlik oranı arasındaki ilişki nedir?
Sınıflandırma ve regresyon ağaçlarını inceliyorum ve ayrık konum için alınacak önlemlerden biri GINI puanı. Şimdi iki dağıtım arasında aynı verinin olabilirlik oranının günlüğü sıfır olduğunda en iyi bölünme konumunu belirlemeye alışkınım, yani üyelik olasılığının eşit olması muhtemel. Sezgim, GINI'nin matematiksel bir bilgi teorisinde iyi bir temele sahip olması gerektiğini (Shannon) …

1
Breiman'ın rastgele ormanı bilgi kazancı veya Gini endeksi kullanıyor mu?
Breiman'ın rastgele ormanının (R randomForest paketindeki rastgele orman) bir bölme kriteri (özellik seçimi için kriter) bilgi kazancı veya Gini endeksi olarak kullanılıp kullanılmadığını bilmek ister misiniz? Ben http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm ve R'deki randomForest paketinin belgelerinde bulmaya çalıştım. Ama bulduğum tek şey Gini indeksinin değişken öneme sahip hesaplama.

1
logloss vs gini / auc
İki model (h2o AutoML kullanarak ikili sınıflandırıcılar) eğittim ve kullanmak için bir tane seçmek istiyorum. Aşağıdaki sonuçlara sahibim: model_id auc logloss logloss_train logloss_valid gini_train gini_valid DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975 DL_grid_2 0.543685 0.251431 0.082616 0.186196 0.900955 0.312662 aucve loglosskolonlar çapraz doğrulama metriklerdir (çapraz doğrulama sadece eğitim verileri kullanır). …


1
GINI ve AUC eğrisi yorumlaması arasındaki fark nedir?
puan kartı modellemesi için iyi ve kötü yüzdesi yardımıyla oluşturulan asansörü kullanarak GINI eğrisi oluşturduk. Ama ben inceledim ne ROC eğrisi x ekseni olarak özgüllük (1- gerçek negatif) ve Y ekseni olarak hassasiyet (gerçek pozitif) ile karışıklık matrisi kullanılarak oluşturuldu. Dolayısıyla GINI ve ROC'nin sonuçları bir farkla aynıdır, ikincisi de …
13 roc  gini 

3
Fark özet istatistikler: Gini katsayısı ve standart sapma
Birkaç özet istatistik vardır. Bir dağılımın yayılımını tanımlamak istediğinizde, örneğin standart sapmayı veya Gini katsayısını kullanabilirsiniz . Standart sapmanın merkezi eğilime, yani ortalamadan sapmaya ve Gini katsayısının genel dağılım ölçümüne dayandığını biliyorum. Ayrıca Gini katsayısının alt ve üst sınırı olduğunu [0 1] ve standart sapmanın olmadığını biliyorum . Bu özellikleri …


1
Gini katsayısı ve hata sınırları
Her zaman noktasında N = 14 sayımı olan bir veri serisi var ve her zaman noktasında Gini katsayısını ve bu tahmin için standart bir hatayı hesaplamak istiyorum. Jackknife varyansını, yani hesaplayarak ilerlediğim her zaman noktasında sadece N = 14 sayım olduğundan Tomson Ogwang ' denklem 7'den ' Gini indeksini ve …

5
Kelime sıklığı verilerindeki dağılım nasıl ölçülür?
Kelime sayımlarının bir vektöründeki dağılım miktarını nasıl ölçebilirim? Sıklıkla ortaya çıkan bir kelime (veya birkaç kelime) içerdiğinden, nadiren ortaya çıkan birçok farklı kelime ve B belgesi için düşük olduğu için A belgesi için yüksek olacak bir istatistik arıyorum. Daha genel olarak, nominal verilerdeki dağılım veya "yayılma" nasıl ölçülür? Bunu metin …

1
Gözlenen ve beklenen olayları nasıl karşılaştırırım?
Diyelim ki 4 olası olayın sıklık örneğine sahibim: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 ve olaylarımın gerçekleşmesi için beklenen olasılıklarım var: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dört olayın gözlemlenen frekanslarının toplamı ile (18) Olayların beklenen frekanslarını hesaplayabilir …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.