«binary-data» etiketlenmiş sorular

İkili değişken, tipik olarak "0" ve "1" olarak kodlanan iki değerden birini alır.

9
Bir 2d ikili matrisin entropi / bilgi / kalıplarını ölçme
İki boyutlu bir ikili matrisin entropi / bilgi yoğunluğunu / kalıp benzerliğini ölçmek istiyorum. Açıklama için bazı resimler göstereyim: Bu ekran oldukça yüksek bir entropiye sahip olmalı: A) Bu orta entropiye sahip olmalı: B) Sonunda bu resimlerin hepsinin sıfıra yakın entropiye sahip olması gerekir: C) D) E) Entropiyi yakalayan bir …


4
Sınıflandırma olasılığı eşiği
Genel olarak sınıflandırma ile ilgili bir sorum var. F bazı verilerle verilen bir olasılık kümesi ortaya çıkaran bir sınıflandırıcı olsun. D Normalde biri şöyle der: p: p (c | D)> 0.5 ise 1. sınıfa, aksi takdirde 0 atarız (bunun bir ikili olmasına izin verin). sınıflama). Benim sorum şu, ne öğrenirsem, …


3
PCA, boolean (binary) veri tipleri için çalışır mı?
Daha yüksek dereceli sistemlerin boyutsallığını azaltmak ve kovaryansın çoğunu tercihen 2 boyutlu veya 1 boyutlu bir alanda yakalamak istiyorum. Bunun ana bileşen analizi yoluyla yapılabileceğini biliyorum ve PCA'yı birçok senaryoda kullandım. Ancak, onu hiçbir zaman boolean veri türleriyle kullanmadım ve PCA'yı bu setle yapmanın anlamlı olup olmadığını merak ediyordum. Örneğin, …


1
Ordinal veya ikili veri için Faktör analizi veya PCA var mı?
Temel bileşen analizi (PCA), keşfedici faktör analizi (EFA) ve doğrulayıcı faktör analizi (CFA) yaptım, sürekli olarak likert ölçeğine sahip verileri (5 seviyeli yanıtlar: yok, biraz, bazıları, ..) değişken. Sonra, Lavaan kullanarak, değişkenleri kategorik olarak tanımlayan CFA'yı tekrarladım. Veriler doğada sıradan olduğunda ne tür analizlerin uygun olacağını ve PCA ve EFA …

2
İkili ve sürekli değişkenleri kümelemede birlikte nasıl kullanırsınız?
K-araçlarında ikili değişkenleri (0 ve 1 değerleri) kullanmam gerekiyor. Ancak k-aracı sadece sürekli değişkenlerle çalışır. Bazı insanların hala bu ikili değişkenleri k-araçlarında k-araçlarının sadece sürekli değişkenler için tasarlandığı gerçeğini göz ardı ederek kullandığını biliyorum. Bu benim için kabul edilemez. Sorular: Öyleyse, k-means / hiyerarşik kümelemede ikili değişkenleri kullanmanın istatistiksel / …


5
Hiç ikili değişkenleri standartlaştırmalı mıydınız?
Bir dizi özelliğe sahip bir veri setim var. Bazıları ikilidir aktif veya ateşlenmiş, etkin değil veya hareketsiz) ve gerisi gerçek , örneğin .0 = 4564.342)( 1 =(1=(1=0 =0=0=4564.3424564.3424564.342 Bu verileri bir makine öğrenme algoritmasına beslemek istiyorum, bu yüzden tüm gerçek değerli özellikleri puanladım. Onları yaklaşık ila arasında buluyorum . Şimdi …

3
Bir model için öngörülen olasılık kalibrasyonunun görselleştirilmesi
Her sınıf için her sınıf için bir olasılık üreten öngörücü bir modelim olduğunu varsayalım. Şimdi, sınıflandırma için bu olasılıkları kullanmak istersem böyle bir modeli değerlendirmenin pek çok yolu olduğunu kabul ediyorum (hassasiyet, hatırlama, vb.). Ayrıca, bir ROC eğrisinin ve altındaki alanın, modelin sınıflar arasında ne kadar iyi farklılaştığını belirlemek için …

3
İkili ve sürekli değişken arasında rasgele ilişkilendirilmiş veri üretmek
İki değişken oluşturmak istiyorum. Bunlardan biri ikili sonuç değişkenidir (başarı / başarısızlık) ve diğeri yıllardır. Yaşın başarı ile pozitif olarak ilişkili olmasını istiyorum. Örneğin, yüksek yaş segmentlerinde düşükten daha fazla başarı olması gerekir. İdeal olarak, korelasyon derecesini kontrol edebilecek konumda olmalıyım. Bunu nasıl yaparım? Teşekkürler

2
İkili bir matrisin kümelenmesi
250k x 100 boyutunda ikili özelliklerin yarı küçük bir matrisine sahibim. Her satır bir kullanıcıdır ve sütunlar bazı kullanıcı davranışlarının örneğin "likes_cats" gibi ikili "etiketleri" dir. user 1 2 3 4 5 ... ------------------------- A 1 0 1 0 1 B 0 1 0 1 0 C 1 0 0 …


1
Sıfır hipotezi altında değiştirilebilir örneklerin ardındaki sezgi nedir?
Permütasyon testleri (randomizasyon testi, yeniden randomizasyon testi veya kesin test olarak da adlandırılır) çok faydalıdır ve örneğin normal dağıtım varsayımı t-testkarşılanmadığında ve değerlerin parametrik olmayan test Mann-Whitney-U-test, daha fazla bilginin kaybolmasına neden olur. Bununla birlikte, bu tür bir test kullanılırken bir ve sadece bir varsayım göz ardı edilmemelidir, örneklerin sıfır …
16 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.