«association-measure» etiketlenmiş sorular

Değişkenler arasındaki ilişkinin ölçüleri, korelasyondan daha genel bir kavram

3
Bir örnek: ikili sonuç için glmnet kullanarak LASSO regresyonu
Ben kullanımı ile serpmek başlıyorum glmnetile LASSO Regresyon ilgi benim sonuç dikotom olduğunu. Aşağıda küçük bir sahte veri çerçevesi oluşturdum: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


1
Muazzam bir seyreklik durum tablosu nasıl görselleştirilir?
İki değişkenim var: Uyuşturucu Adı (DN) ve çoktan çoğa ilişkide olan karşılık gelen Advers Olaylar (AE). 33.556 ilaç ismi ve 9.516 advers olay var. Örneklem büyüklüğü yaklaşık 5.8 milyon gözlemdir. DN ile AE arasındaki ilişkiyi / ilişkiyi incelemek ve anlamak istiyorum. Resimlere bakmak daha iyi olduğundan, bu seti R'de görselleştirmenin …



1
Bir değişkenin bir PCA bileşeniyle (bir biplot / yükleme grafiğinde) uygun ilişkilendirme ölçüsü nedir?
FactoMineRVeri ölçümlerimi gizli değişkenlere indirmek için kullanıyorum . Beni yorumlamak için yukarıdaki değişken haritası açıktır, ancak değişken Haritaya bakmak değişkenler ve bileşen 1 arasında derneklere geldiğinde karıştı, ddpve covçok yakın haritasındaki bileşenlerle ve ddpAbsbiraz daha fazla uzakta. Ancak, korelasyonların gösterdiği şey bu değildir: $Dim.1 $Dim.1$quanti correlation p.value jittAbs 0.9388158 1.166116e-11 …

2
Çok sayıda hücrenin frekansları 5'ten az ise ki-kare testinin uygulanabilirliği
Akran desteği (bağımsız değişken) ve iş tatmini (bağımlı değişken) arasındaki ilişkiyi bulmak için ki-kare testi uygulamak istiyorum. Akran desteği, destek derecesine göre dört grupta kategoridir: 1 = çok daha az ölçüde, 2 = bir ölçüde, 3 = büyük ölçüde ve 4 = çok büyük ölçüde. İş tatmini iki kategoriye ayrılır: …

2
Sıralı ve sürekli rasgele değişken arasındaki ilişkinin parametrik olmayan ölçüsü
Sorunu aldığım gibi buraya atıyorum. İki rastgele değişkenim var. Bunlardan biri sürekli (Y) diğeri ayrık olan ve sıra (X) olarak yaklaşılacaktır . Sorgu ile birlikte aldığım arsanın altına koydum. Bana veri gönderen kişi , X ve Y arasındaki ilişkinin gücünü ölçmek istiyor. Verileri hangi işlemin ürettiği hakkında varsayımlarla öne çıkmayacak …

1
Nitelikler nominal olduğunda bireyler için en uygun mesafe işlevi nedir?
Nominal (sıralanmamış kategorik) özellikler durumunda bireyler arasında hangi mesafe işlevinin kullanılacağını bilmiyorum. Bazı ders kitapları okuyordum ve Basit Eşleştirme işlevini önerdiler, ancak bazı kitaplar nominal değerleri ikili özelliklere değiştirip Jaccard Katsayısı kullanmam gerektiğini gösteriyor . Ancak, nominal özelliğin değerleri 2 değilse ne olur? bu özellikte üç veya dört değer varsa …

3
Kategorik değişkenlerin popüler veya yaygın kombinasyonlarını bulmak için kullanabileceğim istatistiksel yöntemler nelerdir?
Çoklu uyuşturucu kullanımı üzerine bir çalışma yapıyorum. Her biri kötüye kullandıkları ilaçları belirten 400 uyuşturucu bağımlısının veri setim var. 10'dan fazla ilaç var ve bu nedenle büyük olası kombinasyonlar var. İkili değişkenler olarak tükettikleri ilaçların çoğunu kodladım (yani bir uyuşturucu bağımlısı eroini başka istismar ederse eroin 1'dir). 2 veya 3 …

2
Dichotomous ve sürekli değişken arasındaki korelasyon
İkili ve sürekli değişken arasındaki ilişkiyi bulmaya çalışıyorum. Bu konudaki temel çalışmamdan bağımsız t-testi kullanmak zorunda olduğumu ve bunun için ön koşulun değişkenin dağılımının normal olması gerektiğine karar verdim. Normalliği test etmek için Kolmogorov-Smirnov testi yaptım ve sürekli değişkenin normal olmadığını ve eğri olduğunu gördüm (yaklaşık 4.000 veri noktası için). …


3
Matris çarpımı kullanarak ikili veri için Jaccard veya diğer ilişkilendirme katsayısının hesaplanması
Matris çarpımı kullanarak Jaccard katsayısını hesaplamanın olası bir yolu olup olmadığını bilmek istiyorum. Bu kodu kullandım jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x))) jaccard <- as.data.frame(m) for(i in 1:ncol(x)) { for(j in i:ncol(x)) { jaccard[i,j]= length(which(x[,i] & x[,j])) / length(which(x[,i] | x[,j])) jaccard[j,i]=jaccard[i,j] } } …

2
Karışık modeller için parametrik, yarı parametrik ve parametrik olmayan önyükleme
Bu makaleden aşağıdaki greftler alınmıştır . Ben bootstrap için acemi ve R bootpaket ile doğrusal karışık model için parametrik, yarı parametrik ve parametrik olmayan bootstrapping bootstrapping uygulamaya çalışıyorum . R Kodu İşte benim Rkod: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.