«continuous-data» etiketlenmiş sorular

Olası değerler kümesi sayılamazsa ve herhangi bir belirli değeri alma şansı sıfırsa, rastgele bir değişkeni sürekli olarak adlandırılır ( her gerçek sayı için ). Rasgele bir değişken, ancak eğer birikimli olasılık dağılım fonksiyonu sürekli bir fonksiyon ise sürekli olur. XP(X=x)=0x

6
Sırasız kategorik değişkenlerle korelasyonlar
Birçok gözlem ve değişken içeren bir veri çerçevem ​​var. Bazıları kategoriktir (sıralanmamış), bazıları sayısaldır. Bu değişkenler arasındaki ilişkileri arıyorum. Sayısal değişkenler için korelasyon hesaplayabildim (Spearman korelasyonu) ama: Sırasız kategorik değişkenler arasındaki ilişkiyi nasıl ölçeceğimi bilmiyorum. Sırasız kategorik değişkenler ile sayısal değişkenler arasındaki ilişkiyi nasıl ölçeceğimi bilmiyorum. Bunun nasıl yapılabileceğini bilen …

7
Sürekli bir tahmin değişkeninden ayrılmanın faydası nedir?
Bir modelde kullanmadan önce, sürekli bir yordayıcı değişkenini almanın ve onu parçalara ayırmanın (örn. Quintiles) ne olduğunu merak ediyorum. Bana öyle geliyor ki değişkeni binerek bilgiyi kaybediyoruz. Bu sadece doğrusal olmayan etkileri modelleyebilmemiz için mi? Değişkeni sürekli tutsak ve gerçekten düz bir doğrusal ilişki olmasaydı verilere en iyi şekilde uyacak …


3
Bir örnek: ikili sonuç için glmnet kullanarak LASSO regresyonu
Ben kullanımı ile serpmek başlıyorum glmnetile LASSO Regresyon ilgi benim sonuç dikotom olduğunu. Aşağıda küçük bir sahte veri çerçevesi oluşturdum: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


8
Kategorik verileri sürekli olarak ele almak hiç mantıklı geliyor mu?
Kesin ve sürekli veri üzerine bu soruyu cevaplarken, kategorik verileri sürekli olarak ele almanın nadiren mantıklı olduğunu ileri sürdüm. Anlaşılır görünen, ancak sezgi genellikle istatistik için kötü bir rehber, ya da en azından benim. Şimdi merak ediyorum: doğru mu? Yoksa kategorik verilerden bir sürekliliğe dönüşümün gerçekten yararlı olduğu analizler var …


4
Hem sürekli hem de kategorik özelliklerle öngörüde bulunmak
Bazı prediktif modelleme teknikleri, sürekli prediktörlerin kullanımı için daha fazla tasarlanmıştır, diğerleri ise kategorik veya ayrık değişkenlerin ele alınması için daha iyidir. Elbette bir tipi diğerine dönüştürme teknikleri var (ayrıklaştırma, yapay değişkenler, vs.). Ancak, her iki giriş türünü aynı anda, özelliklerin türünü değiştirmeden aynı anda ele almak üzere tasarlanmış öngörücü …


2
Sürekli bağımsız değişkenleri / özellikleri ne zaman ayrılmalı / atmalıyız ve ne zaman yapmamalıyız?
Bağımsız değişkenleri / özellikleri ne zaman ayrılmalı / atmalıyız ve ne zaman yapmamalıyız? Soruma cevap verme girişimlerim: Genelde, binmemeliyiz çünkü binicilik bilgi kaybeder. Çekme aslında modelin serbestlik derecesini arttırıyor, bu nedenle çekmeden sonra aşırı sığmaya neden olmak mümkündür. Eğer bir "yüksek önyargı" modelimiz varsa, kırma kötü olmayabilir, fakat "yüksek sapma" …


1
Tasarlanmış bir deneyde ANOVA ve ANCOVA arasında nasıl seçim yapılır?
Aşağıdakileri içeren bir deney yapıyorum: DV: Dilim tüketimi (sürekli veya kategorik olabilir) IV: Sağlıklı mesaj, sağlıksız mesaj, mesaj yok (kontrol) (insanların rastgele atandığı 3 grup - kategorik) Bu, dilimin sağlıklılığı hakkında manipüle edilmiş bir mesajdır. Aşağıdaki IV'ler bireysel fark değişkenleri olarak düşünülebilir: Dürtüsellik (bu kategorik olabilir, yani yüksek veya düşük …


2
Sürekli verilerden kategorilere geçiş her zaman yanlış mıdır?
Verilerinizi nasıl ayarlayacağımı okuduğumda, sık sık karşılaştığım bir şey, bazı sürekli verileri kategorik verilere dönüştürmenin iyi bir fikir olmadığıdır, çünkü eşikler kötü bir şekilde belirlenirse çok iyi bir sonuç çıkarabilirsiniz. Bununla birlikte, şu anda bazı verilerim var (prostat kanseri hastaları için PSA değerleri), burada ortak fikir birliği 4'ün altındaysanız muhtemelen …

1
Ordinal ve sürekli değişken arasındaki korelasyon nasıl doğru bir şekilde değerlendirilir?
Arasındaki korelasyonu tahmin etmek istiyorum: Sıralı bir değişken: deneklerden 6 çeşit meyve için tercihlerini 1-5 ölçekte derecelendirmeleri istenir (çok iğrenç ila çok lezzetli arasında değişir) Ortalama deneklerde ölçeğin sadece 3 noktasını kullanın. Sürekli bir değişken: aynı kişilerden bu meyveleri hızlı bir şekilde tanımlamaları istenir, bu da 6 meyve için ortalama …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.