«continuous-data» etiketlenmiş sorular

Olası değerler kümesi sayılamazsa ve herhangi bir belirli değeri alma şansı sıfırsa, rastgele bir değişkeni sürekli olarak adlandırılır ( her gerçek sayı için ). Rasgele bir değişken, ancak eğer birikimli olasılık dağılım fonksiyonu sürekli bir fonksiyon ise sürekli olur. XP(X=x)=0x



2
Nominal (dikotomatik olmayan) nominal değişken ile sayısal (aralık) veya sıralı değişken arasındaki korelasyon katsayısı
Sorunumun cevabını bulmaya çalışırken bu sitedeki tüm sayfaları zaten okudum ama kimse bana doğru olan gibi görünmüyor ... Öncelikle size birlikte çalıştığım veri türlerini açıklıyorum ... 300 kullanıcının her biri için bir tane olmak üzere çeşitli şehir adlarına sahip bir dizi vektörüm olduğunu varsayalım. Ayrıca her kullanıcının anketine veya her …

3
Sürekli değişkenin koşullu olasılığı
Rastgele değişken 0 ve 10 parametreleriyle sürekli bir Düzgün dağılım izlediğini varsayalım (yani )U ∼ U ( 0 , 10 )UUUU∼U(0,10)U∼U(0,10)U \sim \rm{U}(0,10) Şimdi A'yı = 5 ve B olarak ifade eden ve veya 6'ya eşit olduğu olayını gösterelim. Anladığım kadarıyla, her iki olayın da sıfır olma olasılığı vardır.U 5UUUUUU555 …

5
Çok sayıda veri noktasındaki değerlerin gösterimi nasıl yapılır?
Çok büyük bir veri setim var ve yaklaşık% 5 rasgele değerler eksik. Bu değişkenler birbiriyle ilişkilidir. Aşağıdaki örnek R veri kümesi sadece yapay korelasyonlu verilere sahip bir oyuncak örneğidir. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


5
Sürekli rasgele değişkenin sabit bir nokta alma olasılığı
Sürekli rasgele değişkenler için olasılık yoğunluk fonksiyonunun olarak olarak tanımlandığı bir giriş istatistik sınıfındayım . integralinin anlıyorum ama bunu sürekli rastgele değişken sezgilerimle düzeltemiyorum. Diyelim ki X, trenin geldiği dakikadan bu yana geçen dakika sayısına rastgele bir değişkendir. Trenin tam olarak 5 dakika sonra gelme olasılığını nasıl hesaplayabilirim? Bu olasılık …

1
Verilerin sürekli bir dağıtımdan en uygun şekilde ayrıştırılmasını belirleme
üzerinde desteklenen yoğunluğuna sahip sürekli bir dağıtımdan veri olduğunu varsayalım , ancak oldukça büyük olduğundan çekirdek yoğunluğu (örneğin) tahmin, oldukça doğrudur. Belirli bir uygulama için, gözlenen kütle fonksiyonu olan yeni bir veri kümesi elde etmek için gözlenen verileri sınırlı sayıda kategoriye dönüştürmem gerekiyor .Y1,...,YnY1,...,YnY_{1}, ..., Y_{n}p(y)p(y)p(y)[0,1][0,1][0,1]nnnp^(y)p^(y)\hat{p}(y)Z1,...,ZnZ1,...,ZnZ_{1}, ..., Z_{n}g(z)g(z)g(z) olduğunda basit …



5
Binning her ne pahasına olursa olsun kaçınılmalıdır?
Bu yüzden binning neden her zaman kaçınılması gerektiği hakkında birkaç yazı okudum . Bu iddia için popüler bir referans bu bağlantıdır . Ana kaçamak, binleşme noktalarının (veya kesme noktalarının) ve sonuçta ortaya çıkan bilgi kaybının oldukça keyfi olması ve spline'ların tercih edilmesidir. Bununla birlikte, şu anda birçok özelliği için bir …

1
Lojistik regresyon eğitiminde “kısmi kredi” (sürekli sonuç) vermek hiç iyi bir fikir mi?
Hangi koşucuların zorlu bir dayanıklılık yarışını bitireceğini tahmin etmek için lojistik bir regresyon eğitimi alıyorum. Çok az koşucu bu yarışı tamamlıyor, bu yüzden ciddi sınıf dengesizliği ve küçük bir başarı örneği var (belki birkaç düzine). Neredeyse bunu yapan düzinelerce koşucudan iyi bir "sinyal" alabileceğimi hissediyorum . (Eğitim verilerim sadece tamamlanmakla …

3
Sürekli değişken - fark biriminden bir tehlike oranı nasıl yorumlanır?
Sürekli değişkenler için Tehlike Oranlarını gösteren bir makale okuyorum, ancak verilen değerleri nasıl yorumlayacağından emin değilim. Mevcut tehlike oranları anlayışım, sayının [olayın] belirli bir koşulu göz önüne alma olasılığını temsil ettiği yönündedir. Örneğin: sigara içilmesi (bir ikili olay) verilen akciğer kanserinden ölüm için tehlike oranı 2 ise, sigara içenlerin izlenen …

2
Dichotomous ve sürekli değişken arasındaki korelasyon
İkili ve sürekli değişken arasındaki ilişkiyi bulmaya çalışıyorum. Bu konudaki temel çalışmamdan bağımsız t-testi kullanmak zorunda olduğumu ve bunun için ön koşulun değişkenin dağılımının normal olması gerektiğine karar verdim. Normalliği test etmek için Kolmogorov-Smirnov testi yaptım ve sürekli değişkenin normal olmadığını ve eğri olduğunu gördüm (yaklaşık 4.000 veri noktası için). …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.