«dataset» etiketlenmiş sorular

Veri kümesi istekleri bu sitede konu dışıdır. Veri kümeleri oluşturma, işleme veya bakımını yapma ile ilgili sorular için bu etiketi kullanın.

3
Özellik seçimi yalnızca eğitim verileri (veya tüm veriler) üzerinde mi yapılmalıdır?
Özellik seçimi yalnızca eğitim verileri (veya tüm veriler) üzerinde mi yapılmalıdır? Guyon (2003) ve Singhi ve Liu (2006) gibi bazı tartışmalar ve makalelerden geçtim , ancak yine de doğru cevaptan emin değilim. Deneme kurulumum şu şekildedir: Veri seti: 50 sağlıklı kontrol ve 50 hastalıklı hasta (hastalık tahmini ile ilgili olabilecek …


3
Farklı ülkelerde çocukların istatistik eğitimi?
Dünyanın farklı ülkelerinde çocukların hangi düzeyde istatistik öğrendiklerini bilmek istiyorum. Bu konuda neler olduğuna ışık tutan verileri / linkleri önerebilir misiniz? Ben başlayacağım. İsrail: İleri düzey matematik eğitimi alan öğrenciler aşağı yukarı - ortalama, sd, histogram, normal dağılım, çok temel olasılık.
10 dataset  teaching 

3
Regresyon'u veri aralığının dışında yansıtmak için kullanma tamam mı? asla tamam değil mi? bazen tamam mı?
Veri aralığının dışında projeksiyon yapmak için regresyon kullanma hakkındaki düşünceleriniz nelerdir? Doğrusal veya güç modeli şekline uyduğundan eminseniz, model veri aralığının ötesinde yararlı olamaz mı? Mesela fiyat bazında hacimim var. İnandığım veri aralığı dışındaki fiyatlar için projeksiyon yapabilmeliyiz. Senin düşüncelerin? VOL PRICE 3044 4.97 2549 4.97 3131 4.98 2708 4.98 …

2
Kovalaştırma nedir?
Ben şanssız makine öğrenme "kova" net bir açıklama bulmak için dolaşmak. Şimdiye kadar anladığım şey, kovalamanın, bir dizi sürekli değerin bir ayrı değerle değiştirildiği dijital sinyal işlemedeki nicemlemeye benzer olmasıdır. Bu doğru mu? Kovalamanın uygulanmasının artıları ve eksileri (bilgi kaybetmenin bariz etkisinin yanı sıra) nelerdir? Kovalamanın nasıl uygulanacağına dair genel …


2
İlişkisel verilerden öğrenme
Ayarlar Birçok algoritma tek bir ilişki veya tablo üzerinde çalışırken, gerçek dünyadaki birçok veritabanı bilgileri birden çok tabloda depolar (Domingos, 2003). Question Ne tür algoritmalar çoklu (ilişkisel) tablolardan iyi öğrenir. Özellikle, regresyon ve sınıflandırma görevleri için geçerli olan algoritmalarla ilgileniyorum (ağ analizine yönelik olanlar değil, örneğin bağlantı tahmini). Aşağıda listelenen …

1
Gözlenen ve beklenen olayları nasıl karşılaştırırım?
Diyelim ki 4 olası olayın sıklık örneğine sahibim: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 ve olaylarımın gerçekleşmesi için beklenen olasılıklarım var: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dört olayın gözlemlenen frekanslarının toplamı ile (18) Olayların beklenen frekanslarını hesaplayabilir …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

2
Kendi Machine Learning uygulamalarını test etmede yararlı olan veri kümelerini nerede bulabilirim? [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. 6 yıl önce kapalı . Şu anda bazı Makine Öğrenimi algoritmalarını kendi başıma uygulamaya çalışıyorum. Birçoğu hata ayıklamak zor olma özelliğine sahiptir, bazı hatalar programın …
9 dataset 


4
Otokorelasyon ve sinir ağları için Matlab kullanırken zaman serisi verilerindeki boşluklar / NaN'ler ile nasıl başa çıkılır?
Bir zaman serisi ölçümlerim var (yükseklikler bir boyutlu seri). Gözlem döneminde, ölçüm süreci bazı zaman noktalarında azalmıştır. Sonuçta elde edilen veriler, verilerde boşlukların bulunduğu NaN'lere sahip bir vektördür. MATLAB kullanarak, otokorelasyon ( autocorr) hesaplanırken ve sinir ağları ( nnstart) uygulanırken bu bana bir soruna neden oluyor . Bu boşluklar / …

7
Kümeleme algoritmalarının özelliklerini göstermek için 2B yapay veri arama
Farklı dağılımları ve formları takip eden 2 boyutlu veri noktalarının veri setlerini arıyorum (her veri noktası iki değerin (x, y) bir vektörü). Bu tür verileri oluşturmak için kod da yardımcı olacaktır. Bazı kümeleme algoritmalarının nasıl çalıştığını çizmek / görselleştirmek için bunları kullanmak istiyorum. İşte bazı örnekler: bulut verisi gibi yıldız …

7
Veri görselleştirme örnekleri, öğretim ve araştırma için veri setleri
Araştırdığımız çeşitli veri-vizyon tekniklerini test etmek için kullanabileceğimiz mevcut veri kümelerini arıyorum. R dahil olanlar gibi çeşitli kaynaklar biliyorum (deneyin plot(Orange)veya bakın burada ). Ama bunu bir adım ileri götürmek istiyorum: Bir görselleştirme aracını test etmek için en iyi gerçek dünya veri kümeleri hangileri? Akademik makalelerde hangi veri kümelerini kullandınız …

2
Veriler için ROC eğrisini hesapla
Bu yüzden, Hamming Distance kullanarak biyometrik özellikteki bir kişinin kimliğini doğrulamaya çalıştığım 16 denemem var. Eşik değer 3,5'e ayarlandı. Verilerim aşağıda ve yalnızca deneme 1 Gerçek Olumludur: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.