«r» etiketlenmiş sorular

R, istatistiksel hesaplama, biyoinformatik ve grafikler için ücretsiz, açık kaynaklı bir programlama dili ve yazılım ortamıdır.


4
R: GPU'da makine öğrenimi
Eğitim hızını arttırmak için GPU'dan yararlanabilen R için makine öğrenme paketleri var mı (python dünyasından theano gibi bir şey)? GPU'da kod yürütülmesine izin veren gputools adlı bir paket olduğunu görüyorum, ancak makine öğrenimi için daha eksiksiz bir kütüphane arıyorum.

5
Modern R ve / veya Python kütüphaneleri SQL'i geçersiz kılıyor mu?
SQL Server'ın veri işlemeden temizlemeye ve munging'e kadar yaptığımız her şeyin belkemiği olduğu bir ofiste çalışıyorum. İş arkadaşım, gelen verileri yöntemsel olarak işlemek için karmaşık işlevler ve saklı yordamlar yazma konusunda uzmanlaşmıştır, böylece standartlaştırılabilir ve raporlarda, görselleştirmelerde ve analiz projelerinde çalıştırılabilir. Buraya başlamadan önce, en temel sorguları yazmanın yanı sıra …
14 python  r  data-cleaning  data  sql 

3
Hasar verilerindeki geçmiş durumlardan sonraki tıbbi durumu tahmin etme
Şu anda bazı laboratuvar ve eczane taleplerini içeren çok çeşitli sağlık sigortası talep verileriyle çalışıyorum. Bununla birlikte, veri setindeki en tutarlı bilgi, tanı (ICD-9CM) ve prosedür kodlarından (CPT, HCSPCS, ICD-9CM) oluşur. Hedeflerim: Kronik böbrek hastalığı gibi tıbbi bir durum için en etkili öncü koşulları (komorbiditeler) belirleyin; Bir hastanın geçmişte sahip …

1
Kaç LSTM hücresi kullanmalıyım?
Kullanmam gereken minimum, maksimum ve "makul" miktarda LSTM hücresi ile ilgili herhangi bir temel kural (veya gerçek kurallar) var mı? Özellikle ben ilişkin am BasicLSTMCell TensorFlow ve gelen num_unitsmülk. Lütfen şu şekilde tanımlanan bir sınıflandırma sorunum olduğunu varsayalım: t - number of time steps n - length of input vector …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 

3
Python için kullanıma hazır iyi dil modelleri var mı?
Ben bir uygulama prototip ve bazı oluşturulan cümleler üzerinde şaşkınlık hesaplamak için bir dil modeline ihtiyacım var. Python'da kolayca kullanabileceğim eğitimli bir dil modeli var mı? Gibi basit bir şey model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

2
% 100 model doğruluğu örnek dışı veri taşması mı?
Ben cognitiveclass.ai R dersi için makine öğrenimini tamamladım ve randomforests ile denemeye başladım. R "randomForest" kütüphanesini kullanarak bir model yaptım. Model iyi ve kötü iki sınıfla sınıflandırır. Bir modelin aşırıya kaçması durumunda, kendi eğitim setindeki veriler üzerinde iyi performans gösterdiğini, ancak örnek dışı veriler üzerinde kötü performans gösterdiğini biliyorum. Modelimi …

1
Windows'da R için GPU Hızlandırılmış Veri İşleme
Şu anda veri analizi için R'yi yoğun olarak kullanan Big Data hakkında bir makale alıyorum. Oyun nedenleriyle bilgisayarımda bir GTX1070 var. Bu yüzden, öğretmenlerimin bana yaptıkları bazı şeylerin işlenmesini hızlandırmak için bunu kullanabilmemin gerçekten harika olacağını düşündüm, ancak bunu yapmak hiç de kolay görünmüyor. GpuR, CUDA, Rtools ve birkaç diğer …
11 r  gpu  parallel 


1
Fisher Skorlaması v / s MLE için Koordinat İnişi
R temel işlevi glm()MLE için Fishers Scoring kullanırken glmnet, aynı denklemi çözmek için koordinat iniş yöntemini kullanıyor gibi görünüyor. Koordinat inişi Fisher Scoring'den daha zaman verimlidir, çünkü Fisher Scoring diğer bazı matris işlemlerine ek olarak ikinci dereceden türev matrisini hesaplar. Bu da koordinat inişini aynı görevi O (np) zamanında yapabilir. …

3
Çok partili sistemde seçim sonucunu hesaplamak için hangi regresyon kullanılır?
Parlamento seçimlerinin sonucunu tahmin etmek istiyorum. Çıktım, her bir tarafın aldığı% olacak. 2'den fazla parti var, bu nedenle lojistik regresyon uygulanabilir bir seçenek değil. Her taraf için ayrı bir gerileme yapabilirdim, ancak bu durumda sonuçlar bir şekilde birbirinden bağımsız olur. Sonuçların toplamının% 100 olmasını sağlamaz. Hangi regresyonu (veya başka bir …

3
Desen analizi için veri görselleştirme (dilden bağımsız, ancak R tercih edilir)
Onları bir desen anlamak için bir disk görüntü baytlar çizmek istiyorum. Bu temelde akademik bir görevdir, çünkü bu kalıbın bir disk test programı tarafından oluşturulduğundan neredeyse eminim, ancak yine de tersine mühendislik yapmak istiyorum. Desenin 256 karakterlik bir periyodiklikle hizalandığını zaten biliyorum. Bu bilgiyi görselleştirmenin iki yolunu hayal edebilirim: ya …
11 r  visualization 

3
Bilimsel hesaplama için en iyi diller [kapalı]
Kapalı . Bu sorunun daha fazla odaklanması gerekiyor . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Soruyu, yalnızca bu yayını düzenleyerek tek bir soruna odaklanacak şekilde güncelleyin . 5 yıl önce kapalı . Çoğu dilde bazı bilimsel bilgi işlem kütüphaneleri var gibi görünüyor. Python var Scipy Rust …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

4
Sıklıkla birlikte satın alınan öğeleri görselleştirme
Bir CSV dosyasına eklenen aşağıdaki yapıda bir veri kümesi var: Banana Water Rice Rice Water Bread Banana Juice Her satır, birlikte satın alınan öğelerin bir koleksiyonunu gösterir. Örneğin, ilk satır öğeleri bu belirtmektedir Banana, Waterve Ricebirlikte satın alındı. Aşağıdaki gibi bir görselleştirme oluşturmak istiyorum: Bu temelde bir ızgara grafik ama …

2
ggvis ve ggplot2 + Parlak; etkileşimli görselleştirme için hangisini seçmeli?
CrossValidated'da benzer bir soru var ve cevapları okudum. Sorum biraz farklı. Verilerimi sadece görselleştirmek istemiyorum ve aslında görselleştirmek istediğim her iki paketle de görselleştirmek kolay değil. Grafiğimde iki nokta kümesi var ( koordinatları). Kenar eklemek ve bir grafiğe benzer yapmak istiyorum. Ben varsa puan, sonra benim sorunun niteliğine bağlı olarak, …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.