«r» etiketlenmiş sorular

R, istatistiksel hesaplama, biyoinformatik ve grafikler için ücretsiz, açık kaynaklı bir programlama dili ve yazılım ortamıdır.

2
R'de Veri Bilimi için Yazılım Testi
Python kodumu test ederken, özellikle diğer modüller veya diğer kod parçaları ile entegre edilmesi gerektiğinde , genellikle Burun, Tox veya Unittest kullanıyorum . Ancak, şimdi ML modelleme ve geliştirme için R'yi python'dan daha fazla kullandığımı gördüm. R kodumu gerçekten test etmediğimi fark ettim (Ve daha da önemlisi, bunu nasıl iyi …

1
Hartigan-Wong k-ortalamaları yöntemi ve diğer algoritmalarda yakınsama
Esasen dil statspaketinde uygulanan farklı k-ortalama kümeleme algoritmalarını anlamaya çalışıyorum R. Lloyd'un algoritmasını ve MacQueen'in çevrimiçi algoritmasını anlıyorum. Onları anlama şeklim şu şekildedir: Lloyd Algoritması: Başlangıçta 'k' kümelerinin sentroidleri olarak işlev görecek 'k' rastgele gözlemler seçilir. Daha sonra sentroidler birleşene kadar yineleme aşağıdaki adımlar gerçekleşir. Her bir gözlem ile seçilen …
10 r  clustering  k-means 

5
LSTM veya R için diğer RNN paketi
Shakespeare benzeri metinler üreten LSTM modellerinden bazı etkileyici sonuçlar gördüm. R için bir LSTM paketinin olup olmadığını merak ediyordum, bunun için googledim, ancak sadece Python ve Julia için paketler buldum. (belki de bu programların neden R'ye göre daha fazla tercih edildiğini açıklayan bazı performans sorunları vardır) R için bir LSTM …
10 r  neural-network  rnn 

1
R'deki grafikler için kütüphaneler (etiket yayılma algoritmaları / sık sık alt madencilik)
Sorunun genel tanımı Bazı köşeleri 3 veya 4 olası değerleri olan bir tür etiketli bir grafik var. Diğer köşeler için tür bilinmiyor. Amacım, etiketlenmemiş köşelerin türünü tahmin etmek için grafiği kullanmaktır. Olası çerçeve Bunun, literatürü okumama dayanarak etiket yayılım problemlerinin genel çerçevesine uyduğundan şüpheleniyorum (örneğin, bu makaleye ve bu makaleye …

4
R'de ordinal regresyonu öğrenmek?
Bir proje üzerinde çalışıyorum ve beni hızlandırmak için kaynaklara ihtiyacım var. Veri seti 30 ya da daha fazla değişken üzerinde 35000 civarında gözlemdir. Değişkenlerin yaklaşık yarısı kategoriktir ve bazıları çok sayıda farklı olası değere sahiptir, yani kategorik değişkenleri kukla değişkenlere ayırırsanız 30'dan fazla değişkene sahip olursunuz. Ama yine de muhtemelen …

3
R'nin bellek kısıtlamaları nelerdir?
“ Uygulamalı Öngörülü Modelleme ” derlemesinde gözden geçiren şöyle diyor : İstatistiksel öğrenme (SL) pedagojisine sahip olduğum bir eleştiri, farklı modelleme tekniklerinin değerlendirilmesinde hesaplama performansının dikkate alınmamasıdır. Modellerin ayarlanması / test edilmesi için önyükleme ve çapraz validasyon konusundaki vurguları ile SL, oldukça bilgi işlem yoğun. Buna, torbalama ve artırma gibi …
10 apache-hadoop  r 

1
R kullanarak karar ağaçları oluştururken verileri normalleştirmek zorunda mısınız?
Yani, bu haftaki veri setimizde 14 özellik var ve her sütun çok farklı değerlere sahip. Bir sütun 1'in altında değerlere sahipken, başka bir sütun üç ila dört tam basamaktan oluşan değerlere sahiptir. Geçen hafta normalizasyonu öğrendik ve çok farklı değerlere sahip olduklarında verileri normalleştirmeniz gerekiyor gibi görünüyor. Karar ağaçları için …
10 r  beginner 

3
Amazon ec2'de R rastgele orman Hatası: 5,4 Gb boyutunda vektör tahsis edilemiyor
R'de randomForest()1000 ağaç ve yaklaşık 20 öngörücü ve 600K sıralı veri çerçeveleri kullanarak rastgele orman modelleri eğitimi alıyorum . Dizüstü bilgisayarımda her şey iyi çalışıyor, ama aynı şeyi çalıştırmak için amazon ec2'ye taşındığımda hatayı alıyorum: Error: cannot allocate vector of size 5.4 Gb Execution halted c3.4xlargeÖrnek türü kullanıyorum, bu yüzden …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.