R'deki büyük veri kümelerini işleme - öğreticiler, en iyi uygulamalar, vb.


11

Ben, R'deki büyük veri kümeleri üzerinde çeşitli analizler yapmak zorunda olan bir R çayhanıyım. Bu yüzden bu siteye ve başka yerlere bakarken, burada çok fazla ezoterik ve daha az bilinen sorunların olduğu ortaya çıktı - gibi hangi paketin ne zaman kullanılacağı, verilere hangi dönüşümlerin (uygulanmayacağı) uygulanacağı vb.

Sadece tüm bu şeyleri belirsizleştiren ve bilgileri sistematik bir şekilde sunan bir kitap / öğretici / rehber olup olmadığını merak ediyorum? Etrafa bakmak yerine ve farklı kaynaklardan çevrimiçi bilgi toplamak yerine bunu yapmayı tercih ederim.

Şimdiden teşekkürler.



1
Ne tür bir analiz yapmak istediğinize ve verilerinizin nasıl göründüğüne ilişkin bazı örnekleri paylaşmak yardımcı olabilir. Ortalamalar veya karmaşık regresyonlar gibi basit istatistikler? Bin satıra 200 değişken mi, 4 değişken ve 20 milyon satıra mı?
PaulHurleyuk

1
Gerçekten "büyük" veri kümeleriniz varsa, belki de ilişkisel veritabanlarına bir göz atmalısınız. Bunun için bir başlangıç ​​noktası, RNB ile birlikte gönderilen "R Verilerini İçe / Dışa Aktar" kılavuzu olabilir. Kılavuz, R web sitesinin "Kılavuzlar" bölümünden de edinilebilir.

1
İlk olarak, önemli bir soru: Ne yapmak sen büyük demek ve ne yapmak istiyorsun?
Fomite

Yanıtlar:


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.