Günlük işlerinizde hangi R paketlerini en faydalı buluyorsunuz?


28

Yinelenen iş parçacığı: Az önce R'nin en son sürümünü yükledim. Hangi paketleri almalıyım?

Verilerle günlük çalışmanızı hayal edemediğiniz R paketleri nelerdir ? Lütfen hem genel hem de özel araçları listeleyin.

GÜNCELLEME: 24.10.10 gelince ggplot2, 7 oy ile daha akıllı görünüyor.

Birden fazla belirtilen diğer paketler:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

Cevaplarınız için teşekkürler!


1
Çok öznel bir soru: bu soru cevaplanamaz ve bir kalite güvence sitesi için uygun değildir.
Egon Willighagen

3
Muhtemelen topluluk wiki olmalı; Burada yararlı bir soru ama kesin bir cevabı yok.
Shane

2
@Shane: iyi nokta. taşındı. @ Egon: gerçekten öznel. Fakat cevaplar bilgili insanlardan geliyorsa, öznellik dozunun sakıncası yoktur. son zamanlarda R öğrenmeye başladım ve keşfetmek için birkaç düzine takılı yükledim, ancak elimdeki görevden bağımsız olarak daha sık kullandığım araçlar olduğunu fark ettim.
radek

StackExchange'in topluluk wiki gönderilerini sitelerdeki bağlantı yöntemini desteklemesi ilginç olurdu. Çünkü bahse gireceğim ki, bu soru Stackoverflow'ta sorulmuştur ve İstatistiksel Analiz'in genellikle SO'ları ziyaret etmeyen bazı insanları da etkileyebileceğini düşünüyorum.
Sharpie

@Sharpie: stackoverflow.com/questions/1295955/… veya stackoverflow.com/questions/1535021/… gibi çok sayıda ilginç SO mesajı var ancak paketlere odaklanmıyorlar. ve katılıyorum, topluluk wiki bağlantısı gerçekten yararlı olabilir.
radek

Yanıtlar:




8

Kullandığım xtable paketi. Xtable paketi, R tarafından üretilen tabloları (özellikle anova sonuçlarını gösteren tabloları) bir makaleye dahil edilmek üzere LaTeX tablolarına dönüştürür.


8

multicore daha hızlı komut dosyaları daha hızlı hale getirmek için aracı için oldukça güzel.
cacheSweave kullanırken çok zaman kazandırır Sweave.


8

ggplot2 - R için en iyi görselleştirmeyi sağlar.

RMySQL / RSQLite / RODBC - bir veritabanına bağlanmak için

sqldf - data.frames işlevini SQL sorguları ile yönetme

Hmisc / rms - Frank Harrell'den regresyon analizleri için uygun çeşitli fonksiyonlar ve iyi fonksiyonlar içeren paketler.

GenABEL - genom çapında dernek çalışmaları için güzel bir paket

Rcmdr - Eğer gerekirse R için iyi bir GUI.

Ayrıca CRANtastic'i de inceleyin - bu bağlantı en popüler R paketlerinin bir listesine sahiptir. Listenin en üstünde birçok kişi zaten yer aldı.


8

data.table şu an benim favorim! Uygulanan daha çok dilek listesi ile yeni sürümü bekliyoruz.



6

Şahsen benim için, müthiş Omega İstatistiksel Hesaplama Projesi'nden temin edilebilecek şu üç paketi kullanıyorum (Uzman olduğumu iddia etmiyorum, ancak amaçlarıma göre kullanımı çok kolay):

  • RCurl : R üssündeki varsayılan işlevlerin zor olacağı web sitelerine erişim sağlayan birçok seçeneğe sahip olduğunu söylemenin adil olduğunu düşünüyorum. Bu, onu geliştiren R dışındaki bir topluluğun yararına eklenmiş olan libcurl kütüphanesinin R-arayüzüdür . CRAN'da da mevcuttur .

  • XML : Hatalı biçimlendirilmiş XML / HTML'yi ayrıştırmak çok bağışlayıcıdır. Bu libxml2 kütüphanesine bir R-arayüzüdür ve tekrar sahip katma geçerli Ayrıca bunu geliştirerek Ar bütün bir toplum dışarıdan faydasını CRAN .

  • RJSONIO : Bir json çağrısından döndürülen metni ayrıştırıp daha fazla analiz için bir liste yapısı halinde organize etmesine izin verir. ve büyük verilere ölçeklenebilir.

6

Sweave R kodunu bir LaTeX belgesine gömmenizi sağlar. Kodun ve isteğe bağlı olarak kaynak kodun yürütülmesinin sonuçları nihai belgenin bir parçası haline gelir.

Bu nedenle, örneğin, R tarafından üretilen bir resmi bir LaTeX dosyasına yapıştırmak yerine, R kodunu dosyaya yapıştırabilir ve her şeyi bir yerde saklayabilirsiniz .


4
R ile tekrarlanabilir araştırmalara başlamak isteyenler için sadece bir ipucu knitr. Sweave yerine newish paketine bir göz atmanızı tavsiye ederim . Temel olarak steroid üzerinde Sweave. Öğrenmesi kolay ve kolay değil, çok daha esnek.
Christoph_J

4

Hayvanat bahçesi ve xts işimde bir zorunluluktur!


4

Ben bulmak kafes Deepayan Sarkar paha biçilmez tarafından: "R ile çok değişkenli veri görselleştirme Kafes" refakatçi kitabı ile birlikte.


4

Herhangi bir tahminde modelleme yapıyorsanız, şapka bir nimettir. Özellikle çok çekirdekli paket ile birlikte , bazı şaşırtıcı şeyler mümkündür.


4

Günden güne en yararlı paket, diğer istatistik paketler için veri okuma ve yazma işlevine sahip "yabancı" olmalıdır; örneğin, Stata, SPSS, Minitab, SAS, vb. çok önemli bir paket.


3

kullanırım

araba, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, yeniden şekillendir, RODBC, TeachingDemos, XML.

çok.


3

Onsuz yaşayamam:

  • grafikler için kafes
  • Excel dosyalarını okumak için xlsx veya XLConnect
  • rtf biçiminde raporlar oluşturmak için rtf ( Sword veya R2wd'yi tercih ederim ama işte statconn yükleyemem; yakında odfWeave'ı kesinlikle deneyeceğim .)
  • karışık modeller için nlme ve lme4
  • büyük dizilerle çalışmak için ff

2

Veritabanlarından verilere erişmek için RODBC , veri çerçevelerinde basit SQL sorguları yapmak için sqldf (kendimi yerel R komutlarını kullanmaya zorluyorum) ve ggplot2 ve plyr



2

Çoğunlukla kullanıyoruz:


Ayrıca SVM'ler için kernlab ve şapkalara bakabilirsiniz. Onlar ilginç (mutlaka daha iyi düşünmek zorunda değilsiniz) alternatifleri.
Zach,


2

Benim için kullanıyorum kernlab Kernel tabanlı Yapay Öğrenme Lab için ve e1071 SVM için ve ggplot2 grafikler için


2

Ben ggplot2, vegan kullanıyorum ve sık sık yeniden şekillendiriyorum.




2

Döngü için hızlıca veya R uyumlu olmayan tedavileri gerçekleştirmek için hızlı bir şekilde ihtiyacım olduğunda RCPP'nin büyük bir hayranıyım. R eco sisteminde çok iyi uygulanmaktadır, bir fonksiyonda argüman olarak dönüşüm olmadan Matrix / seyrek Matrix alabilir.

C ++ sözdizimi basit şeyler yaparken kolaydır (ki bu benim durumum).

Gerçekten, bu müthiş kütüphaneye ihtiyaç duymak için bir paket yapımcısı olmanıza gerek yok.

C ++ 'ın çok hızlı olduğunu söyledim mi?


2

DoParallel ve foreach paketler beni kodumu parallelize ve üzerinde bir hesaplama optimize edilmiş örneğinde çalıştırmak için izin vererek çok daha kolay hayatımı yaptık Amazon EC2 ! Onları çok sık kullanırım. Ancak bu, Louis Aslett tarafından yayınlanan RStudio AMI'ler olmadan mümkün olmazdı . Sonunda, iplerle çalışmayı gerçekten parkta yürüyüş yapan stringr paketinden söz etmeliyim . Her metin madenciliği uygulamasında kullanın. Ayrıca çalışmalarım hakkında yüksek kalitede raporlar üretmek için çok sık knitr kullanıyorum . Bu harika paket için çok teşekkürler Yihui Xie!


1

Ben daha çok ggplot2, yeniden şekillendirme, kafes, knitr kullanın.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.