R - istatistiklerine ait referans kitabı var mı ve ne içermelidir?


25

Arka fon

Bununla ilgili çok fazla tartışma var, bu yüzden cevabımı StackExchange'in önceki ihalelerinden ve öfkeyle googling yaparak bulabileceğimi düşündüm. R ile (biyo) istatistikler için sadece bir referans kitabı bulmaya çalışırken yarım gün kullandıktan sonra, kafam tamamen karıştı ve pes etmek zorunda kaldım. Belki bir araya getirilen ücretsiz materyal aslında şu anda satın alabileceğiniz kitaplardan daha iyidir. Bunu öğrenelim.

İnternet, R dili için iyi bir edebiyatla doludur , bu yüzden çoğu zaman bir ofis dekorasyonu olarak kullanılan, vasat bir kitap için para ödemenin hiçbir anlamı yoktur. R ana sitesi, R ile ilgili kitapları listeler ve birçoğu vardır. Daha kesin olmak gerekirse: 115. Sadece bir tanesine “ bağımsız istatistik referans kitabıyazıyor . Şimdi 8 yaşında ve modası geçmiş olabilir. S ile Modern Uygulamalı İstatistik'in dördüncü baskısı daha da eskidir. R Kitap , genellikle referansların yetersizliği, kötü biçimlendirilmiş kod ve özensiz sonuçtan dolayı çok temel olarak çiğnenmektedir ve önerilmemektedir .

Ancak, pratik istatistiklere (her şeyden önce) R (ikincil) için bağımsız bir referans olarak kullanabileceğim bir kitap arıyorum . Kitap ofis masamda, rafta toz yerine ek açıklamalar, kahve lekeleri ve yağlı parmak izleri toplayarak yaşamalıdır. Şimdiye kadar kullandığım ücretsiz pdf koleksiyonunun yerini almalı, R'nin mükemmel bir referans kütüphanesiyle geldiğini unutmamak gerekir. “ Doğru yaklaşım nedir? ”,“ Neden? “ve“ teknik olarak nasıl çalışır? ”genellikle“ R ile nasıl yapılır? ” dan daha fazla soru soruyor.

Ekolojist olduğum için çoğunlukla biyoistatistiğin uygulamaları ile ilgileniyorum. Ancak, bu şeyler genellikle birbirine bağlı olduğu için, disiplinlerarası bir genel referans benim için en değerli şey olacaktır.

Görev

Eğer böyle bir kitap varsa (bundan şüpheliyim), lütfen kitabın adını (cevap başına sadece bir tane) ve kitabın konu için neden referans kitabı olarak adlandırılması gerektiğini açıklayan kısa bir inceleme yapın. Bu soru mevcut olanlardan çok farklı olmadığından, lütfen cevabınız için bu adımı kullanın . Ayrıca kitabın kusurlarını da listeleyebilirsiniz, böylece bunları ideal referans kitabının özellikleri olarak listeleyebiliriz.

Sorum şu ki, R içeren istatistiklerin (en çok kullanılan türde) referans kitaplarının neler içermesi gerekir?

Bazı ilk düşünceler genel özellikleri takip ediyor (lütfen güncelleyin):

  • Tuğla gibi kalın
  • Özlü, ancak anlaşılabilir
  • Rakamlarla doldurulmuş (verilen R kodu ile)
  • Metinden en önemli detayları tanımlayan tablo ve çizimleri anlamak kolay
  • Anlaması kolay, en önemli denklemleri içeren istatistikler / yöntemler hakkında açıklayıcı metin.
  • Her yaklaşım için iyi örnekler (R kodu ile)
  • Geniş ve güncel referans listesi
  • Minimum yazım hatası sayısı

İçindekiler

Bir istatistikçi olmadığımdan ve soruyu cevaplamak için bu (mevcut değil mi?) Kitabına ihtiyaç duyduğum için içerikler hakkında yazmak benim için zor. Çünkü Türkiye'deki AR Kitap açıkça R ile istatistikler için başvuru kitabı olma niyetinde, ama çoğu zaman eleştiriliyor, ben bağımsız R istatistik referans kitap için içindekiler için bir başlangıç noktası olarak kitaptan içindekiler tablosunu kopyaladı. Ek görev: lütfen içindekiler için ilaveler, öneriler, silme, vb.

  1. Başlamak
  2. R Dilinin Temelleri
  3. Veri girişi
  4. Dataframes
  5. Grafik
  6. Tablolar
  7. Matematik
  8. Klasik Testler
  9. İstatistiksel Modelleme
  10. gerileme
  11. Varyans Analizi
  12. Kovaryans Analizi
  13. Genelleştirilmiş Doğrusal Modeller
  14. Veri say
  15. Tablolardaki Verileri Say
  16. Oran Verileri
  17. İkili Tepki Değişkenleri
  18. Genelleştirilmiş Katkı Modelleri
  19. Karışık Etki Modelleri
  20. Doğrusal Olmayan Regresyon
  21. Ağaç modelleri
  22. Zaman serisi analizi
  23. Çok Değişkenli İstatistik
  24. Mekansal İstatistik
  25. Hayatta Kalma Analizi
  26. Simülasyon Modelleri
  27. Grafik Görünümünü Değiştirme
  28. Kaynaklar ve Daha Fazla Okuma
  29. indeks

Daha önce ne söylendi?

StackExhange, istatistik ve R kitap önerileri isteyen birkaç basamak içerir. R dilini öğrenmek için kitaplar, istatistik yönü olmadan bir referans kitap olan R dilini öğrenmekten bahseder. R Programlama Sanatı en iyi öneri olarak sıralanır. R kullanarak İstatistikleri Öğrenmek İçin Kitap, referans kitabıyla gerçekten aynı olmayan istatistiklerle ilgili ideal bir giriş kitabıdır. Açık Kaynak istatistiksel ders kitapları yer alıyor R ile çok değişkenli istatistik iyi bir alternatif olarak. İstatistikçi olmayan bilim adamları için hangi kitabı önerirsiniz? Seçim programını belirtmeden en iyi istatistik referans kitabı hakkında sorular sorar.R skorundaki deneysel tasarım verilerinin simülasyonuna dair referans veya kitap, belki de soruma en yakın olanı Bilimsel Programlama ve Simülasyona Giriş R kullanımı burada en çok tavsiye edilen kitaptır ve aradığım şeye yakın olabilir. Ancak, bu kitap ya R ile olan istatistiklere tek bir referans kitabı olarak yetmez.

Referans kitabı için bazı öneriler ve kusurları

Action in R, The R Book'tan daha iyi yorumlar aldı, ancak görünüşe göre tanıtım niteliğinde .

Biyoistatistik tasarım ve R kullanarak analiz: pratik bir rehber belki aradığım şeye yakındır. İyi bir inceleme aldı , ama görünüşe göre bu da birçok yazım hatası içeriyor. Ek olarak, bu kitap istatistiklerin açıklanması üzerine yoğunlaşmıyor, araştırmacıların kullanması için hazır yemek tarifleri olarak istatistiksel analizler veriyor.

R'deki Ekolojik Modeller ve Veriler tanıtım seviyesini atlar. Bu "giriş" kelimesini görmek , R kitap listesindeki 43 tekrarlamayı , ancak istatistiklerin referans kitabının peşindeyseniz belki de tam olarak tatmin edici olmadığını gösteren çok kullanışlı bir özellik …?

Bilimsel Programlama ve Simülasyona Giriş R kullanımı çok olumlu bir inceleme aldı , ancak veri simülasyonuyla sınırlı.

Richiemorrisroe düşündürmektedir S ile Modern Uygulamalı İstatistik mükemmel değerlendirmeleri (aldı R. Bu kitap ile bağımsız bir istatistik referans kitap için yeterlidir 1 , 2 ) ve muhtemelen şu anda başlık için en iyi aday? En son sürüm 10 yıl önce ortaya çıkmış ve bu program geliştirme sürecini uzun zamandır düşünmektedir.

Dimitriy V. Masterov, Regresyon ve Çok Düzeyli / Hiyerarşik Modeller Kullanarak Veri Analizi önermektedir . Bu kitabı henüz kontrol etmedim.


Çok sayıda kitap incelemesi okuduktan sonra, burada sorulan mükemmel kitabın henüz olmadığı anlaşılıyor. Ancak, oldukça yakın olanı seçmek mümkündür. Bu adım, istatistik kullanıcılarının varolan en iyi referans kitabını bulmaları için bir topluluk wiki'si ve yeni ve eski kitap yazarlarının çalışmalarını iyileştirmeleri için bir motivasyon olarak tasarlanmıştır.


3
(+1) iyi inceleme için! Ancak, kendi sorunuza kendi sorunuz içinde cevap verdiğiniz anlaşılıyor ...
ocram

1
Bunu anlamak için çok zaman harcadıysanız, kendinize ait uzun bir liste ve hatta böyle bir kitabın özeti ile geliyorsanız, bir tane yazmalısınız. Birisi [BLAH] hakkında iyi bir inceleme makalesi istediğinde ve varolan beş veya on inceleme makalesi hakkında neyi sevmediğini tartıştığı zaman üzerine istatistik ve ekonometri listeleri hakkında sık sık verdiğim bir öneri - üzerine kendi makalenizi yazın.
StasK

Yanıtlar:


12

Şahsen, S-Plus ile Modern Uygulamalı İstatistik'in ana hatlarıyla belirttiğiniz tüm kutuları işaretlediğini düşündüm. Her örnek R koduna sahiptir, diğer kaynaklara iyi referanslar verir ve Venables ve Ripley gerçekten takdir ettiğim harika ve açıklayıcı ve açıklayıcı bir yazı stiline sahiptir. Kitabı çok sık okudum ve her seferinde ondan daha fazla okudum. Elbette, kilometreniz değişebilir.


2
Katılıyorum. R tabanlı birçok istatistik kitabım var ve MASS4 muhtemelen aradığınız şeye en yakın olanıdır, ancak “terse” ifadelerinde okunaksız bir şekilde vecize olur ve sahip olduğumdan daha fazla istatistiki bilgi birikimi gerektirir. Bu, neredeyse 10 yıl boyunca kitabım var ve geri dönüp yeni şeyler öğrenmeye devam ediyorum. Yaşının seni ertelemesine izin vermem. Oh, ve ben şimdi bir istatistik phd :-) yapıyorum
Sean Sean

Ayrıca, MASS'a geri dönüp, referans kitabı olarak açıklanmış bir tercih olduğu anlaşılıyor.
Peter Ellis,

MASS'in 1998 sürümü 2003'ten çok farklı mı? İçerik farkının, bunun için £ 50 daha fazla para harcamak için yeterli olup olmadığını merak edin.
söylemektedir

6

Böyle güzel bir soru için teşekkür eder ve özellikle bu bilgileri derler. Maalesef, tarif ettiğiniz kitap mevcut değil ve dürüst olmak gerekirse, muhtemelen mevcut olamazdı. Öncelikle istediğin istatistik için bir referans kitapsa, doğrusal modeller hakkında gerçekten iyi bir kitapla başlardım. Benim tavsiyem Kutner ve ark.hem hacim hem de kütlede tuğladan daha büyük olma kriterlerini karşılar, çok kapsamlı, açık ve pek çok örnekle. Aslında, R gereksinimini ortadan kaldırırsanız, listenizin hemen hemen tamamını tıklar. Sık sık geri dönüyorum. Ancak, ~ 1500 sayfalarda, sadece doğrusal modelleri kapsar - yani, regresyon ve ANOVA - birkaç başka konuda bazı kısa bölümler vardır, ancak bunun için gerçekten başka kitaplar isteyeceksiniz. Daha sonra, çalışmanız gerekebilecek diğer teknikler için (örneğin, hayatta kalma analizi, mekansal analiz vb.), Sizin için uygun düzeyde birinci sınıf bir istatistik referans kitabı alacağım. Bu kitaplar, örnekleri için R'yi kullanmazlarsa, R-kullanımından gibi, R'ye özgü bir kitap almak isteyebilirsiniz! Kitaplar, ancak belgeler arasında, vinyetlerin, R-help posta listelerinin, StackOverflow ve CV'ye ihtiyacınız olmayabilir. Doğru şekilde R programlamayı öğrenmek istiyorsanız, o kitaplardan birini de edinmelisiniz. Bu noktada en az 4 kitabınız var. Üzgünüm, ama bu böyle. İstatistiklerle yoğun olarak çalışan hiç kimsenin her şeyi kapsayan tek bir kitabı yoktur.


5

Böyle bir kitabın olduğunu sanmıyorum. Bence en yakınımda olan kitap Gelman ve Hill'in Regresyon ve Çok Düzeyli / Hiyerarşik Modeller Kullanarak Veri Analizi .

Eksileri:

  • ~ 5 yaşında ve sosyal bilimcileri hedefliyor.

  • İçindekiler listenizde her şey bulunmuyor (mekansal değil, temelde zaman serilerinde yok)

Artıları:

  • İyi yazılmış

  • Bağlantıda bir hata listesi ve bir TOC var.

  • Numaralandırılmış listenizde olmayan, eksik veriler gibi önemli şeyleri kapsar.

  • Madde imli listenizdeki çoğu maddeye isabet ediyor.

  • Çok sayıda grafik ve R kodu (çoklu seviye için bazı Bugs kodu).

  • Tüm veri / kod indirmek için kullanılabilir.


4

İstatistiki Öğrenmenin Elemanları ile çalışıyorum . Bu kitap inanılmaz bir teknik yelpazesini kapsar (yani 700'den fazla sayfa) ancak her bir yaklaşım son derece teorik bir şekilde değil, çok pratik bir şekilde açıklanmaktadır. Açıkça R ile ilgili hiçbir şey içermez, ancak grafikler ve grafiklerin tümü R ile açıkça yapılmıştır ve CRAN'da tartışılan tüm konular için paketler vardır. Yazarların tümü, R'nin (aynı zamanda modern makine öğrenme tekniklerinin adil bir parçası) geliştirilmesine dahil olmuştur.


2
Bu kitap için bir R paketi bile var: ElemStatLearn :-)
chl

3

Şu anda en yüksek oy alan cevabın MASS4'ün talebe oldukça iyi uyduğunu ve oldukça yüksek düzeyde istatistiksel bir sofistike olma ihtiyacını karşılamakta zorluk çeken başka bir katılımcı ile aynı deneyime sahip olduğunu kabul ettim. MASS3 aslında ilk "Rbook'umdu" ve bu kapasitede oldukça iyi hizmet etti. Crawley’nin “The R Book” ’unu satın aldım ve hem R dilinin yanlış bir tanımı hem de istatistiksel teorinin derinliği eksik gibi görünen bir dizi çalışılmış örnekden biraz daha az olması için tatmin edici buldum.

Bununla birlikte, zamanın geçişi ile Harrell'in "Regresyon Modelleme Stratejileri" ni (RMS) bu sorunun "biyoistatistik" odağı için iyi bir derinlikte bulmaya daha uygun buldum. Bu, R üzerine bir tanıtım metni değildir. Bunun için başka bir yere bakması gerekir ve bunun için R'yi Kullanarak Bilimsel Programlama ve Simülasyona Giriş'i tavsiye ederim [ http://www.crcpress.com/product/isbn/9781420068726] veya (rağmen) adı) "Dummy'ler için R", uzun süredir StackOverflow'un R ilanı etiketlerine katkıda bulunan kişiler tarafından yazılmıştır. RMS’nin ilk baskısında yalnızca S’ye daha çok odaklandığında var, ancak o zamandan beri Harrell R’e geçti verms/HmiscR paketi ikilisi. Mekansal analizler veya karışık modeller olmasa da, @ gung'un listelenen alanların bazılarında uzmanlık kapsamı için önerisini sağladığına inanıyorum.


1
Hem RMS hem de MASS'ı tavsiye ederim. Biyoistatistikte bulunmuyorum ama Harrell'deki tavsiyelerin çoğu daha genel olarak faydalı. Araştırmacı öğrencilerden sık sık Harrell okumalarını ya da en azından 4. bölümde okuduklarını ve sonra da sık sık aşina olduklarından emin olmak için MASS'ı iyi bir genel kitap olarak önermelerini istiyorum.
Glen_b -Reinstate Monica

Genel bireysel çalışma için Cox ve Hinkleys'in "Teorik İstatistikleri" ve Feller'ın 2 cildindeki "Olasılık Teorisine Giriş" 'i aday gösteriyorum. Ancak bu açıkça bu sorunun R kısmına değinmiyor.
DWin

[Denetlediğim öğrenciler, çalışmaları oldukça fazla olsa da, istatistiklerin dışında kalan alanlardalar. Kendall ve Stuart - kendi geçmişime göre çok değerliydi]
Glen_b -Reinstate Monica

2

Eğer çevirmek istersen ... (4.900 sayfalık teorik kitabın eşlik eden kitabı):

Büyük r kitap

(Ben ortak yazar olduğum) bu kitap, lisans ve lisansüstü seviyedeki 15 yıllık danışmanlık deneyim ve öğretimin bir derlemesidir ve sadece 4.900 sayfamda matematiğin ayrıntıları (deliller) verilen R öğelerinin örneklerini gösterir. hesaplamaların da elle yapıldığı, eşlik eden, sayısal değerlere sahip kitaplar (sonraki sürümde sunulacak olan +500 sayfa). Bu kitap aynı zamanda, yazılımın doğru değerleri verdiğini kontrol etme imkanı sunar ve Avrupa'daki yüksek lisans derslerinde normalde okutulan dersler hakkında elle veya MS Excel'de hesaplama yapmaktan çok daha eğlencelidir. Bu kitabın amacı aynı sonucu elde etmek için pek çok yerine 1 yazılımı kullanabildiğinizi göstermektir (birlikte JMP + Minitab + SPSS + SAS + MATLAB kullanmak yerine). Bu kitap aynı zamanda R'nin zayıf yönlerini de gösterir (paket bakımı garanti edilmez). Aynı zamanda çeşitli R forumlarında ve bloglarında çok değerli soruların bir özetidir. Ücretsiz ve renkli!


1
İstenen "kısa incelemeyi" de verebilir misiniz? Neden bu kitabı öneriyorsun? Bu konuda iyi (ve kötü) şeyler nelerdir?
whuber

Yardımcı yazarlardan biriyim ... kısa bir inceleme için pek nötr değil ...
Vincent ISOZ

1
Sorun değil - sizden kitabınızın güçlü yanları hakkında ne düşündüğünüzü veya bundan faydalanabileceklerin karakteristiklerini sizden duyduğumuza minnettar oluruz. Kitabınızla olan bağlantınızı açıklayarak (ki bu esastır ), okuyucuların söylediklerinizi değerlendirirken bunu hesaba katmasını sağlarsınız. Pek çok okuyucunun bu kitap hakkında bilgili olduğunu ve söylediklerini takdir edeceğini anlayacağından şüpheleniyorum. Bir tür inceleme sağlamadan önce, cevabınız, nispeten az dikkat çekecek yalnızca bir yorumda bulunmak zorunda kaldı.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.