Tukey'nin "Keşif Veri Analizi" kitabını okudum. 1977 yılında yazılan kitap, kâğıt / kurşun kalem yöntemlerini vurguluyor. Şimdi büyük veri kümelerini anında çizebileceğimizi dikkate alan daha 'modern' bir halefi var mı?
Tukey'nin "Keşif Veri Analizi" kitabını okudum. 1977 yılında yazılan kitap, kâğıt / kurşun kalem yöntemlerini vurguluyor. Şimdi büyük veri kümelerini anında çizebileceğimizi dikkate alan daha 'modern' bir halefi var mı?
Yanıtlar:
En yakın şey Cleveland'ın Görselleştirme Verileridir . Keşif Veri Analizi ile ilgili, bilgisayar tarafından oluşturulan görselleştirmelerle ilgili, derin, klasik.
Eh, tam bir kopyası değil, ama Regman ve Çok Düzeyli / Hiyerarşik Modeller kullanarak Gelman ve Hill'in Veri Analizinde tonlarca yararlı komplo tavsiyesi (ve R kodu) buldum.
Ayrıca, blogu genellikle yararlı grafik önerileriyle doludur.
Veri Analizi için Etkileşimli Grafikler: Prensipler ve Örnekler sevdiğim; Kitap açıklaması, "keşfedici veri analizini (EDA) ve etkileşimli grafik yöntemlerin içgörü kazanmanın yanı sıra veri kümelerinden yeni sorular ve hipotezler üretme konusunda nasıl yardımcı olabileceğini" tartışıyor.
Hadley Wickham'ın ggplot2 kitabı ilginçtir çünkü hem Grafik Dilbilgisi'ni hem de ggplot2 yazılımının nasıl kullanılacağını öğretir.
Ronald Pearson'un Mühendislik, Bilim ve Tıptaki Verileri Araştırması burada bahsetmeye değer. Ana hedef okuyucusu, daha fazla istatistik bilmek isteyen küçük bir matematikten korkmayan bilim adamları gibi görünüyor. Bu oldukça büyük bir grup ve burada iyi temsil ediliyor. Biraz tuhaf ve sıradışı, ancak çok fazla zemin kaplıyor ve çok mantıklı tavsiyeler içeriyor. Tukey pek çok yeni fikir önerdiği için tekrar ziyaret edilmedi, ancak biraz yanlış olduğunu düşündüğünüzde bile çalışmayı ödüllendirici olabilir.
Bu kitap çok az dikkat çekmiş gibi görünüyor, oldukça muhtemel çünkü çok pahalı, kurs metni olarak uygun değil ve henüz sadece ciltli olarak mevcut. Ancak akıllı ve okunaklı ve modern tanıtım kitaplarının (basit egzersiz sayfalarının ve sayfalarının, saçma ikonların, mutlu gençlerin çirkin fotoğraflarının, kutularla telaşlı düzeninin, ne olursa olsun, vb.) Çöplerinden arındırılmış durumda.
Bu veri analizi sürecini tanımlayan ve eksik değerleri ele alan web üzerinde halka açık iki bölümden oluşuyor. Yakında Antony Unwin tarafından çıkan yeni bir kitap var.
Okumak için iyi kitapların bir çift daha Güzel Görselleştirme ve Güzel Veri. Bunlar düzenlenmiş kitaplardır, verileri arazilerle keşfetmenin şaşırtıcı iyi örnekleri ve bazıları da hayranlık verici bölümlerdir.
Ggplot2'yi kullanmanın bazı iyi örneklerine sahip olan bir başka kitap Winston Chang tarafından hazırlanan yeni bir kitaptır.
Hoaglin, Mosteller ve Tukey tarafından yapılan sağlam ve keşif analizlerini anlama ve EDA'nın teknik takibi olarak veri tablolarını ve şekillerini keşfetme yoldaşını düşünüyorum. Aynı zamanda, Mosteller ve Tukey'in istatistiklerinin EDA'ya takibi olarak ikinci bir ders olan veri analizi ve regresyonunu da görüyorum. Yukarıda belirtilen çeşitli Cleveland kitapları hazinelerdir.