Pratik olarak iyi bir veri analizi süreci nedir?


15

Her bir veri analizi projesi için istatistiki veri analistlerinin çoğunun analiz sürecini bilmek veya referans almak istiyorum.

Bir "liste" yaparsam, veri analizi projesini tamamlamak için bir analistin şunları yapması gerekir:

  1. ilk olarak proje için gereksinimleri toplamak,
  2. veri analizini daha önce bu gereksinimlere göre planlamak / tasarlamak
  3. aslında verilerin ön işleme tabi tutulması,
  4. veri analizinin yapılması ve
  5. analiz sonuçlarına dayanarak bir rapor yazma.

Bu soru için Adım 2'nin daha fazla ayrıntısına ilgi duyuyorum. Ancak analistin veri analizi çıktısına göre planını veya tasarımını değiştirmek zorunda kalabileceği için bunun pratik olarak net bir kesim olmadığını anlıyorum. Bu konuda herhangi bir referans var mı?

Yanıtlar:


17

En sevdiğim "plan" veya "liste", Scott Emerson'un Veri Analizine Yaklaşımınızı Düzenleme adlı dokümanıdır .

Not: Son iki sayfa "Doktora Uygulamalı Sınav için Genel Şartlar" başlığı altındadır, ancak burada verilen tavsiyeler herhangi bir analiz problemi üzerinde çalışmayı genelleştirir.


Belgenin her bölümünü seviyorum. Değerli referansınız için teşekkürler.
Tae-Sung Shin

5

Veri Analizinin İş Akışı'nı Stata kullanarak iyi bir kitap, özellikle Stata kullanıcısı olarak buldum . Katılmama konusunda çok şey buldum, ama bu bile neden bazı şeyleri neden belirli şekillerde yaptığımı açıklığa kavuşturmaya yardımcı oldu.


4
+1, ancak uyarı emptor : Bu kitap yalnızca Stata kullanıcısıysanız değerlidir. Stata kullanmıyorum (aslında hiç kullanmadım). Öte yandan, Long'u seviyorum, bu yüzden bunu kütüphaneden kontrol ettim. Eminim orada herkes için çok iyi bilgi var, ancak alanın genel bilgilerini çıkarmak imkansız olduğu için Stata'nın kullanımı ile çok iyi iç içe geçmiş.
gung - Monica'yı eski durumuna döndürün

2

SPSS şirketi (şimdi IBM'e aittir) tarafından üretilen CRISP-DM , veri madenciliği sürecinin kısaltmasıdır ve "veri analizi" ile aynıdır. SAS, SEMMA adlı benzer bir işleme sahiptir .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.