Hadley'den beklendiği gibi, makalesi düzenli verilerin iyi bir tanımını içeriyor ve makalesindeki hemen hemen her şeye katılıyorum ve bunun sadece "veri profesyonelleri" için geçerli olmadığına inanıyorum. Bununla birlikte, bazı temel sorunlardan kaçınılması durumunda, yaptığı bazı noktaların düzeltilmesi nispeten kolaydır (örneğin, yazdığı paketlerle). Bu sorunların çoğu, Excel'in yaygın kullanımının bir sonucudur. Excel değerli bir araçtır ve yararları vardır, ancak bazı özellikleri veri analistleri için sorunlara neden olur.
Bazı noktalar (deneyimlerimden):
- Bazı insanlar renkli e-tabloları sever ve biçimlendirme seçeneklerini bol miktarda kullanır. Verilerini düzenlemelerine ve tabloları sunum için hazırlamalarına yardımcı olursa, her şey yolunda. Ancak, bir hücre renginin verileri gerçekten kodlaması tehlikelidir. Bu verileri kaybetmek kolaydır ve bu tür verilerin istatistiksel yazılıma aktarılması çok zordur (örn . Stack Overflow ile ilgili bu soruya bakın ).
- Bazen bazı güzel biçimlendirilmiş veriler alırım (insanlara nasıl hazırlayacağını söyledikten sonra), ancak yorum için özel bir sütun veya ayrı bir dosya kullanmalarını istemelerine rağmen, bir değer sütununa yorum yapmaya karar verirler. Sadece veri alırken bu sütun ile özel bir şekilde başa çıkmak zorunda değil, ama asıl sorun, (ki genellikle yapmazdım) bu tür yorumları görmek için tüm tabloyu kaydırmak gerekecek olmasıdır. Excel'in yorum yapma olanaklarını kullanırlarsa bu daha da kötüleşir.
- İçinde birkaç tablo, birden çok başlık satırı veya bağlı hücre bulunan e-tablolar, bunları istatistiksel yazılımda içe aktarmaya hazırlamak için el ile çalışmaya neden olur. İyi veri analistleri genellikle bu tür manuel çalışmalardan hoşlanmazlar.
- Asla Excel'de sütunları asla gizlemeyin. Gerekli değilse, silin. Gerekirse onlara gösterin.
- xls ve torunları başkalarıyla veri alışverişi yapmak veya arşivlemek için uygun dosya formatları değildir. Dosya açıldığında formüller güncellenir ve farklı Excel sürümleri dosyaları farklı şekilde işleyebilir. Bunun yerine basit bir CSV dosyası öneririm, çünkü neredeyse tüm veri ile ilgili yazılım bunu (Excel'i bile) içe aktarabilir ve yakında değişmeyeceği beklenebilir. Bununla birlikte, bir CSV'ye kaydederken Excel'in görünür basamaklara yuvarlandığını unutmayın (böylece hassasiyeti atarsınız).
- Hayatı başkaları için kolaylaştırmak istiyorsanız, Hadley'in makalesinde verilen ilkelere uyun. Her bir değişken için bir değer sütununa ve katmanları tanımlayan faktör sütunlarına sahip olun.
Muhtemelen aklıma gelmeyen birkaç ek nokta daha var.