Önceki bir soruda, CSV dosyalarını düzenleme araçlarını sordum .
Gavin , Duncan Murdoch'un R Help ile ilgili bir yorumuyla bağlantı kurdu .
Bazı uygulamalar için özel bir veritabanı yönetim sistemi gereklidir. Bununla birlikte, küçük ölçekli veri analizi projeleri için daha hafif bir şey daha uygun görünmektedir.
Bir dosya biçimini değerlendirmek için aşağıdaki ölçütleri göz önünde bulundurun:
- güvenilir : girilen veriler girilen bilgilere sadık kalmalıdır; veriler farklı yazılımlarda sürekli olarak açılmalıdır;
- basit : dosya biçiminin anlaşılması kolay ve basit bir metin editörü ile ideal olarak okunabilmesi güzel olurdu; formatı okumak ve yazmak için basit bir program yazmak kolay olmalıdır.
- open : biçim açık olmalıdır
- birlikte çalışabilir : dosya biçimi birçok sistem tarafından desteklenmelidir
Sekme ve virgülle ayrılmış değer biçimlerinin güvenilirlik ölçütünde başarısız olduğunu görüyorum. Her ne kadar dosya formatı yerine ithalat ve ihracat programları suçlayabilirim. Kendimi read.table
garip bir karakterin veri çerçevesinin yüklenmesini kırmasını önlemek için genellikle seçenekler üzerinde küçük ayarlamalar yapmak zorunda kalıyorum
.
Sorular
- Hangi dosya formatı bu ihtiyaçları en iyi şekilde karşılıyor?
- Veri Değişim Biçimi daha iyi bir alternatif mi? ya da kendi sorunları var mı?
- Tercih edilebilir başka bir biçim var mı?
- TSV ve CSV'yi haksız değerlendiriyor muyum? Dosya biçimini daha güvenilir hale getiren bu tür dosyalarla çalışmak için basit bir ipucu seti var mı?
write.DIF()
korktuğum tek yönlü bir sokak.