Bu yanıt ikinci soruya odaklanır, ancak süreçte ilk soruya kısmi bir cevap (KG / KK prosedürü) ortaya çıkacaktır.
Şimdiye kadar yapabileceğiniz en iyi şey, giriş denendiğinde veri kalitesini kontrol etmektir. Kullanıcı kontrolleri ve raporları emek-yoğundur ve bu nedenle, mümkün olduğu kadar geç süreçte ayrılmalıdır.
Aşağıda, kapsamlı deneyimlerden türetilen bazı ilkeler, yönergeler ve öneriler bulunmaktadır (sizinkine benzeyen ve sizinkinden çok daha büyük birçok veritabanının tasarımı ve oluşturulması). Bunlar kural değildir; başarılı ve verimli olabilmek için onları takip etmek zorunda değilsiniz; ama hepsi mükemmel nedenlerle buradalar ve onlardan sapma konusunda çok düşünmelisiniz.
Entelektüel olarak talepkar faaliyetlerden veri girişini ayırın . Veri girişi operatörlerinden eşzamanlı olarak herhangi bir şeyi kontrol etmelerini, herhangi bir şeyi saymalarını vb. İstemeyin. Çalışmalarını, verilerin bilgisayar tarafından okunabilir bir faksı oluşturmakla sınırlandırın, başka bir şey yapmayın. Özellikle, bu ilke veri giriş formlarının, verileri depolamayı planladığınız formatı değil, orijinal olarak veriyi aldığınız formatı yansıtması gerektiği anlamına gelir. Bir biçimi daha sonra başka bir biçime dönüştürmek nispeten kolaydır, ancak veri girerken dönüşümü anında denemek hataya açık bir süreçtir.
Bir veri denetim izi oluşturun : veri giriş aşamasından başlayarak, verilere her ne zaman bir şey yapılırsa, bunu belgeleyin ve prosedürü geri dönüp neyin yanlış gittiğini kontrol etmeyi kolaylaştıracak şekilde kaydedin (işler ters gidecektir). Zaman damgaları, veri giriş operatörleri tanımlayıcıları, orijinal veriler için kaynak tanımlayıcıları (raporlar ve sayfa numaraları gibi) vb. Alanları doldurmayı düşünün. Depolama alanı ucuzdur, ancak bir hatayı izleme süresi pahalıdır.
Her şeyi otomatikleştirin . Herhangi bir adımın (Murphy'nin Yasasına göre mümkün olan en kötü zamanda) yeniden yapılması gerektiğini varsayalım ve buna göre plan yapın. Elle birkaç "basit adım" uygulayarak zaman kazanmaya çalışmayın.
Özellikle, veri girişi için destek oluşturun : veri almak için net, basit ve tekdüze bir yol sağlayan her tablo için bir ön uç (hatta bir elektronik tablo güzelce yapabilir). Aynı zamanda ön uç "işinizi "Yani, olabildiğince çok basit geçerlilik denetimi yapmalıdır. (Ör., PH, 0 ile 14 arasında olmalıdır; sayımlar pozitif olmalıdır.) İdeal olarak, ilişkisel bütünlük kontrollerini uygulamak için bir DBMS kullanın (örneğin, bir ölçümle ilişkili her tür veritabanında gerçekten var).
Sürekli olarak şeyleri sayın ve sayıların tamamen aynı olduğunu kontrol edin . Örneğin, bir çalışmanın 10 türün niteliklerini ölçmesi gerekiyorsa, 10 türün gerçekten rapor edildiğinden (veri girişi tamamlanır tamamlanmaz) emin olun. Sayımları kontrol etmek basit ve bilgilendirici olmasa da, yinelenen ve atlanan verilerin algılanmasında mükemmeldir.
Veriler değerli ve önemliyse, tüm veri kümesini bağımsız olarak iki kez girmeyi düşünün . Bu, her bir öğenin etkileşimde bulunmayan iki farklı kişi tarafından ayrı zamanlarda girileceği anlamına gelir. Bu, yazım hatalarını, eksik verileri vb. Yakalamak için harika bir yoldur. Çapraz kontrol tamamen otomatik hale getirilebilir. Bu, hataları yakalamada daha hızlı, daha iyi ve% 100 manuel çift kontrolden daha verimlidir. ("Kişiler" veri girişi, OCR'li tarayıcılar gibi cihazları içerebilir.)
DBMS kullanmaVerileri depolamak ve yönetmek için . E-tablolar veri girişini desteklemek için mükemmeldir, ancak verilerinizi e-tablolardan veya metin dosyalarından ve mümkün olan en kısa sürede gerçek bir veritabanına alın. Bu, otomatik veri bütünlüğü kontrolleri için çok sayıda destek eklerken her türlü sinsi hatayı önler. Gerekirse, veri depolama ve yönetimi için istatistiksel yazılımınızı kullanın, ancak özel olarak ayrılmış bir DBMS kullanmayı düşünün: daha iyi bir iş çıkarır.
Tüm veriler girilip otomatik olarak kontrol edildikten sonra resimler çizin : sıralanmış tablolar, histogramlar, dağılım grafikleri vb. Yapın ve hepsine bakın. Bunlar, tam teşekküllü istatistik paketleriyle kolayca otomatikleştirilir.
İnsanlardan bilgisayarın yapabileceği tekrarlayan görevleri yapmalarını istemeyin . Bilgisayar bunlarda çok daha hızlı ve daha güvenilirdir. Hemen tamamlanamayan herhangi bir görevi yapmak için küçük komut dosyaları ve küçük programlar yazma (ve belgeleme) alışkanlığı edinin. Bunlar denetim takibinizin bir parçası olacak ve işin kolayca yeniden yapılmasını sağlayacaktır. Konforlu olduğunuz ve göreve uygun olan platformu kullanın. (Yıllar boyunca, neyin mevcut olduğuna bağlı olarak, bu tür platformları geniş bir yelpazede kullandım ve hepsi CK ve Fortran programlarından AWK ve SED komut dosyalarına, Excel ve Word için VBA komut dosyalarına ve özel ilişkisel veritabanı sistemleri, CBS ve R ve Stata gibi istatistiksel analiz platformları için yazılmış programlar.)
Bu yönergelerin çoğunu izlerseniz, veritabanına veri alma çalışmalarının yaklaşık% 50-80'i veritabanı tasarımı ve destekleyici komut dosyaları yazma olacaktır. Böyle bir projede% 90 elde etmek ve% 50'den az tamamlamak, ancak yine de zamanında bitirmek olağandışı değildir: her şey kurulduktan ve test edildikten sonra, veri girişi ve kontrolü inanılmaz derecede verimli olabilir.