Kritik İş Verilerinin uzun süreli depolanması


16

Bu gerçekten zor bir şey ve bir dereceye kadar teknik bir sorun değil ve buraya ait olmayabilir, ama

Sunucu Hatası, bilgisayarları profesyonel kapasitede yöneten veya koruyan sistem yöneticileri içindir.

Ve ben .. ve bu benim görevlerimden biri .. Her neyse.

5000 + çift taraflı A4 sayfanız olduğunu düşünün. Şirket verileri, tüm iş için kritik.
Bir şekilde yedeklemelisin. Şimdiye kadar önerilen çözümler:

  1. PDF -> Çevrimiçi depolama alanı
  2. PDF -> DVD / BluRay / Bant
  3. PDF -> Taşınabilir HDD / SSD / Flash sürücü.
  4. Satın alın / Kiralayın / Kiralayın / 'Büyük bir fotokopi makinesi çalın' ve kopyalayın.
  5. ???

Yukarıdakilerle ilgili acil sorunlar:

  1. Depolama ortağı yanarsa ne olur?
  2. DVD'ler zamanla çürür. Bantlar benzer şekilde.
  3. Bunlar da zamanla kırılıyor.
  4. Pahalı. Yavaş. Ağır. Ağaç Dostu değil.

Sorular):

Uzun ve orta vadeli verilerin korunması ve arşivlenmesi için altın standart nedir? İşyerinde benzer bir sorunu çözdünüz mü?

İlk yüklemeden sonra, koleksiyona ayda yaklaşık 100 sayfa eklemek için bazı gereksinimler vardır. Yeniden almak mümkün olmalı, ancak muhtemelen nadirdir.
İdeal olarak, çözümün şirketten ayrıldıktan uzun süre sonra çalışacağını ve sürdürülebilir olmasını sağlamak için büyük bir miktar gerektirmeyeceğini garanti etmek istiyorum, bu yüzden birçok DVD'yi saklamak sadece ideal değil, aynı zamanda iyi bir uzun vadeli çözüm.

Sadece kağıt kopyalar yapmak kesinlikle en kolay olsa da, en çevre dostu değil, uzun bir süre değil. Ayrıca çok yönetilebilir değil, arama, indeksleme vb. Zor. Ağır ve fiziksel olarak depolanması zor ile birleştirilmiştir.

Her şeyin elektronik olarak depolanması prensibini oldukça seviyorum, ancak bunu yapmanın gerçek mekanizmasının şeffaf ve kolay olması gerekiyor. Gerçekten bundan sonsuza kadar ve bir gün sorumlu olmak istemiyorum, ofis kullanıcılarını açtıklarında destekliyor ve belgeleri kaybediyorlar. Ayrıca, tek bir depolama satıcısına güvenmek istemiyorum, ya Dropbox (bir çevrimiçi yedekleme çözümü ATM'miz var, ancak Dropbox değil.) hizmetlerini kullanan dereye kadar, sans kürek olurdu?

Burada biraz bütçe esnekliği var, ancak şu anki çevrimiçi yedeklememizden (2500USD / yıl gibi) daha pahalı olan herhangi bir şeyin, bir yatağın altındaki bir ayakkabı kutusuna koymaya kıyasla daha az görüleceğinden şüpheleniyorum. Şüphesiz ki hiçbir şey yapmazsam ve yarın istifa edersem ne olur.

Herhangi bir fikir?

-Düzenle-

Bunu yapmanın nedeni iki yönlüdür.

1) ofisin yanması durumunda kritik iş evraklarının hassas ve güvenli bir şekilde yedeklenmesini sağlar.

2) veri arşivleme yasaları tatmin WRT işletmeler için İngiltere vergi kanunu vb.

Düzenleme 2:

Belgeleri endekslemek için bazı mekanizmalara sahip olmak da çok kanlı olur.


Ben ghostscript ve gocr ile PDF-> Txt yapmak için hızlı bir komut dosyası çaldı. Idly veriler için bazı ilginç dizin yapmak için bir SQLlite db her şeyi squirting düşünüyor.
Tom O'Connor

Artıklık (dijital medyanın) ve yıllar boyunca fazlalığın korunması en iyi arkadaşınız olabilir.
Vortico

Yanıtlar:


5

Verileri PDF gibi bir formatta tutmak muhtemelen güvenlidir, çünkü okumak için Ücretsiz araçlar vardır. Bahsettiğiniz veri hacmi oldukça küçüktür (yılda 1.200 sayfa), bu nedenle 300 dpi tarama çözünürlüğünde bile yılda sadece onlarca gigabayttan bahsediyorsunuz.

Ancak fiziksel depolama cihazı sorunu asla ortadan kalkmayacak. Elektronik verileri (teyp, optik vb.) Saklamak için kullandığınız ortam ne olursa olsun, sonunda daha yeni bir ortama güncellenmelidir. Yeni biçimler eski biçimlerin yerini aldığından, "verileri yolda tekmelemek" için yeni biçimlere yönelik planlama ve bütçe.

Muhtemelen çok az veriye sahip olduğunuz için optik medyaya ilk seçenek olarak bakardım. Ayrıca her şeyin 3x kopyasını yakmayı ve her 2-3 yılda bir medyayı yenilemeyi planlıyorum.

Optik ortam çok küçükse LTO bant ile gidip ortamı her 4-5 yılda bir yenileyeceğim. Yine de, bu kadar az miktarda veri için oldukça pahalı olacak.


DVD? Veya Blu-ray? BR henüz veriler için mantıklı bir format mı?
Tom O'Connor

1
@ Tom O'Connor: Benim için aynı görünüyorlar. Bu kararı vermenin maliyetine bakardım. Şu anda orada "arşiv dereceli" Blu-Ray boşlukları var, bu yüzden teknik açıdan uygun bir format gibi görünüyor. (Blu-Ray medyanın 200 yıllık "nominal" bir ömrü olduğunu söyleyen üreticiler bana arşiv DVD ortamının 100 yıllık "nominal" bir ömrü olduğunu söyleyenlerden daha fazla güven vermiyor ...)
Evan Anderson

Yaklaşık 1998'den beri bazı Kodak GOLD CD-R'lerim var ve hala okunabilirler. Ayrıca boya tabakasının ayrıldığı bazı ücretsiz olanlar da var ve vidalılar.
Tom O'Connor

Arşivde arşivsel olmayan medyaya göre bir fark olmadığını önermiyorum. Basitçe söylüyorum, Blu-Ray arşiv kalitesinde medyaya karşı DVD arşiv kalitesinde medya benim için çok farklı görünmüyor. Arşiv notu ile "100,00 $ 20,00 $" medya karşılaştırması tamamen farklı bir hikaye.
Evan Anderson

Bahsedilmeyen bir öğe, Katı Hal depolama (USB parmak sürücüleri) idi: Optikten büyük, LTO'dan küçük. USB'nin en az bir on yıl daha olması muhtemeldir ve 16GB veya 32GB başparmak sürücüsü (veya iki veya üç) arşivleme maliyeti açısından oldukça ucuzdur. Birçok kez Yaz-Oku-Okulacağı için, SSD hücrelerinin yıpranması hakkında endişelenmenize gerek yok, bu nedenle teorik olarak 5 veya daha fazla yıl boyunca yanmaz bir kasaya yapıştırabilirsiniz.
voretaq7

6

DVD'leri dahili olarak kullanan ve verileri sık sık yeni ortamlara geçiren belirli sistemler vardır. Dijital korumayı arayın.

Depolama gereksinimleri oldukça hızlı bir şekilde arttığından, her birkaç yılda bir daha yeni, daha büyük bir medya türüne geçmeniz önerilir.

Verileri kağıt formda aldığınızı varsayarsak, şunları yapmanız gerekir:

  1. Verileri posta girişinde listeleyin. Bu, her sayfaya benzersiz bir barkod vermek anlamına gelebilir.
  2. Tara. Dosya adı olarak barkod tanımlayıcıyı kullanın. Makaleyi arşivleyin.
  3. Verileri arşivleyin. Verileri bir revizyon güvenli arşivleme sistemine koyun. Bir dosya sunucusu yeterince iyi olmayacaktır çünkü dosyalara yazılabilir durumdaysa bir şeyler olabilir.
  4. Diğer sistemler için okunabilir olmasını sağlayın.

Müşteri durumunda, çevrimiçi sisteme (SAP) aktarılması gereken büyük bir kuruluşun tüm faturalarıdır. Arşiv depolaması şimdiye kadar birkaç tekrardan geçti. Şu anda mavi ışına geçiyorlar.

Öte yandan, günümüzde her şey disklere gidiyor, bu yüzden bu satırlar boyunca bir şey gitmek için yol olabilir: http://www.eurostor.com/german/iTernity.D.php


Çoğu DVD-R'nin (ve ark.) Bozulmadan önce sadece birkaç yıl sürdüğünü unutmayın. Talimatlara göre tutulursa pahalı "arşiv" şeyler daha uzun sürer.
Chris S

Çoğu disk, sunucu, dosya sistemi veya belge biçimi de öyle. Arşivleme, verilerin taşınması anlamına gelir. 20 yıl içinde bir pdf okumayı deneyin. Standardın 10 yıl önce ne olduğunu hatırlıyor musunuz? Gerçekten kağıda yaklaşan hiçbir şeyimiz yok. Kopyalama ve yapıştırma hariç ...
Posipiet

Saf metin belgeleri hala oldukça okunabilir.
Bart Silverstrim

PDF'leri okumak için ücretsiz araçlar vardır. "Sade vanilya" oldukları sürece çok endişelenmezdim. TIFF de iyi bir seçenektir.
Evan Anderson

3

Çözümümüz: PDF'ye Tara -> Kasete Yedekle

Bir belge tarayıcımız var, ~ 30 sayfa / dk yapıyor ve OCRed PDF dosyaları üretiyor. Raf ömrü 50 ila 100 yıl arasında olan teybe kadar (özellikle LTO4) destekliyoruz (bir kaset sürücüsü bulmak zaman çerçevesinde zor olabilir, ancak yine de 8 "disketleri kurtaracak veri kurtarma yerleri vardır).


2
Ben google 8 "disket .... zorunda kaldı
Holocryptic

Yedekleme bantlarımı Mac OS 7.5'ten saklıyorum. Ancak disk bozuldu, yedekleme programları medyası kayboluyor. Mac'i yeniden yüklemeyi başardım, ancak yedekleme programına sahip olmadığım için bandı okuyamıyorum. Ve açıkçası, adını bile hatırlamıyorum. Evet, kaset 100 yıl sürebilir. Ama okuyucu bilmiyor.
Posipiet

@Holocryptic: Sadece birkaç ay önce, Verbatim hard sektörlü 8 "disketleri açılmamış bir kutu
çıkardım

1
@Holocryptic: NSFW! NSFW !!
Bart Silverstrim

@Posipiet, sanırım sürücülerin sonsuza dek sürmediği gerçeğini ele aldım, ancak neredeyse yaygın olarak kullanılan herhangi bir ortamdan veri kurtarma konusunda uzmanlaşmış şirketler var.
Chris S

3

Amazon'un yeni Glacier hizmetinin bu alanda ilginç bir teklif olduğunu düşünüyorum .

Amazon Glacier, nadiren erişilen ve birkaç saatlik erişim sürelerinin uygun olduğu veriler için optimize edilmiştir. Amazon Glacier ile müşteriler, şirket içi çözümlere kıyasla önemli bir tasarruf olarak, ayda bir gigabayt başına 0,01 $ gibi düşük bir miktarda büyük veya küçük miktarda veriyi güvenilir bir şekilde depolayabilir.


2
Erişim maliyetleri inanılmaz derecede büyüktür.
Tom O'Connor

2

Birinci adım, Yedekleme: Belgeleri OCR yapın ve ardından tüm kelimeleri Katolik Kilisesi, Opus Dei ve Tapınakçılar hakkında bir dizi roman halinde yeniden düzenleyin. Yaklaşık 10 roman ve her yıl yaklaşık bir tane daha için yeterli giriş verisine sahip olmalısınız. Kaynak belgelerdeki orijinal kaynak kelimelerini (kaynak sırayla) tutan bir arama tablosu bulundurun ve romanlardaki son konum; yinelenen kelimeleri tablodaki bir girişte saklayın. Bir yayıncılık anlaşması yapın ve milyonlarca roman yayınlayın. OCR ve kelime yeniden düzenleme işlemlerini finanse etmek için kitap satışlarından elde edilen geliri kullanın. Orijinal belgeleri parçalayın ve hamster yatakları olarak satın. Girdi belgelerinizde kelime dağarcığınızın eksik olduğunu fark ederseniz, haç, anti-madde veya uçak biletleri için egzotik yerlere satın alma siparişi vermek bazen gerekli olabilir.

İkinci adım, Kurtarma / erişim: Verilerin kopyalarını depolamaya gerek yoktur - tek ihtiyacınız olan arama tablonuz ve ikinci el kitapçığınızdır.

Arama tablosu tek hata noktanız olduğundan, bunu yedeklemeniz gerekecektir. Kullanılan huffman kodlama şeması sayesinde, bu, giriş belgelerinizle karşılaştırıldığında oldukça küçük olacaktır, bu yüzden muhtemelen DVD'ye kopyalanabilir. Site dışı yedekleme için, günlük ateşinin önünde oturun ve kendinizi videolarken arama tablosunu okuyun. Video performans parçanızı sürekli sergilenen Tate Modern Gallery'ye sanat ve teknolojinin kaynaşmasına yerleştirin.


1

Satın almak için biraz erken ama HDS , kuvars bazlı kalıcı bir veri depolama mekanizması bulmuş gibi görünüyor - bir OKUYUN .


1
Kalıcılık iddiasını o kadar çok duydum ki, asla inanmayacağım ve hiçbirimiz kanıtlanmış görecek kadar uzun yaşayacağız. Kalıcılık tahminleri kesinlikle değersizdir ve her zaman yanlış kanıtlanır.
John Gardeniers

-2

Humyo.com'u öne sürmek zorundayım (orta adı güvenlik olan Trend Micro tarafından satın alındı)

Tüm kullanıcı verilerini şifrelerler ve sunucuları İngiltere Bankası'na bir kasada yerleştirilir.

Oldukça güvenli :)


1
Bahse girerim aslında Bank of England'da değiller. Orada yer yok, bankacılarla dolu.
Tom O'Connor

5
İkinci adı bloatware olan Trend Micro
Tom O'Connor

Trend Micro'da sizinle aynı fikirdeyim ama sadece sahipler, Humyo'nun yazılımı ile çalışıyorsunuz
benhowdle89
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.