Kısa cevap
Entropi yüzünden uzun bir zaman dilimi garanti etmek imkansız (ölüm de denir!). Dijital veri bozulur ve ölür, tıpkı evrendeki diğer herhangi bir şey gibi. Ancak yavaşlatılabilir.
Şu anda 30 + yıldan fazla soğuk veri arşivini garanti etmenin kesin kanıtı ve bilimsel olarak kanıtlanmış bir yolu yoktur. Bazı projeler , Long Now müzesinin Rosetta Disks projesi gibi, hala çok maliyetli ve düşük veri yoğunluğuna sahip (50 MB civarında) olmasına rağmen , bunu yapmayı hedefliyor .
Bu arada, Panasonic gibi Blu-ray Diskler HTL tipi veya arşiv dereceli DVD + R gibi soğuk depolama için bilimsel olarak kanıtlanmış optik ortamları kullanabilir ve bunları yumuşak noktalarda hava almayan kutularda tutabilirsiniz (önlemek için yüksek sıcaklık) ve ışık dışı.
Ayrıca REDUNDANT olun: Verilerinizin birden fazla kopyasını alın (en az 4) ve her şeyin yolunda olup olmadığını düzenli olarak kontrol etmek için kareleri hesaplayın ve birkaç yılda bir yeni diskler üzerine verilerinizi yeniden yazmalısınız. Ayrıca, bir çok hata düzeltme kodu kullanın , bunlar bozuk verilerinizi onarmanıza olanak sağlar!
Uzun cevap
Neden veriler zamanla bozuluyor? Cevap tek kelimeyle yatıyor: entropi . Bu, sistemlerin zaman içinde daha az ve daha az düzenli hale gelmesini sağlayan, evrenin birincil ve kaçınılmaz gücünden biridir. Veri bozulması tam olarak şudur: bit düzeninde bir bozukluk. Başka bir deyişle, Evren verilerinizden nefret ediyor .
Entropi ile savaşmak, tıpkı ölümle savaşmak gibidir: asla başaramayacaksınız. Ancak, ölümü yavaşlatmanın yollarını bulabilirsiniz, tıpkı entropiyi yavaşlatabileceğiniz gibi. Ayrıca, bozulmaları onararak entropiyi kandırabilirsiniz (başka bir deyişle: bozulmaları durduramazsınız, ancak önceden önlemler aldıysanız, olduklarından sonra onarabilirsiniz!). Yaşam ve ölümle ilgili herhangi bir şey gibi, sihirli bir mermi, ne de herkes için bir çözüm yok ve en iyi çözümler , verilerinizin doğrudan dijital olarak kullanılmasını gerektirir . Her şeyi doğru yapsanız bile, verilerinizi güvende tutmanız garanti edilmez, yalnızca şansınızı arttırırsınız.
Şimdi, iyi haberler için: kaliteli depolama ortamlarını ve iyi arşivleme / iyileştirme stratejilerini birleştirirseniz , verilerinizi korumanın oldukça etkili yolları vardır : başarısızlık için tasarlamalısınız .
İyi iyileştirme stratejileri nelerdir? Bir şeyi açıklığa kavuşturalım: bulacağınız bilgilerin çoğu arşivleme hakkında değil, yedeklemeler hakkında olacaktır. Mesele şu ki, çoğu insan yedekleme stratejileri konusundaki bilgilerini arşivlemeye aktaracak ve bu nedenle birçok efsane yaygın olarak duyuluyor. Aslında, birkaç yıl boyunca veri depolamak (yedekleme) ve mümkün olan en uzun süre boyunca veri depolamak en azından (arşivleme) tamamen farklı hedeflerdir ve bu nedenle farklı araçlar ve stratejiler gerektirir.
Neyse ki, oldukça fazla araştırma ve bilimsel sonuç var, bu yüzden forumlardan veya dergilerden ziyade bu bilimsel makalelere başvurmanızı tavsiye ederim. Burada bazı okumalarımı özetleyeceğim.
Ayrıca, bu tür bir depolama ortamının mükemmel olduğunu iddia ederek iddialara ve bağımsız bilimsel çalışmalara karşı dikkatli olun . Ünlü BBC Domesday projesini hatırlayın: «Dijital Domesday Kitabı 1000 değil 15 yıl sürer» . Çalışmaları her zaman gerçekten bağımsız kağıtlarla kontrol edin ve hiçbiri yoksa, depolama ortamının arşivleme için iyi olmadığını varsayalım.
Aradığınızı açıklayalım (sorunuzdan):
Uzun süreli arşivleme : mantıklı, yeniden üretilemez "kişisel" verilerinizin kopyalarını saklamak istersiniz. Arşivleme temel olarak bir yedeklemeden farklıdır , burada da açıklanmaktadır : yedekler düzenli olarak güncellenen dinamik teknik veriler içindir ve bu nedenle yedeklemeler halinde yenilenmesi gerekir (örn. İşletim sistemi, çalışma klasörleri düzeni vb.), Arşivler statik veridir. büyük olasılıkla olur sadece bir kez yazma ve sadece okunan gelen zaman zaman . Arşivler kişisel veriler içindir , genellikle kişiseldir.
Soğuk hava deposu : Arşivlenmiş verilerinizin mümkün olduğunca korunmasını istemezsiniz. Bu BÜYÜK bir kısıtlamadır, çünkü ortamın sizin parçalarınız üzerinde herhangi bir değişiklik yapmadan ve bir bilgisayar veya elektrik kaynağına herhangi bir bağlantı kurmadan uzun süre stabil kalan bileşenleri ve yazma metodolojisini kullanması gerektiği anlamına gelir.
Analizimizi kolaylaştırmak için önce soğuk depolama çözümlerini ve sonra uzun vadeli arşivleme stratejilerini inceleyelim.
Soğuk hava depoları
Yukarıda iyi bir soğuk depolama ortamının ne olması gerektiğini tanımladık: verileri herhangi bir manipülasyon gerektirmeden uzun süre saklamalıdır (bu yüzden "soğuk" olarak adlandırılır: bunu sadece bir dolaba koyabilirsiniz ve fişe takmanıza gerek yoktur) verileri korumak için bir bilgisayar).
Kağıt , dünyadaki en esnek depolama ortamı gibi görünebilir, çünkü genellikle eski çağlardan kalma çok eski el yazmaları buluruz. Bununla birlikte, kağıt büyük dezavantajlardan muzdariptir: ilk önce veri yoğunluğu çok düşüktür (kük karakterlerde ve bilgisayar araçlarında bile bir kağıda ~ 100 KB'den fazla depolayamaz) ve izlemek için herhangi bir yol olmadan zaman içinde bozulur: kağıt Tıpkı sabit diskler gibi sessiz bozulmalardan muzdariptir. Ancak dijital verilerdeki sessiz bozulmaları izleyebilseniz de kağıt üzerinde yapamazsınız. Örneğin, bir resmin aynı renkleri yalnızca on yıl boyunca koruyacağını garanti edemezsiniz: renkler bozulur ve orijinal renklerin ne olduğunu bulamazsınız. Tabii ki, küratör olabilirsin Resimlerinizi resim restorasyonunda uzmansanız, ancak bu çok zaman alıcıdır, oysa dijital verilerle bu küratörlüğü ve restorasyon işlemini otomatikleştirebilirsiniz.
Sabit Diskler (HDD) olan bilinen etmek zorunda 3 ila 8 yıl ortalama ömrü: onlar sadece zamanla bozmayan, bunlar edilir nihayetinde ölmeye garantili (: ulaşılmaz yani). Aşağıdaki eğriler, tüm HDD'lerin şaşırtıcı bir oranda ölme eğilimini göstermektedir:
Hata tipi verilen HDD arıza oranının gelişimini gösteren küvet eğrisi (ayrıca tasarlanmış herhangi bir cihaza uygulanabilir):
HDD hata oranını gösteren eğri, tüm hata tipleri birleştirildi:
Kaynak: Backblaze
Göreceli olarak başarısızlıklarına göre 3 tip HDD olduğunu görebilirsiniz: Hızla ölenler (örneğin: üretim hatası, kötü kalite HDD'ler, kafa arızası, vb.), Sabit ölme oranı olanlar (iyi üretim, çeşitli ürünler için ölürler) normal "nedenler, çoğu HDD için geçerli olan budur" ve nihayetinde çoğu HDD’den biraz daha uzun yaşayan ve en sonunda "normal olanlardan" kısa bir süre sonra ölen (örneğin: çok fazla kullanılmayan şanslı HDD’ler), ideal çevre koşulları, vb ..). Böylece, HDD’nizin öleceği garanti edilir.
Neden HDD'ler bu kadar sık ölüyor? Demek istediğim, veriler manyetik bir diske yazılmıştır ve manyetik alan kaybolmadan önce onlarca yıl sürebilir. Ölmelerinin nedeni, depolama ortamı (manyetik disk) ve okuma donanımı (elektronik tahta + dönen kafa) bağlı olmalarıdır: ayrışamazlar, yalnızca manyetik diski çıkartıp başka bir kafa ile okuyamazsınız, çünkü ilk önce elektronik kart (fiziksel verileri dijitale dönüştüren) hemen hemen her HDD için farklıdır (aynı marka ve referansta bile, menşeli fabrikaya bağlıdır) ve iplik kafalı iç mekanizma o kadar karmaşıktır ki, bugünlerde imkansızdır. Bir insanın manyetik diskler üzerine dönen bir kafası mükemmel şekilde yerleştirmesi için onları öldürmeden.
Ayrıca, kullanılmadığı takdirde HDD'lerin zamanla manyetik olarak etkisiz hale geldiği bilinmektedir (SSD dahil). Bu nedenle, verileri yalnızca bir sabit diskte depolayamaz, dolabın içinde saklayamaz ve herhangi bir elektrik bağlantısı olmadan verileri koruyacağını düşünemezsiniz: HDD'nizi yılda en az bir kez veya birkaç yılda bir elektrik kaynağına takmanız gerekir . Bu nedenle, HDD'ler açıkça soğuk depolama için uygun değildir.
Manyetik bantlar : genellikle yedekleme ihtiyaçlarının giderilmesi ve arşivlemeye yönelik uzatmalar olarak tanımlanırlar. Manyetik bantlarla ilgili sorun, ÇOK duyarlı olmalarıdır: manyetik oksit parçacıkları güneş, su, hava, çizikler ile kolayca bozulabilir, zaman veya herhangi bir elektromanyetik cihazla etkisiz hale getirilebilir veya zamanla veya baskıyla düşebilir . Bu yüzden genellikle profesyoneller tarafından sadece veri merkezlerinde kullanılırlar. Ayrıca, verileri on yıldan daha fazla tutabilecekleri asla kanıtlanmamıştır. Peki, neden sık sık yedeklemeler için tavsiye edilir? Eskiden ucuz oldukları için: eski zamanlara, manyetik bantları kullanmak HDD'lerden daha ucuza geliyordu ve HDD'ler şimdiye kadar çok daha az kararlı olma eğilimindeydi. Bu nedenle, manyetik bantlar öncelikle maliyet etkinliği nedeniyle yedeklemeler için önerilmektedirEsneklik nedeniyle değil, veri arşivleme konusunda bizi en çok ilgilendiren şey budur.
CompactFlash ve Secure Digital (SD) kartların oldukça sağlam ve sağlam, felaket koşullarına dayanabildiği bilinmektedir .
Dijital kamera Shopper dergisi bulundu çoğu kameralarda hafıza kartları neredeyse yıkılmaz. Beş hafıza kartı formatı kaynatıldı, ezildi, yıkandı ve kahve ya da kolada dunk edildi.
Bununla birlikte, diğer herhangi bir manyetik bazlı ortam olarak, verileri tutmak için elektriksel bir alana dayanır ve bu nedenle kartın suyu tükenirse, veriler tamamen kaybolabilir. Bu nedenle, soğuk depolamaya mükemmel bir şekilde uymaz (elektrik alanını yenilemek için karttaki tüm verileri zaman zaman yeniden yazmanız gerekir), ancak yedeklemeler ve kısa veya orta vadeli arşivleme için iyi bir ortam olabilir.
Optik ortamlar: Optik ortamlar, CD, DVD veya Blu-ray (BD) gibi verileri okumak için lazere dayanan bir depolama ortamı sınıfıdır. Bu, kağıdın bir evrimi olarak görülebilir, ancak verileri çok küçük bir boyutta yazıyoruz, kağıda göre daha kesin ve esnek bir malzemeye ihtiyacımız vardı ve optik diskler tam da bu. Optik ortamların en büyük iki avantajı, depolama ortamının okuma donanımından ayrılmasıdır (yani, DVD okuyucunuz arızalanırsa, diskinizi okumak için her zaman başka bir tane satın alabilirsiniz) ve onu evrensel kılan lazere dayalıdır. geleceğe yönelik kanıtlar (yani, bir lazerin nasıl yapıldığını bildiğiniz sürece, CAMILEON'un Domesday BBC Projesi için yaptığı gibi, bir optik diskin bitlerini öykünerek okumak için her zaman ince ayar yapabilirsiniz ).
Herhangi bir teknoloji gibi, yeni yinelemeler yalnızca daha büyük yoğunluk (depolama odası) sunmakla kalmaz, aynı zamanda daha iyi hata düzeltmeleri sunar ve çevresel bozulmaya karşı daha dayanıklıdır (her zaman değil, genel olarak doğrudur). DVD güvenilirliği ile ilgili ilk tartışma DVD-R ve DVD + R arasındaydı ve bugünlerde DVD-R hala yaygın olsa bile, DVD + R'nin daha güvenilir ve hassas olduğu kabul edildi . Artık, özellikle soğuk hava depoları için yapılmış, herhangi bir bakım gerektirmeden en az ~ 20 yıl dayanabileceklerini iddia eden arşivleme sınıfı DVD diskleri var:
Verbatim Gold Archival DVD-R [...], saygın Alman c't dergisi tarafından yapılan uzun süreli stres testinde en güvenilir DVD-R olarak derecelendirilmiştir (16/2008, sayfa 116-123) ) [...] 18 yıl minimum dayanıklılık ve 32 ila 127 yıl ortalama dayanıklılık (25 ° C,% 50 nem) elde etmek. Başka hiçbir disk bu değerlere yakın bir yere gelmedi, en iyi ikinci DVD-R yalnızca 5 yıllık bir dayanıklılığa sahipti.
LinuxTech.net'ten .
Ayrıca, bazı şirketler çok uzun vadeli DVD arşivleme konusunda uzmanlaşmıştır ve Millenniata'dan M-Disc veya DataTresorDisc gibi 1000 yıldan uzun süredir veri tutabildiklerini ve bazı (bağımsız olmayan) çalışmalarla doğrulandığını iddia eden geniş çapta pazarlamaktadır . 2009) daha az bilimsel diğerleri arasında .
Bunların hepsi çok umut verici görünüyor! Ne yazık ki, bu iddiaları doğrulamak için yeterli sayıda bağımsız bilimsel çalışma yoktur ve mevcut olan az sayıda kişi o kadar hevesli değildir:
Nem (% 80 bağıl nem) ve sıcaklık (80 ° C) verilerin okunabilirliğini düzenli olarak kontrol ederek 2000 saatin (yaklaşık 83 gün) üzerinde birkaç DVD'de yaşlanmayı hızlandırdı:
Fransız kurumundan dijital veri arşivlemesi için tercüme edilmiştir (Archives de France), 2012'den itibaren çalışma.
İlk grafik, yavaş bir bozulma evrimi ile DVD'yi göstermektedir. İkincisi, hızlı bozulma eğrileri içeren DVD. Üçüncüsü, M-Disc ve DataTresorDisc gibi özel "çok uzun süreli" DVD'ler içindir. Gördüğümüz gibi, performansları standart arşiv olmayan DVD'lere göre daha düşük veya eşit olmak üzere iddialara tam olarak uymuyor!
Bununla birlikte, M-Disc ve DataTresorDisc gibi inorganik optik diskler bir avantaj sağlar: bunlar hafif bozulmaya karşı oldukça duyarsızdır:
240 saat boyunca ışığı (750 W / m²) kullanarak hızlandırılmış yaşlanma:
Bunlar harika sonuçlar, ancak Verbatim Gold Archival gibi bir arşiv sınıf DVD'si de aynı performansı sağlıyor ve ayrıca ışık, bir nesne için en kontrol edilebilir parametre: DVD'yi kapalı bir kutuya veya dolaba koymak oldukça kolay. ışığın herhangi bir olası etkisini ortadan kaldırarak. Işıktan çok, sıcaklık ve neme karşı çok dayanıklı bir DVD elde etmek daha yararlı olacaktır.
Aynı araştırma ekibi, uzun süreli soğuk depo için iyi bir ortama sahip herhangi bir markanın olup olmadığını görmek için Blu-ray pazarını da inceledi. İşte onların bulguları:
Nem ve sıcaklık, çeşitli Blu-ray markalarında, DVD'lerde olduğu gibi aynı parametrelerle yaşlanmayı hızlandırdı:
Çeşitli BluRay markalarında ışıkla hızlandırılmış yaşlanma, aynı parametreler:
Fransa, Archives de France, bu çalışmasından tercüme edilmiştir.
Burada ve burada tüm bulguların iki özeti (fransızca) .
Sonuç olarak, en iyi Blu-ray disk (Panasonic) nem + sıcaklık testinde en iyi arşiv kalitesinde DVD'ye benzer şekilde performans gösterdi; Ve bu Blu-ray diski arşiv notu bile değil. Dahası, Blu-ray diskleri DVD'lerden daha gelişmiş bir hata düzeltme kodu kullanır (kendileri CD'lere göre daha gelişmiş bir sürüm kullanarak) ve bu da veri kaybını önleme riskini azaltır. Bu nedenle, bazı BluRay disklerinin soğuk hava depoları için çok iyi bir seçim olabileceği görülüyor.
Gerçekten de, bazı şirketler Panasonic ve Sony gibi arşiv sınıfı, yüksek yoğunluklu depolama Blu-ray diskleri üzerinde çalışmaya başlıyor ve ortalama 50 yıl kullanım ömrüne sahip 300 GB - 1 TB depolama sunabileceklerini duyuruyorlar . Ayrıca, büyük şirketler kendilerini Blu-ray diskleri "soğuk" olarak kullanmak için bir robot sistemi geliştiren Facebook gibi bir elektrik kaynağı olmadan soğuk ortamlarda (çünkü onları elektrik beslemesi olmadan soğuk depolayabildiğiniz için çok daha az kaynak tüketiyor) tüketiyorlar. veri depolama için " sistemlerine nadiren erişilir.
Uzun Süreli Arşivleme girişimi: Uzun Sürmeli müzenin Rosetta Disc projesi gibi ilginç ilginç başlıkları vardır; bu , Yaratılış'ın dünyadaki her dilde, Mikroskobik olarak ölçeklendirilmiş sayfalarını yazma projesidir. Bu, gerçekten çok uzun süreli soğuk hava deposu için 50 MB'lık depolamaya izin veren ve karbona yazıldığından beri erişilebilen erişime sahip bir ortam sunan ilk büyük projedir. veri (Blu-ray menekşe ışını gibi tuhaf format spesifikasyonları ve teknolojik güçlükler yoktur, sadece bir büyüteç gerekir!). Ancak, bunlar hala manuel olarak yapılıyor ve bu yüzden 20 bin dolar civarında olduğu tahmin ediliyor, sanırım kişisel bir arşivleme programı için biraz fazla.
İnternet tabanlı çözümler: Yine de verilerinizi soğukta saklamak için başka bir araç net üzerindendir. Ancak, bulut yedekleme çözümleri, bulut barındırma şirketlerinin verilerinizi saklamak istediğiniz sürece yaşayamayacağından daha büyük bir endişe için uygun değildir. Diğer nedenler arasında (internet üzerinden aktarıldığından beri) yedeklemenin çok yavaş olduğu gerçeği yer almaktadır ve çoğu sağlayıcı, dosyaların çevrimiçi olmalarını sağlamak için sisteminizde de bulunmasını gerektirir. Örneğin, hem CrashPlan hem de Backblaze, en son 30 gün içinde bilgisayarınızda en az bir kez görülmeyen dosyaları kalıcı olarak siler, bu nedenle yalnızca harici sabit disklerde sakladığınız yedekleme verilerini yüklemek istiyorsanız, USB HDD ayda en az bir kez ve geri sayımı sıfırlamak için bulutunuzla eşitleyin. Ancak, Bazı bulut hizmetleri, SpiderOak gibi bir geri sayım olmadan dosyalarınızı süresiz (tabii ki ödeyeceğiniz sürece) saklamayı önerir. Bu nedenle seçtiğiniz bulut tabanlı yedekleme çözümünün koşullarına ve kullanımına çok dikkat edin.
Bulut yedekleme sağlayıcılarına alternatif olarak, kendi özel sunucunuzu çevrimiçi olarak kiralamak ve mümkünse, yanlarında donanım arızası durumunda verilerinizin otomatik olarak yansıtılması / yedeklenmesi ile birini seçin (birkaç tanesi sözleşmelerinde kaybedilen verilere karşı sizi garanti altına alabilir) , ama elbette daha pahalı). Bu harika bir çözüm, ilk önce verilerinizi hala alıyorsunuz ve ikincisi donanımın arızalarını yönetmek zorunda kalmayacağınız için bu, ev sahibinizin sorumluluğundadır. Ve eğer bir gün ev sahibiniz işsiz kalırsa, yine de verilerinizi geri alabilirsiniz (ciddi bir ev sahibi seçin, böylece gece boyunca kapanmayacaklar, ancak önceden bildirimde bulunabilirsiniz, belki bunu sözleşmeye koymayı isteyebilirsiniz), ve başka yerde yeniden evlenir.
Kendi özel çevrimiçi sunucunuzu kurmakta güçlük çekmek istemezseniz ve bunu karşılayabiliyorsanız Amazon, Glacier adlı yeni bir veri arşivleme hizmeti sunar . Amaç, verilerinizi uzun süre saklamak için tam olarak saklamaktır: bu nedenle, bir Buzulda veri depolamak çok pahalıya mal olur, ancak bu hizmete erişilemeyen verileri depolamak için yapıldığı için bu verileri geri almak daha da maliyetlidir. , sıklıkla erişmek istediğiniz verileri saklamamak için. Bu, bu hizmetin veri yazmak için fiyatları değil aynı zamanda bunları okumak için fiyatları ifade ettiği anlamına gelir. Bu hizmetin büyük bir maliyeti vardır, ancak en mantıklı verilerinizden bazıları için iyi bir anlaşma olabilir (örneğin: ÇOK mantıklı olan birkaç metin dosyanız veya resim varsa, bu tür veriler genellikle küçük boyutta olduğundan) Bir Buzulda saklamak size çok pahalıya mal olmaz).
Soğuk hava depolarının eksiklikleri : Ancak, herhangi bir soğuk hava ortamında büyük bir kusur vardır: bütünlük kontrolü yoktur, çünkü soğuk hava depoları CANNOT, verilerin bütünlüğünü otomatik olarak kontrol edemez (yalnızca hata düzeltme düzenlerini biraz "iyileştirmek" için uygulayabilirler) Yolsuzluktan sonra meydana gelen hasar, ancak önlenemez ve otomatik olarak yönetilemez!) çünkü bir bilgisayarın aksine, dosya sistemini hesaplamak / gazeteye vermek / kontrol etmek ve düzeltmek için bir işlem birimi yoktur. Bir bilgisayar ve çoklu depolama birimlerinde, bir veri arşivinde bir bozulma olursa (aynı arşivin birden fazla kopyası varsa), arşivlerinizin bütünlüğünü otomatik olarak kontrol edebilir ve gerektiğinde otomatik olarak başka bir birime yansıtabilirsiniz.
Uzun Süreli Arşivleme
Mevcut en iyi teknolojilerde bile, dijital veriler yalnızca birkaç on yıl boyunca (yaklaşık 20 yıl) soğuk depolanabilir. Bu nedenle, uzun vadede, yalnızca soğuk depolamaya güvenemezsiniz: veri arşivleme işleminiz için gelecekte verilerinizin alınabilmesini (teknolojik değişikliklerle bile) ve riskleri en aza indirmenizi sağlamak için bir metodoloji kurmanız gerekir. Verilerinizi kaybetme Başka bir deyişle, olduklarında ortaya çıkan bozulmaları gideren ve gerektiğinde yeni kopyaları yeniden oluşturarak verilerinizin dijital küratörü olmanız gerekir .
Kusursuz kurallar yoktur, ancak işte size birkaç kolaylaştırma stratejisi ve özellikle işinizi kolaylaştıracak sihirli bir araç:
- Artıklık / çoğaltma ilkesi : Artıklık, bilgi teorisine dayanan bir ilke olan entropinin etkilerini geri alabilen tek araçtır . Verileri saklamak için bu verileri kopyalamanız gerekir. Hata kodları artık yedekleme ilkesinin otomatik bir uygulamasıdır. Ancak, verilerinizin gereksiz olduğundan da emin olmanız gerekir.: aynı verilerin farklı disklerde birden fazla kopyası, farklı ortamlarda birden fazla kopya (bir ortamın kendinden kaynaklanan sorunlar nedeniyle başarısız olması durumunda, farklı ortamlardaki diğerlerinin de aynı anda başarısız olma ihtimali çok azdır), vb. , her zaman verilerinizin en az 3 kopyasına sahip olmalısınız, mühendislikte 3 modüler artıklık olarak da adlandırılır, böylece kopyalarınız bozulursa, dosyalarınızı 3 kopyadan onarmak için basit bir çoğunluk oyu kullanabilirsiniz. Gemicinin pusula tavsiyesini daima hatırlayın:
İki pusula getirmek faydasızdır, çünkü eğer biri yanlış giderse, hangisinin doğru olduğunu bilemezsiniz ya da her ikisi de yanlışsa. Her zaman bir pusula veya üçten fazla alın.
Kodları düzeltme hatası : Bu, hayatınızı kolaylaştıracak ve verilerinizi daha güvenli hale getirecek sihirli bir araçtır. Hata düzeltme kodları (ECC'ler), verilerinizi onarmak için kullanılabilecek verileri üreten matematiksel bir yapıdır. Bu daha verimlidir, çünkü ECC'ler basit çoğaltmadan çok daha az depolama alanı kullanarak verilerinizi çok daha fazla onarabilir (örneğin, dosyalarınızın birden fazla kopyasını alma) ve hatta herhangi bir dosyanın olup olmadığını kontrol etmek için de kullanılabilir. yolsuzluk ve hatta bu yolsuzlukların nerede olduğunu bulmak. Aslında bu tam olarak artıklık ilkesinin bir uygulamasıdır, ancak çoğaltmadan daha akıllıca bir şekilde. Bu teknik, günümüzde 4G, WiMax ve hatta NASA'nın uzay iletişimi gibi uzun menzilli iletişimde yaygın olarak kullanılmaktadır. Ne yazık ki, ECC'ler telekomünikasyonda her şeye rağmen, dosya tamirinde bulunmuyorlar, belki de biraz karmaşıklar. Ancak, iyi bilinen (ancak şimdi eski) PAR2, DVD Disaster (optik disklere hata düzeltme kodları eklemeyi teklif eder) ve pyFileFixity ( PAR2 sınırlamalarını ve sorunlarını aşmak için kısmen geliştirdiğim ) gibi bazı yazılımlar mevcuttur . İsteğe bağlı olarak, teknik olarak RAID5'in genelleştirmesi olan, Linux için ZFS veya Windows için ReFS gibi Reed-Solomon uygulamasını kullanan dosya sistemleri de vardır.
Dosyalarınızın bütünlüğünü düzenli olarak kontrol edin: Dosyalarınızı saklayın ve zaman zaman kontrol edin (yani yılda bir kez, ancak ortam ve ortam koşullarına bağlıdır). Dosyalarınızın bozulma yaşadığını gördüğünüzde, oluşturduğunuz ECC'leri kullanarak tamir etme ve / veya verilerinizi yeni bir depolama ortamında yeni bir taze kopya oluşturma zamanı. Verileri kontrol etmek, bozulmaları onarmak ve yeni kopyalar çıkarmak, verilerinizin güvende olmasını sağlayacak çok iyi bir işlem sürecidir. Özellikle kontrol etmek çok önemlidir, çünkü dosya kopyalarınız sessizce bozulabilir ve daha sonra değiştirilmiş kopyaları kopyalarsanız, tamamen bozuk dosyalarla sonuçlanır. Bu, CANNOT'un verilerin bütünlüğünü otomatik olarak kontrol edemediği optik diskler gibi soğuk depolama ortamlarında daha da önemlidir (zaten biraz iyileşmek için ECC'ler kullanıyorlar, ancak otomatik olarak kontrol edemezler ya da yeni kopyalar oluşturamazlar, bu sizin işiniz!). Dosya değişikliklerini izlemek için, rfigc.py betiğini kullanabilirsiniz.pyFileFixity veya gibi diğer UNIX araçları md5deep . Sabit Sürücü Sentinel veya açık kaynaklı smartmontools gibi araçları kullanarak sabit diskler gibi bazı depolama ortamlarının sağlık durumunu da kontrol edebilirsiniz .
Sel ya da ateş gibi gerçek hayattaki felaket olaylarından kaçınmak için arşivlerinizi farklı yerlerde (evinizin dışında en az bir kopya ile!) Saklayın . Örneğin, işinizdeki bir optik disk veya bulut tabanlı bir yedekleme bu gereksinimi karşılamak için iyi bir fikir olabilir (bulut sağlayıcılar herhangi bir anda kapatılsa bile, başka kopyalarınız olduğu sürece güvende olacaksınız , bulut sağlayıcılar yalnızca acil durumlarda saha dışı bir arşiv görevi görürler).
Kontrollü çevresel parametreleri olan özel kaplarda saklayın: optik ortamlar için, nemden sakınmak için ışıktan uzak ve su geçirmez bir kutuda saklayın. Sabit sürücüler ve sd kartlar için, sürücünün kurcalamak için kalan elektriği önlemek için anti-manyetik kılıflarda saklayın. Ayrıca hava geçirmez ve su geçirmez bir çantada / kutuda saklayabilir ve bir dondurucuda saklayabilirsiniz: yavaş sıcaklıklar entropiyi yavaşlatır ve bunun gibi herhangi bir depolama ortamının ömrünü oldukça uzatabilirsiniz (sadece suyun kazandığından emin olun) içeri girmeyin, aksi halde medyanız çabucak ölür).
Kaliteli bir donanım kullanın ve önceden kontrol edin (örneğin: bir SD kart alırken, tüm verileri, verilerinizi yazmadan önce her şeyin yolunda olup olmadığını kontrol etmek için HDD Tarama gibi bir yazılımla test edin). Bu, özellikle optik sürücüler için önemlidir, çünkü kalitesi, Archives de France çalışmasının gösterdiği gibi, yanık disklerinizin kalitesini önemli ölçüde değiştirebilir (kötü bir DVD yazıcı, daha az dayanacak DVD'ler üretecektir).
Dosya biçimlerinizi dikkatlice seçin: tüm dosya biçimleri bozulmalara karşı dayanıklı değildir, bazıları net bir şekilde bile zayıf. Örneğin, .jpg görüntüleri yalnızca bir veya iki baytı kurcalayarak tamamen kırılabilir ve okunamayabilir. 7zip arşivleri için aynı. Bu çok saçma, bu yüzden arşivlediğiniz dosyaların dosya formatına dikkat edin. Temel kural olarak, basit ve net metin en iyisidir, ancak sıkıştırmanız gerekirse, katı olmayan zip kullanın ve görüntüler için JPEG2 kullanın (henüz açık kaynak değil ...). Daha fazla bilgi ve burada , burada ve burada profesyonel dijital küratörlerin incelemeleri .
Verilerinizin yanında saklayın, verileri okumak için gereken her yazılımı ve özellikleri arşivleyin. Teknik özelliklerin hızla değiştiğini ve bu nedenle gelecekte dosyaya erişebilseniz bile verilerinizin okunamayabileceğini unutmayın. Bu nedenle, açık kaynak formatlarını ve yazılımı tercih etmeli ve programın kaynak kodunu verileriniz boyunca saklamalısınız, böylece programı her zaman yeni bir işletim sistemi veya bilgisayardan başlatmak için kaynak koddan uyarlayabilirsiniz.
Burada , burada ve İnternet'in çeşitli yerlerinde birçok başka yöntem ve yaklaşım mevcuttur .
Sonuç
Sahip olabileceğiniz şeyleri kullanmanızı öneririm, ancak her zaman fazlalık ilkesine saygı duyun (4 kopya alın!) Ve her zaman düzenli olarak bütünlüğü kontrol edin (bu nedenle önceden bir MD5 / SHA1 hash veritabanı oluşturmalısınız) ve yeni yolsuzluk durumunda kopyalar. Bunu yaparsanız, depolama ortamınız ne olursa olsun, teknik olarak verilerinizi istediğiniz kadar saklayabilirsiniz. Her kontrol arasındaki süre, depolama ortamlarınızın güvenilirliğine bağlıdır: eğer bir disket ise, her 2 ayda bir, Blu-ray HTL olup olmadığını kontrol edin, 2/3 yılda bir kontrol edin.
Şimdi en uygun durumda, soğuk depoda su geçirmez opak kutularda depolanmış ve taze bir yerde saklanan Blu-ray HTL diskleri veya arşiv sınıfı DVD diskleri kullanmasını öneririm . Ek olarak, SD kartlarını ve SpiderOak gibi bulut tabanlı sağlayıcıları kullanarak verilerinizin yedek kopyalarını, hatta sizin için daha erişilebilir olması durumunda sabit diskleri saklayabilirsiniz.
Hata düzeltme kodları çok kullanın , gününüzü koruyacak. Ayrıca, bu ECC dosyalarının birden fazla kopyasını çıkarabilirsiniz (ancak verilerinizin birden fazla kopyası ECC'nin birden fazla kopyasından daha önemlidir çünkü ECC dosyaları kendi kendini onarabilir!).
Bu stratejilerin tümü, geliştirmekte olduğum araçlar seti kullanılarak uygulanabilir (açık kaynak): pyFileFixity . Bu araç aslında bu tartışmayla başlatıldı, dosya sabitliğini tamamen yönetecek ücretsiz bir araç olmadığını gördükten sonra. Ayrıca, dosya sabitliği ve dijital küratörlük hakkında daha fazla bilgi için lütfen projenin benioku ve vikilerine bakın.
Son bir kayda göre, bu soruna daha fazla Ar-Ge getirileceğini umuyorum. Bu, şu andaki toplumumuz için önemli bir konudur, giderek daha fazla veri dijitalleştirilmekte, ancak bu bilgi kitlesinin birkaç yıldan daha uzun bir süre hayatta kalacağının garantisi olmadan. Bu oldukça moral bozucu ve gerçekten de bu sorunun ön plana çıkması gerektiğini düşünüyorum, bu nedenle inşaatçılar ve şirketler için gelecek nesillere dayanabilecek depolama cihazları üretmeleri için bir pazarlama noktası haline geliyor.
/ EDIT: pratik bir tedavi rutini için aşağıyı okuyun .