ABD'den İngiltere'ye veri merkezlerine 10 TB dosya aktarın


96

Sunucumu ABD'den İngiltere'ye bir veri merkezinden diğerine geçiriyorum. Ev sahibim saniyede 11 megabayt alabileceğimi söyledi.

İşletim sistemi her iki ucunda da Windows Server 2008'dir.

Ortalama dosya boyutum 100 MB civarında ve veriler beş 2 TB sürücüye bölünmüş durumda.

Bu dosyaları aktarmak için önerilen yol nedir?

  • FTP
  • SMB
  • Rsync / Robocopy
  • Diğer?

Bunlar zaten halka açık dosyalar olduğu için güvenlik konusunda fazla sıkılmıyorum, ancak toplam aktarım süresini en aza indirmek için tam 11 MB / sn aktarım hızını zorlayabilecek bir çözüm istiyorum.


19
11 MB / s veya 11 Mb / s?
Wim

14
Verileri ikili delme kartına aktarın ve bir taşıyıcı güvercin kullanın :)
enterzero

9
Ayrıntı vermelisin. Sence kaç tane taşıyıcı güvercin alacağını düşünüyorsun? İşini göster.
Evik James

18
@Evik Avrupa veya Afrika?
wim

8
Bir kenara Wolfram Alpha, "10 MB / s'de 10 TB" hesaplamasını yapmanın en kolay yoludur. wolframalpha.com/input/?i=10+TB+at+11MB%2Fs
pufferfish

Yanıtlar:


173

Yerine sabit diskleri okyanusa gönderin.

Tam kullanımı olan 11 Mb / s hızında, 10 TB aktarmak için sadece 90 günlük utangaçlığa bakıyorsunuz.


11 Mb / sn = 1.375 MB / sn = 116.015 GB / gün .

10240 GB / 116.015 GB / gün = ~ 88.3 gün .


42
Sneakernet için +1 . Ayrıca, TCP / IP ek yükünü de unuttunuz. İdeal koşullarda ~ 100 gün gibi daha fazla.
Chris S,

43
Bilge bir adam bir keresinde "Karayoluna fırlayan bantlarla dolu bir istasyon vagonunun bant genişliğini asla küçümseme" dedi. Bu denklem çok doğrudur ve bir tekne için istasyon vagonu değiştirilerek büyük ölçüde değiştirilmez. ( bpfh.net/sysadmin/never-underestimate-bandwidth.html )
Rob Moir

5
Sürücüler yerine bantları veya blueray diskleri göndermek daha iyidir. Sürücülerle giderseniz, orijinallerin tam olarak güvende ve hazır bulundurulduğundan emin olun. 10 TB = 410 tek katmanlı blueray diskleri olduğu için sürücülere kendim giderdim (Ultrium 4 sürücülerim olmadığı sürece)!
Allen

9
Sadece 11Mbps yazdığımı fark ettim, ancak demek istediğim 11 MB / sn idi. Sanırım bu oldukça büyük bir fark yaratıyor, hesaplamalarımı kabaca 11-14 gün arasında yapıyor ... bu doğru mu?
Paul Hinett

18
Yine de, resmi disk hala çalışırken 10TB yedeklemeli bir erkeğin gönderilmesinin, kurulum tamamlandıktan sonra, yeni sunucuyu herhangi bir değişiklik için güncellemek üzere öğle yemeği yiyebilirsiniz. Makinenizi yaklaşık bir gün içinde çalışır duruma getirirsiniz.
Loïc Faure-Lacroix,

26

Rsync diyebilirim, 11 MB / s'de 10-14 güne bakarsınız ve kesintiye uğrasanız bile, rsync son durduğunda kolayca başlayacaktır.

11 Mb / sn'de sabit diskleri yukarıda önerildiği gibi gönderirim :)


1
Tahmininiz, başkalarının yayınladıklarından (ve kimin doğru olduğunu bilmiyorum) çok farklı. Bu rakamlara ulaşmak için metodolojinizi tedarik edebilir misiniz?
John Gardeniers

9
Aradaki fark, aslında 11 MB / sn daha hızlı olan 11 MB / sn olan OP yanlışlığıdır. BTW, bir kesinti durumunda 10 TB rsync'nin yeniden başlatılması muhtemelen biraz zaman alacak, değil mi? Saatler ya da daha uzun?
Frank Farmer,

@ FrankFarmer: rsync'nin yeniden başlatılması konusunda endişelenmem; 30Mbps kablosuz bir hat üzerinden ~ 20TB'nin bir kopyasını saklıyorum ve yeniden başlatma işlemi saniye aralığında. ilk kopya birkaç hafta sürdü, ancak gece güncellemesi genellikle birkaç saat sürüyor.
Javier,

@ FrankFarmer - rsync çok iyi ölçeklenmiş gibi görünüyor. Sneakernet ile canlandırılan kırsal bir ADSL1 hattının üzerinde ~ 2TB'm var, ancak hiçbir şey değişmediyse her gece rsync'e ~ 5 dakika sürüyor.
Flexo,

6
rsync yeniden başlatma süresi stat, toplam verilere değil, (çoğunlukla zamana göre benim deneyimim) dosya sayısına göre ölçeklenir . Önemli bir bekleyiş beklemiyordum (en fazla birkaç dakika). Rsync ile deneyimim 5TB'nin biraz altında olsa da.
derobert

15

Tabii ki Rsync.

En azından bir aradan sonra istediğiniz zaman devam edebilirsiniz, ve hiçbir acısız.


7
% 100 kullanımda kopyalamak için 3+ ay. Maalesef, bu kadar veri aktarmanın korkunç bir yolu.
Chris S,

@ChrisS ile aynı fikirdeyim, rsyncsadece büyük dosyaları kopyalamak için kullanmak verimli değil. Eşyalarım için tarbitti netcatya sshda ilk transfer için kullandım. Çok daha hızlı ve hemen aktarmaya başlar, rsyncilk önce tüm dosyaları tarar , bu da zaman alır. Bu kesintiye uğrarsa, rsyncdaha sonra yine kullanabilirsiniz . Aslında, tartüm izinlerin, soket dosyalarının vs. doğru olmasını sağlamak için yine de bunu yapıyorum .
Martin Scharrer

1
OP ~ 100Mb bağlantısı olduğunu düzelttikten sonra, 11Mb değil, rsync çok daha mantıklı. Bunu söyleyen ilk kişi için +1.
Chris S


10

Rsync kullanmalısın. Bu olacak sıkıştırmak veri ve de-yinelenen göndermeden önce. Ayrıca, herhangi bir büyük aktarım için çok önemli olan kısmi aktarımlara devam edebilir.

10 TB aktarmıyor olması muhtemel; günlükleri ve metinleri varsa ve 1 TB'nin altında olabilirse; belki de 1 TB'nin altında.

Sıkıştırma işini rsync'ten daha iyi yapan ve muhtemelen daha fazla eşleşme bulabilen araçlar var. Kullanabilirsiniz lrzip, vb.

Örneğin, videolarda ve diğer medyalarda, iyi sıkıştırılmayan ve değişmeyen kopyalar içermeyen belirli veri türleri vardır. Bu gibi durumlarda, FTP ve rsync aynı çabayı gösteriyor.


3
RSync veri tekilleştiriyor mu? Bence bunu sadece dosya düzeyinde yapıyor, yani veri tekilleştirme bu durumda çoğunlukla işe yaramaz.
devicenull

6

Bunun zaten kabul edildiğini biliyorum ama disklerinizi daha fazla bant genişliği alabileceğiniz bir veri merkezine / sağlayıcısına / sunucusuna götürmeyi düşündünüz mü? Muhtemelen bir miktar paraya mal olur, ancak 10240Gb'yi yedekleme disklerine kopyalamak ve göndermek de hem zamana hem de paraya mal olur (2 x para).

Ayrıca disklerinizin taşınmada kırılmadığından emin olacaksınız.


Bu cevap, kabul edilen cevaptan ne kadar farklı?
Chris S,

2
@Chris Bu cevap, disklerin aynı kıtadaki daha büyük bir boruya taşınmasını önermektedir.
Alex Jasmin,

5

11Mbps? Bu, burada sahip olduğunuz oldukça sınırlı. Sizin durumunuzda basitçe:

  • Verileri klonla
  • Sıkıştır
  • Her iki uçta da kiralık sunucular en az 10 kat daha fazla bant genişliğine sahip (aynı veri merkezlerinde veya sizin tarafınızdaki bir veri merkezinde).
  • Dosyaları aktar
  • Verileri yeni sunucuya uygulayın.

Bant genişliğini artırmak için gerçekten bir çözümünüz yoksa ... Fiziksel bir sürücünün gönderilmesi çok daha hızlı olacaktır.

Acı verici bir deneyime göre, sabit sürücüler postaları kırmaya meyilli ... USB flash sürücüler sık ​​veri aktarımı için daha iyi bir çözümdür. Sizin durumunuzda bunlardan bir kaçını gerektirecektir :) Dolayısıyla, verilerinizin 2 kopyasını birden fazla sabit sürücüye gönderin.

Elinizde bulunan veri miktarını göz önünde bulundurarak, sürücülerinizi takmak için diğer tarafta aynı donanım / yazılıma sahipseniz RAID 5 veya RAID 6 dizisinden sürücüler de gönderebilirsiniz. Ancak bu durumda sürücülerinizin sırasını işaretlemeyi unutmayın. ve seri numaraları, böylece yeniden yapılandırırken karışık olmazlar.


1
üzgünüm, 11 Mbps bir yazım hatası oldu, 11 MB / s ... yukarıdaki yorumlardan birinde bahsetmiştim.
Paul Hinett,

4

Bu durumda “harddrives kullanarak gönder” cevabını kabul etmek zorunda kalsam da, burada ilk defa büyük miktarda dosyayı kopyalamak zorunda kaldığım bir kopya çözümü:

rsyncİki veri deposunu senkronize tutmak iyi olmakla birlikte , ilk transfer için biraz gereksiz ek yük getirmektedir. En hızlı yolun tarhangi yoldan boruya geçtiğini anladım netcat. Alıcı bünyesinde ayrıca kullanabilirsiniz netcatiçinde dinlemek hangi bir açılan hale boruları gelen verileri modu tar. Bunun yararı, tarhemen göndermeye başlaması ve netcatfazladan üst düzey protokol ek yükü olmadan düz TCP akışı olarak göndermesidir . Bu olabildiğince hızlı olmalıdır. Ancak, son konumda kesintili bir aktarımı yeniden başlatmak mümkün değildir.

Doğru tarseçenekleri kullanarak transfer için verileri sıkıştırmak veya borularda bir sıkıştırma aracı eklemek de kolayca mümkündür . Not netcatşifrelenmemiş tarihini gönderir. Bunun bir seçenek olmadığı durumlarda, sshbunun yerine şifreli bir bağlantı kullanılabilir ( tar <options> | ssh <target> -c 'tar -x <options>').

Tüm veriler aktarılırsa rsync, bu sırada güncellenen tüm dosyaların senkronize edilmesini sağlamak için kullanılabilir. Ayrıca IIRC tar, aksi takdirde kaybolacak soketler oluşturmaz, ancak yine de veri merkezi verileri için kullanılmaz.


Dezavantajı ise müdahaleye hoşgörülü olmamasıdır
Joel Coel

3

Eğer düşündünüz mü IPoAC ?

Tek bir güvercin, yaklaşık bir saatte onlarca gigabayt veriyi taşıyabilir; bu da ortalama bant genişliği temelinde, kayıp sürücüler için geçerli olsa bile, mevcut ADSL standartlarına göre oldukça olumlu bir karşılaştırma yapar.


21
Güvercinler, OP tarafından tanımlanan mesafede sinyal kaybına uğrayacaklar.
Roy Tinker

@RoyTinker Temizlenmiş IPoAC'ın bir pencereleme işlemi kullanılarak uygulanması gerekir.
JamesBarnett

3

Yine, ilk öneri sürücüleri sevk etmektir.

İkinci öneri SSH üzerinden değil, rsync kullanmaktır. Birçok şey denedim ve genellikle en hızlısı. Sıkıştırmayı açmayı unutmayın. Ayrıca, en uygun aktarım hızını elde etmek için rsync tampon boyutunu arttırma veya azaltma konusuna bakın . Ayrıca MTU boyutunu büyütmenize yardımcı olabilir . Bu, yalnızca rotadaki yönlendiriciler paketlerinizi parçalara ayırmazsa yardımcı olur. Yapıp yapmadıklarını belirlemenin yolları var.

Ne yazık ki, her zaman en iyi olan ayar yoktur. Durumunuzda en iyi sonucu bulmak için deneme yapmanız gerekecektir.


2

Sunucuların Windows 2008 çalıştırdığını belirttiniz. Microsoft DFS uygun olur mu? Alt uçta bağlantıdan mümkün olduğunca fazla bant genişliği almayı deneyen ve ayrıca sıkıştırma ve çoğaltma işlemine (IIRC) sahip bazı sihirler vardır.

Dikkat edin, sabit diskler, DVD'ler veya BluRay'ler daha hızlı olurdu ... Hesaplamam tam 11 MB / sn'de 11 gün ...


1

Bunun için bir torrent kullanabilirsiniz.

Bir ucunda özel bir torrent oluşturun ve diğer ucunda istemciyi kullanın.

Yerinde şifreleme olsa da gereksinimlerinizi kontrol etmelisiniz.


1
1'e 1 torrent ilişkisi, 1'e 1 dosya aktarımından daha iyi değildir. İki bölge arasında sınırlı boru varsa, ideal olarak coğrafi olarak dağıtılmış farklı borularda birden fazla ekme alanına ihtiyacınız vardır.
Jeremy

@ Jeremy - verim açısından daha iyi ya da daha kötü değil. Bu boyut için xfer'ın önemli olabileceği güvenilirlik (kolay duraklatma / sürdürme) açısından daha iyi olabilir
Joel Coel
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.