5 GB'lik jpeg resimlerin 5 GB düz metin olarak indirilmesi ve / veya içe aktarılması ile aynı süre alıyor mu?


39

Merak ediyorum, şu andan beri babamın benim için yazdığı tüm fotoğraflarımı CD'den alıyorum. Bu tür aktarımlar yapılırken 5 GB'lık resimlerin 5 GB'lık metinle aynı süreyi harcadığını merak ediyordum. Kümülatif olarak aynı boyutta olsalar bile, farklı dosya formatlarıyla ilişkili 'ek yük' olabileceğinden ...

düzenleme: aslında bir CD-rom değil, bir DVD-R


11
5 gig olmadığı sürece 5 gig'dir.
Xavierjazz

2
Bununla tartışamazsınız ...
Thomas Padron-McCarthy

35
Hangisi daha ağır: bir ton tuğla ya da bir ton tüy?
Graham Borland

1
Bunu açıkça kötü bir soru olarak reddetmeden önce cevabımı (ve farklı faktörleri vurgulayan diğer iyi olanları görün) bakın. 5 GB 5 GB olabilir, ancak verinin aktardığı borunun etkinliği bir fark yaratır.
David Stratton

1
@ Graham: Hangisi daha ağır, bir kiloluk tüy veya bir kiloluk altın? (cevap)
BlueRaja - Danny Pflughoeft

Yanıtlar:


75

Cevap, duruma bağlı". "İndirme" ile ne demek istediğine bağlı.

Bir web sitesinden indiriyorsanız, bazı siteler otomatik olarak "anında" dosyaları sıkıştırır ve metin çok iyi sıkıştırılır, JPEG zaten sıkıştırılmış olduğundan, bu nedenle hiç sıkıştırılmaz. Bu durumda, büyük bir fark olacak.

Dosyaları bir bilgisayardan diğerine kopyalamak için sadece bir copy komutunu kullanıyorsanız, fark olmayacak. Ancak, bir çeşit özel araç kullanıyorsanız, o zaman yine, bu araç otomatik sıkıştırma kullanıp kullanmamasına bağlıdır. JPEG ve metin arasındaki tek fark, dosyaları sıkıştırmak için bir olasılıktır.

Dosyanın ne olduğu fark etmeksizin, dosya aktarımıyla ilişkili 'ek yük' konusunda fark yoktur.


29
Kopyalama durumunda, toplam boyut aynıysa, o zaman dosya sayısının dosya / klasör meta verilerinin aktarılmasında ek yükler olduğu için etkilenme olasılığı daha yüksektir.
Chris Nava,

2
@ chris-nava: Evet, bu çok doğru. Sadece aynı boydaki dosyaları düşündüm, fakat bu farklılığa işaret etmek doğru.
4'te haimg

2
@DarkTemplar: meta verileri içerir. Neredeyse her zaman. Genellikle dosyanın "dışında" depolanan meta veri miktarı oldukça sınırlıdır: dosya adı, izinler ve bazı erişim zamanları. Pek çok dosya sistemi, rasgele (hatta büyük) meta verileri dosyanın "dışında" saklamak için bir seçeneğe sahiptir, ancak bu nadiren kullanılır.
Joachim Sauer

4
Transfer mekanizması da bir gecikme kaynağı olabilir. Örneğin SMB (Windows Dosya Paylaşımı), çok sayıda küçük dosyayı aktarmak için BAD iken, NFS veya FTP aynı dosya kümesi için çok daha hızlıdır.
Chris Nava

4
Hiç kimsenin bazı önemli ek yüklere anti-virüs eklenmesi ihtimalinden bahsetmediğine şaşırdım. Birçok virüsten koruma uygulaması JPEG dosyalarını virüs taramasından geçirir ve metin belgelerini yok sayar. Bu kesinlikle faktöre bağlı olarak katkıda bulunabilir .
Scott Rippey

17

5 GB'lık resimlerle, her biri 3 MB + olan bir kaç bin makul boyutta dosyadan söz ediyor olabilirsiniz. 5GB metin dosyası indirmiş olsaydınız, her bir dosyanın çok daha küçük olmasını beklerdiniz. Bu yüzden büyük bir sıra veya iki ekstra dosyayla (yüzbinlerce veya milyonlarca dosya) karşı karşıya kalacaksınız.

Çok sayıda küçük dosyayı kopyalamak, aynı miktarda veriyi daha büyük dosyalara kopyalamaktan daha uzun sürer. Her bir dosyayı oluştururken makul bir ek yük vardır.

Muhtemelen büyük bir fark yaratmaya yetmiyor, ama yine de bir fark var.


3
Bunun büyük bir fark yaratabileceğini düşünüyorum. Yüzlerce 30K metin dosyasının kopyalanması, kopyaladığınız yere bağlı olarak, 3 MB boyutunda bir dosyayı kopyalamaktan kesinlikle daha uzun sürebilir.
Steven Noto

+1 Burada asıl konuyu ele almak için. Şimdiye kadar en iyi cevap.
artistoex

12

Ftp'deki "Bağımlılık" ince ayrıntılardadır.

ftp İkili mod sadece düz bir transfer ve 5GB için geçen süreyi alacak.

Bir ftp metin aktarımı olarak Windows'tan Linux'a gidiyorsanız (şaşırtıcı bir şekilde düz metin için), ftp aslında / r / n'den / n'ye satır sonlarını değiştirir ve bunun tersi de geçerlidir. Muhtemelen akış yerine küçük bir miktar ek yük vardır, ancak 5 GB metinle, her satıra bir karakter düşürürken kazanmadan başlayıp diske yazmak için daha az ve bir karakter eklerken lin'den kazanacak daha çok şey olacak satır başına.

Peki, Linux'ta 5GB mı? veya Windows?

Bir gece için yeterli sersemlik, yatmaya gidiyor


FTP'ye nasıl ulaştık? OP, DVD sürücüsünden yerel bir sürücüye kopyalanıyor gibi görünüyor?
andynormancx

Başlıktan. 'Gece geç saatlerde Twas ve soruyu cevapladım, altındaki paragrafı değil. İlk paragraflarda en yüksek oyu aldığı gibi. Şimdi bir medyadan diğerine kopyaladığınız için ...
Fiasco Labs

3

Dosyaların kendileriyle ilişkili bir ek yükü yoktur, ancak bazı depolama / aktarma tesisleri otomatik sıkıştırmayı destekler ve bu bir fark yaratabilir.

DVD'den sıkıştırılmamış bir sürücüye kopyalama yaparken, hiçbir fark yoktur. Sıkıştırılmış bir NTFS sürücüsüne kopyalarken, metin JPEG'lerden daha az yer kaplar.

Sıkıştırma kullanan HTTP sunucusundan indirme yaparken, metnin indirilmesi daha az zaman alacaktır. Ancak, sunucu sıkıştırma kullanmıyorsa, hiçbir fark olmaz.

Ayrıca, genel giderler hakkında konuşmak gerekirse, 5GB toplam boyuttaki milyonlarca küçük dosya, daha fazla [gerçek] alan ve genellikle tek bir 5GB dosyadan kopyalamak için daha fazla zaman alacaktır, çünkü 5GB, dosya adlarını, tarihleri ​​ve diğer meta verileri depolamak için gereken alanı içermez .


3

Bu, verim ve indirme zamanını etkileyen faktörler olarak sıkıştırma, vb. İle ilgili diğer cevaplara eklenmek içindir.

Henüz belirtilmemiş bir nokta, paket verimliliğidir. Çoğu insanın buna bile rastladığından şüpheliyim, işte kısa bir geçmiş.

Web servislerini kullanmaya başlamadan önce, bunları kullanmak ile daha "standart" bir veritabanı bağlantısı kullanmak (örneğin OleDb, System.Data.SqlClient, JDBC, vb.) Arasındaki verimlilik farkını bilmek istedik. Gurumuzu, farkı görmek için ağdaki veri akışlarını izlemek için paket koklayıcıları yerleştirdik.

Web hizmetlerini kullanmanın diğer bağlantı türlerinin ikili formatı ve verileri tanımlamak için kullanılan XML etiketlerinin ek yükü nedeniyle daha az etkili olacağını umduk.

Bulduğumuz şey, web servislerinin çoğu zaman DAHA ÇOK verimli, en azından ağımızda olduğu idi. Buradaki fark, ikili verileri aktarırken, paketlerin içindeki baytların bazılarının boş olmasıydı, ancak metin verileri gönderilirken paketlerin daha verimli kullanılmasıydı.

Bunu ilginç bulduk ve farklı dosya türlerini aktarırken denedik ve kural olarak, ağ üzerinden geçen düz metinlerin her zaman paketlerde bulunan bitlerin% 100'ünü her zaman kullandıkları bitlerin kullanılmadığını gördük. Neden bu, sana söyleyemedim, ama birkaç deney bunu yaptı.

Bu soru üzerine yapılan birkaç yorum, açık bir şekilde kusurlu bir soru olarak bunu reddetmiş gibiydi, ama aslında değil. Veri miktarı aynı kalsa da, borunun verimliliği de önemlidir.

Çünkü BT dışı bir insanın anlayacağı analojilere dayanamıyorum:

Bir bakkalın içindeki bir dondurucudaki tek bir rafta x miktar alanı vardır; ancak, yuvarlaklar kullanılarak oluşturulan boş alan nedeniyle, kaplar yuvarlak olduklarından daha kare olduğunda rafa daha fazla galon dondurma sığdırabilir konteynerler. Testlerimiz, ilk başta karşı sezgisel olmasına rağmen, herhangi bir market mağazasının bize söyleyebileceklerini anlattı.


2
Veri tabanı neydi? Farklı RDBMS, diğerlerinden daha fazla veya daha az "ağ verimli" dir. Bağlantı kurmasından mı yoksa sadece veri kümesi verilerinden mi ölçtün? Gerçekten merak ediyorum.
Fabricio Araujo

1

Geleneksel bilgelik, 5GB'ın 5GB olduğunu söylüyor. Ancak, bu ikisinin aynı olmadığı bazı senaryolar var; dosya verilerinin nasıl yapılandırıldığına bir fark getirmelidir.

Öncelikle, JPEG'ler sıkıştırılmıştır. Görüntüyü görüntülemek için önce dosya sıkıştırılmamış olmalı ve bu tür görüntülerin ezici çoğunluğu için bunu yapmak için tam dosyaya sahip olmalısınız. Yüklendiğinde yinelemeli olarak daha net bir görüntü sağlayan aşamalı JPEG'ler var, ancak DSL ve diğer yüksek hızlı bağlantıların çok yaygın olduğu bir çağda nadiren kullanılıyor. Öte yandan, metin az ya da çok akışkandır; Bir baytınız olduğu anda (veya kullanılan UTF kodlamasına bağlı olarak iki veya dört), bu karakteri gösterebilirsiniz. En eski veri aktarım mekanizmaları bile metni okuyabileceğinizden daha hızlı yükleyebilir. Bu nedenle, 5GB'lık bir JPEG 5GB metin dosyasından daha fazlasını görüntülemek için daha uzun sürebilir.

İkincisi, ayrıca JPEG'ler sıkıştırıldığı için, aktarımdan önce büyük miktarda veriyi sıkıştıran tarayıcılarla veya dosya aktarma programlarıyla / protokolleriyle iyi çalışmazlar. Bir ZIP dosyasını ZIP yaparak görebilirsiniz; ikinci ZIP işlemi daha fazla sıkıştırma yapacak şekilde yapılandırılmadıkça (yavaşlama), boyutta çok fazla bir fark görmezsiniz. Bu, bu araçlardan birini kullanırken, 5GB'ın 5GB olmadığı anlamına gelir; JPEG'ler hala yaklaşık 5GB olacak, ancak metin belki 1GB veya daha azına kadar sıkıştırılabilir. 5GB bitmap dosyalarını 5GB düz metinle karşılaştırıyorsanız karşılaştırma çok daha yakın olurdu.

Bununla birlikte, NTP, FTP veya HTTP kullanarak, kullanılan herhangi bir sıkıştırma veya "doanload booster" mekanizması olmadan 5GB'lık dosyaların bir bilgisayardan diğerine taşınması genel olarak aynı zaman alacaktır; herhangi bir fark, her transfer sırasında herhangi bir saniyede farklı ağ trafiği seviyelerinin bir sonucu olabilir.


Interleaved JPG'yi hiç duymadım. Progresif JPG'yi interleaved GIF / PNG ile mi karıştırıyorsunuz?
kabarık

"Aşamalı JPEG" değişkeni, geçişli GIF / PNG'ye çok benzeyen geçişli bir formattır. JPEG'ler için "aşamalı" terimi, "aşamalı tarama", "720p (hızlı)" ve "1080p" gibi iyi bilinen terimlerden dolayı IMO'yu karıştırmaktadır. Bu terimlerin tümü, "aşamalı" JPEG görüntüleme davranışının tam karşıtı olan tam geçişli, iki geçişli geçiş yerine bir geçişte tam olarak çizildiğini göstermektedir.
KeithS

1
Ancak JPEG bu kadar ilerici bir şekilde çalışmıyor. GIF veya PNG (veya bunun için DVD video) gibi titreşimli / serpiştirilmiş bir format değil, DCT bloklarının yinelemeli bir düzeltmesidir. Devam eden aşamalı bir JPEG'in tam piksel kapsama alanı vardır - daha düşük bit hızındadır. JPEG, GIF veya PNG gibi tarayıcılardaki şeylerle de ilgilenmez, onlarla kare piksel grupları topluluğudur.
kabarık

Domates, domates. Görüntü başlangıçta erken gelen tam görüntü verilerinin bir alt kümesi kullanılarak görüntülenir, daha sonra geri kalanı ile arıtılır. Bu benim amacımdı. Çizgileri ya da blokları olsun, tek geçişli yerine çoklu geçişli bir yükleme stilidir.
KeithS

Bu, ima ettiğiniz gibi sadece küçük bir terminoloji farkı değildir, ancak bu, hiçbir sebep olmadan tuğla duvar argümanına dönüşüyor. Sadece cevabını yapman için küçük bir düzenleme önermeye çalışıyordum, sinir bozucu bir maça girmeye çalışmıyorum.
kabarık

0

Bir optik sürücüden 5 GB aynı olmalıdır - eğer JPG veya metin. Net olarak aktarılan, donanıma bağlı olarak yerleşik bir sıkıştırmaya sahip olan modemlerin zamanlarını hatırlıyorum, böylece zaten sıkıştırılmış 5 GB'lık bir JPG daha fazla sıkıştırılmayacaktı, ancak normalde 5 GB'lik bir metin daha fazla potansiyele sahip olacaktı. sıkıştırma.

Peki bu neden harddrives için kullanılmıyor? Belki sabit sürücüde çok fazla mantık, sabit sürücüyü çok fazla ısıtan sıkıştırmaya çok açık ve istenirse verileri açıkça sıkıştırmak çok kolay olabilir mi? Belki bazı sürücüler için var?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.