Neden tarayıcı yerine Wget kullanayım? [kapalı]


15

Hangi durumda Wget'i tarayıcı yerine kullanmayı tercih etmeliyim ?

Richard Stallman'ın anonimlik nedenlerinden dolayı tarayıcı yerine kullandığını duydum . Ve sunucu Wget kullanarak dosyalarını aldığında ne görüyor?


3
Tek ihtiyacım olan bir dosyayı indirmekse, neden bunu yapmak için tüm tarayıcıyı açarak kaynakları boşa harcayayım ki? Stallman'ın wget"bazı güvenlik nedenleriyle" kullandığını nereden duydunuz ?
edwinksl

3
Burada en az dört soru vardır: 1. wget bir tarayıcı vs avantajları nelerdir; 2. wget bir web sunucusuna nasıl sunulur; 3. wget bir web tarayıcısı üzerinde herhangi bir gizlilik yararları var mı; 4. Stallman wget kullanıyor mu ve eğer öyleyse anonimlik için mi?
Ben Aveling

4
Buna göre Bilgi işlem sayfamı nasıl yaparım , Stallman "wget ​​gibi" bir şey kullanır: e-posta başına web sayfaları getiriliyor (ancak gerekirse getirilen sayfaları açmak için grafik tarayıcılar kullanıyor); Ayrıca grafiksel bir tarayıcı kullanarak Tor üzerinden Web'e göz atar, bu nedenle e-posta ile almak tek yol değildir.
ya da

3
Lütfen duruşma
Anwar

3
«Ve Wget kullanarak dosyalarını aldığınızda hangi sunucu düşünüyor / görüyor?» Diye düşünüyor “ah, bu Stallman olmalı! İçeriği onunla
uğraşmak

Yanıtlar:


25

Genellikle "tarayıcı yerine" kullanmazsınız. Tarayıcılar HTML oluşturur, bağlantıları tıklanabilir hale getirir (URL'yi manuel olarak başka bir wget komutuna kopyalamak zorunda kalmanın aksine), vb. Gizlilik konusunda endişeleriniz varsa, bir tarayıcıyı temizlemenin milyonlarca yolu vardır (ya da insan kullanıcı arayüzünün tüm benzetmesini yok etmeden barebone almak istiyorsanız Lynx gibi daha az özellikli bir tarayıcı kullanabilirsiniz).

Wget öncelikle dosyaları indirmek için hızlı, ucuz, komut dosyası / komut satırı yolu istediğinizde kullanılır. Örneğin, sık sık yeni verilerle güncellenen bir web sayfasını indirmek için wget'i bir komut dosyasına koyabilirsiniz, bu da tarayıcının gerçekten kullanamayacağı bir şeydir. Çoğu tarayıcının yapamayacağı, en azından uzantı olmadan bir web sitesini taramak ve otomatik olarak kaydetmek için wget'in çeşitli seçeneklerini kullanabilirsiniz.

Kısacası, tarayıcılar internete bakan insanlar için bir uygulamadır, wget HTTP üzerinden veri taşıyan makineler ve ileri düzey kullanıcılar için bir araçtır. Yaptıklarına çok benzer (web sitelerinden dosya çekin) ancak kullanımlarında tamamen farklı.

Wget ile bir şeyler aldığınızda hangi sunucuların "gördüğüne" bakıldığında: tüm HTTP istemcileri (tarayıcılar, wget, kıvırmak, diğer benzer uygulamalar) "Kullanıcı Aracısı" olarak adlandırılan şeyi iletir, bu tarayıcıyı (veya bu günlerde, hangi tarayıcı özelliklerine sahip olduğunu açıklar). Bu, kullanıcının tarayıcısına bağlı olarak farklı içerik göstermek için kullanılabilir (ör. Google, Chrome'u zaten Chrome kullanan kişilere tanıtmamaya çalışır). Bazı aptallar, wget'in kullanıcı aracısı dizesini engelleyerek güçlü kullanıcı maskaralıklarını engellemeye çalışır, ancak bunun için bir Chrome kullanıcı aracısı dizesini taklit edebilirsiniz. Daha sıklıkla istatistikler için kullanılır, böylece farklı tarayıcıların ne kadar popüler olduğunu bilirsiniz, böylece hangilerinin en iyisi ile test edileceğini bilirsiniz.

Wget'in tarama işlevlerini kullanırsanız, sunucu birçok hızlı isteği çoğunlukla alfabetik sırada görür. Bu onların kazıma yeri ölü bir hediye. Bir kullanıcının göz atmasından tamamen farklı görünüyor. Bir insan kullanıcının tarayıcıda istekte bulunmasıyla, her sayfa isteğini o sayfadaki tüm resimler izler ve sonra biraz gecikme olur ve daha sonra başka bir rastgele sayfa (veya muhtemelen açık bir amacı olan bir sayfa dizisi) için bir istek vardır. .


16

Diğerlerinin de belirttiği gibi, wgeteklentiler, çerezler ve önbellek ile paketlenmemesi, potansiyel olarak daha kararlı ve güvenli olmasını sağlar. Ancak tarayıcılar ve wgetaslında çok farklı normal kullanımları var.

wgetiçeriği sunmak değil, almak için kullanılan bir komut satırı yardımcı programıdır. Herhangi bir dosya türü (HTML, resimler, ikili dosyalar, vb.) Dahil olmak üzere FTP, HTTP ve HTTPS aracılığıyla her şeyi almak ve indirmek için kullanılabilir.

Sunucu için, bir tarayıcı belirtmek için argümanını user agentkullanmadığınız sürece göreceği tek fark farklıdır --user-agent. Bunu yaparsanız, sunucu herhangi bir fark görmez.


5

1) İnsandan ziyade bir betik tarafından başlatılan indirmeler

2) ayrı sayfalar yerine tüm siteleri (veya site parçalarını) indirmek. (Wget bağlantıları otomatik olarak takip edebilir.)

Wget, sunucunun gördüklerini ve düşünebileceklerini kontrol etmek için, sayfa indirme istekleri arasındaki keyfi gecikmeler dahil bazı komut satırı seçeneklerine sahiptir. Ancak, site sunucusunda bazı anti-bot ilkeleri varsa, kabul edilebilir bir sonuç almadan önce genellikle çok fazla zaman ve trafik harcarsınız.


3) Kolayca erişilebilir bir tarayıcı olmadığında (örn. Ssh üzerinden) bir insan tarafından başlatılan indirme
Dezza

4

Tarayıcı kullanırken istenmeyen eklentiler ve hatta kötü amaçlı yazılımlar da dahil olmak üzere herhangi bir şey aktifken, wget bir şey indiren ve kesinlikle başka bir şey yapmayan basit bir komuttur.

Tarayıcı zorunlu olarak daha az güvenli değil, aynı zamanda potansiyel olarak da güvenli.

Sunucular her zamanki gibi bir indirme isteğini "görür".


4

Tarayıcı etkinliklerinizi geçmiş ve önbellek dosyalarına kaydedebilir.

wget bellek saklama özelliğine sahip değildir.

Bu, bir tarayıcının daha uygun olduğunu söyledi ve NSA'nın 4.7.2-040702-genericgeçen hafta indirdiğimi anlaması umurumda değil . Tarayıcımı on-line bankacılık ve paypal için kullanıyorum, ki bu da wget ile indirebileceğim dosyaların çoğundan daha önemli.


2

Uzak Ubuntu kurulumlarını kullanan bir geliştirici olarak, OS GUI'yi kurmanın genellikle çok az bir anlamı vardır. Bu 'komut satırı' ortamında, wget web'den dosya indirmek için önemli bir araçtır.

Hangi tarayıcıların terminalden çalıştırılabileceğinden bile emin değilim.


2
w3m harika bir terminal tarayıcıdır :) en.wikipedia.org/wiki/W3m
kalenpw

lynx başka bir lynx.browser.org
rviertel
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.