Bu diğer araçlara sahip değilseniz, sadece wget ve sayfada biçimlendirme sadece düz metin ve bağlantılar, örneğin kaynak kodu veya bir dosya listesi varsa, HTML'yi aşağıdaki gibi sed kullanarak şeritleyebilirsiniz:
wget -qO- http://address/of/page/you/want/to/view/ | sed -e 's/<[^>]*>//g'
Bu, sayfanın kaynağını STDOUT'a dökmek için wget kullanır ve herhangi bir <> çiftini ve aralarındaki her şeyi ayırmak için sed'i kullanır.
Daha sonra sed komutunun çıktısını>> kullanarak oluşturmak istediğiniz dosyaya yönlendirebilirsiniz:
wget -qO- http://.../ | sed -e 's/<[^>]*>//g' > downloaded_file.txt
Not: Dosyada istemediğiniz fazladan boşluk bulunduğunu görebilirsiniz (örneğin satırlar birkaç sütuna girintilidir)
Dosyayı (veya C kaynak kodunu indirirken kaynak biçimlendiriciyi) düzenlemek için metin düzenleyicinizi kullanmak en kolay yöntem olabilir.
Dosyanın her satırında aynı basit şeyi yapmanız gerekiyorsa, sed komutunda bunu yapmak için bir komut ekleyebilirsiniz (burada bir önde gelen alanı sıyırmak):
wget -qO- http://.../ | sed -e 's/<[^>]*>//g;s/^ //g' > downloaded_stripped_file.txt
.c
. Zor değil, ancak sayfa yapısına bağlıdır. Eğer bir bağlantı sağlarsanız biri tam kodu size yardımcı olacaktır. Aksi takdirdesed
yaperl
da arkadaşlarınız.