HTML'yi panodan işaretleme metni olarak kaydet


9

Bir web sayfasının bir bölümünü vurgulamak ve panoya kopyalamak ve sonra markdown olarak yerel diskime kaydetmek istiyorum. Bunu yapmak için etkili bir yola ihtiyacım var.

Mevcut hantal yöntem:

  1. bölümü vurgulayın ve panoya kopyalayın
  2. Açık Libre Ofis Yazarı
  3. Writer'a yapıştır
  4. Yazar dokümanını HTML olarak kaydet
  5. açık terminal
  6. cd HTML'yi kaydettiğim dizine
  7. pandoc -s -r html /home/me/a/b/mydoc.html -o /home/me/a/b/mydoc.md

Açıkçası, daha iyi bir yönteme ihtiyacım var! Herhangi bir öneri?


İnanıyorum X pano aldığım HTML kaynak veya zengin metin Talep Stackverflow size aradığınızı elde rehberlik sağlayabilir.
tink

Bu şekilde kopyalamak isteyebileceğiniz bir sayfaya başvurabilir misiniz?
slm

Göz attığım herhangi bir web sayfası olabilir. Örnek: money.cnn.com/2013/06/05/technology/mobile/…
MountainX

Web sayfasını kaynak sayfa üzerinden seçiyorsunuz, değil mi? Ya da yine de parçaları.
slm

Aşağıdaki yorumlarda belirtildiği gibi StephaneChazelas, normalde sadece Firefox'tan (veya başka bir tarayıcıdan) metin seçiyorum. Kaynak görünüme GİTMİYORUM.
MountainX

Yanıtlar:


11

Son sürümüyle xclip( -tseçenek 2010 yılında eklendi, ancak henüz AFAICT yayınlanmadı, bu yüzden alt sürümden almanız veya Debian'da paketlenmiş olanı kullanmanız gerekir).

xclip -o -selection clipboard -t text/html | pandoc -r html -w markdown

Ve bunu tekrar panoya dönüştürmek istiyorsanız:

xclip -o -selection clipboard -t text/html |
  pandoc -r html -w markdown |
  xclip -i -selection clipboard

Hangi ile bir döngüde yapabilirsiniz:

while :; do
  xclip -o -selection clipboard -t text/html |
    pandoc -r html -w markdown |
    xclip -i -selection clipboard -quiet
done

İkincisi xclip, ile -quietbaşka bir şey CLIPBOARD seçimini talep edene kadar, başka bir yerde başka bir şey seçinceye kadar bloke olur.

Bu şekilde, tarayıcınız ve işaretlemeyi yapıştırdığınız her şey arasında ileri geri kopyalayabilirsiniz.

@tink , StackOverflow'da benzer bir soruya, python'da nasıl uygulanacağını bulabileceğiniz faydalı bir bağlantıya sahiptir .


Varsayım, bir web sayfasının sadece kaynağına göz atmakla kalmayıp, gerçek kaynağını seçtiğinizdir, değil mi?
slm

@slm, hayır. Firefox veya krom gibi tarayıcılarda, (işlenmiş) bir web sayfasında bir metin seçip / veya kopyaladığınızda, tarayıcı seçimi hem bir dize (kullanılacak metin uygulamalarının için) hem de html (onun gibi anlayan uygulamalar için) olarak ayarlar. lbreoffice). Bunlara hedef denir. xclip -selection clipboard -t TARGETSoradan bazı metinleri kopyaladıktan sonra Firefox'un belirlediği hedefleri / biçimleri listeler.
Stéphane Chazelas

Bu yeni bir özellik xclipmi? -T: Böyle bir dosya veya dizin yok. Ver: 0.12 kullanıyorum.
slm

1
@StephaneChazelas Müthiş bir çözüm! Buradan xclip aldım: pkgs.org/debian-sid/debian-main-amd64/… ve hiçbir sorun olmadan Kubuntu 12.04'e kuruldu. Bu tam olarak umduğum çözüm türüdür. Harika!
MountainX

1
@slm: xclip'in (yukarıdaki bağlantıdan yüklenen) çalışan sürümüm de 0.12 sürümünü gösteriyor, ancak deb xclip_0.12 + svn84-2_amd64.deb olarak adlandırılıyor. Bu, -t seçeneğini içerir ve bu seçenek kılavuz sayfasında açıklanır. Ancak man sayfasında metin / html seçeneği gösterilmiyor ve muhtemelen bunların hiçbirini kendi başıma çözemezdim.
MountainX
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.