- - Extrahujte / získejte text z PDF, Doc, Html a dalších dokumentů

Extrahujte / uchopte text z PDF, dokumentu, HTML a dalších dokumentů

Chcete extrahovat nějaký text z PDFdokument? Pravděpodobně budete chtít text extrahovat, protože mnoho softwaru vám neumožňuje upravovat dokument. Pokud chcete text chytit z PDF, DOC, HTML nebo jiného dokumentu, měli byste dát Nástroj pro dolování textu šanci.

Je to jednoduchý software, který nevyžaduje vůbec žádnou instalaci. Jednoduše spusťte program a otevřete dokument, který chcete převést do textového formátu.

nástroj pro těžbu textu

Chcete-li tento software upravit, klikněte na Schránka a vložit jej do libovolného textového editoru, MS Word, Poznámkový blok atd. Nyní můžete text snadno upravovat ve svém oblíbeném textovém editoru.

Následující klávesové zkratky mohou být použity k provedení operací pro větší pohodlí:

  • Otevřeno - F3 nebo Ó.
  • Uložit - F2 nebo S.
  • Schránka - F5 nebo C.
  • Exit - F10 nebo Uniknout.

A pokud jste vývojář, pak přiložený nástroj konzoly minetext, které mohou být užitečné pro vývojáře nebo správce systému, má takovou syntaxi, která vám pomůže:

minetext <input file>
minetext <input file> <output file>
where:
<input file>  - any file with one of the following extensions:
pdf, doc, rtf, chm, htm, html
<output file> - file you want to write text mined from input file

Alternativní metoda - pomocí Zamzar

Pokud si nepřejete stahovat žádný software, stačí pouze Zamzar. Jedná se o online službu převodu energie, která převádí téměř všechny formáty na jakýkoli požadovaný formát.

zamzar

Začněte Procházet libovolný soubor, který chcetepřevést, v kroku 2 vyberte formát .doc, zadejte svůj e-mail a klikněte na převést. Začne převádět pdf, html nebo jakýkoli jiný formát, který jste vybrali, do formátu doc. Po dokončení převodu vám pošle e-mail odkazem ke stažení, odkud si můžete soubor stáhnout. Je to tak snadné.

Užívat si!

Komentáře