- - Extrahujte / získajte text z PDF, Doc, Html a ďalších dokumentov

Extrahujte / získajte text z dokumentov PDF, Doc, Html a ďalších dokumentov

Chcete extrahovať nejaký text z PDFdokument? Pravdepodobne budete chcieť extrahovať text, pretože veľa softvéru neumožňuje úpravu dokumentu. Ak chcete text prevziať z PDF, DOC, HTML alebo iného dokumentu, mali by ste dať nástroj na dolovanie textu výstrel.

Je to jednoduchý softvér, ktorý nevyžaduje žiadnu inštaláciu. Jednoducho spustite program a otvorte dokument, ktorý chcete previesť do textového formátu.

nástroj na ťažbu textu

Ak chcete tento softvér upraviť, kliknite na ikonu Schránka a vložte ho do ľubovoľného textového editora, MS Word, Poznámkový blok atď. Teraz môžete text jednoducho upravovať vo svojom obľúbenom textovom editore.

Nasledujúce operačné klávesy sa môžu kvôli prehľadnosti použiť:

  • Otvorené - F3 alebo O.
  • Uložiť - F2 alebo S.
  • Schránka - F5 alebo C.
  • Východ - F10 alebo uniknúť.

A ak ste vývojár, potom je súčasťou konzolového nástroja minetext, ktorá môže byť užitočná pre vývojárov alebo správcov systému, má takú syntax, ktorá vám pomôže:

minetext <input file>
minetext <input file> <output file>
where:
<input file>  - any file with one of the following extensions:
pdf, doc, rtf, chm, htm, html
<output file> - file you want to write text mined from input file

Alternatívna metóda - pomocou Zamzar

Ak si neželáte sťahovať žiadny softvér, stačí Zamzar. Je to online služba konverzie nabitá energiou, ktorá prevádza takmer všetky formáty do ľubovoľného formátu, ktorý chcete.

Zamzar

Začať Prejdite ľubovoľný súbor, ktorý chcetepreviesť, v kroku 2 vyberte formát .doc, zadajte svoj e-mail a kliknite na príkaz previesť. Začne prevádzať súbory vo formáte pdf, html alebo akýkoľvek iný formát, ktorý ste vybrali, do formátu doc. Po dokončení konverzie vám pošle e-mail odkaz na stiahnutie, odkiaľ si môžete súbor stiahnuť. Je to také ľahké.

Užite si to!

Komentáre