- -PDF、ドキュメント、HTML、その他のドキュメントからテキストを抽出/取得

PDF、Doc、Html、およびその他のドキュメントからテキストを抽出/取得する

PDFからテキストを抽出しますか資料?多くのソフトウェアではドキュメントを編集できないため、おそらくテキストを抽出する必要があります。 PDF、DOC、HTML、またはその他のドキュメントからテキストを取得する場合は、テキストマイニングツールを試してみてください。

まったくインストールを必要としないシンプルなソフトウェアです。単純にプログラムを実行し、テキスト形式に変換するドキュメントを開きます。

テキストマイニングツール

このソフトウェアを編集するには、 クリップボード ボタンをクリックして、任意のテキストエディター、MS Word、メモ帳などに貼り付けます。これで、お気に入りのテキストエディターで簡単にテキストの編集を開始できます。

以下のホットキーを使用して、便宜上操作を実行できます。

  • 開いた - F3 または O.
  • セーブ - F2 または S.
  • クリップボード– F5 または C.
  • 出口 - F10 または 逃れる.

そしてあなたが開発者なら、含まれているコンソールツール 地雷は、開発者やシステム管理者に役立つ可能性がありますが、次のような構文があります。

minetext <input file>
minetext <input file> <output file>
where:
<input file>  - any file with one of the following extensions:
pdf, doc, rtf, chm, htm, html
<output file> - file you want to write text mined from input file

代替方法– Zamzarの使用

ソフトウェアをダウンロードしたくない場合は、必要なのはZamzarだけです。それは、パワーパックされたオンライン変換サービスであり、ほとんどすべてのフォーマットを必要なフォーマットに変換します。

ザムザール

開始するには、必要なファイルを参照します変換、ステップ2で.doc形式を選択し、電子メールを入力して[変換]をクリックします。 PDF、HTML、または選択したその他の形式のドキュメント形式への変換が開始されます。変換が完了すると、ファイルをダウンロードできるダウンロードリンクがメールで送信されます。とても簡単です。

楽しい!

コメント