- -グラウンドトゥルーステキストを使用してカラー画像からテキストを抽出する

グラウンドトゥルーステキストを使用してカラー画像からテキストを抽出する

いつか、私たちは皆、画像からテキストを抽出する必要性を感じる状況。画像からのテキストの抽出は、通常、テキストをすばやく必要なときに実行します。通常、ソースから単語を読み取ってキーボードで入力して単語を手動で入力しますが、画像からコピーする大きな段落がある場合は非常に面倒で時間のかかる作業になります。画像からテキストを取得するより効率的な方法は、すべてを手で入力する代わりに、OCRソフトウェアを使用することです。 グラウンドトゥルーステキストgttext)抽出できるオープンソースアプリケーションですほとんどすべての画像のテキスト。このプログラムでは、要件に応じて、画像全体またはその一部のみを自由に選択できます。画像が小さすぎるか大きすぎる場合は、画像をズームインまたはズームアウトすることもできます。

開始するには、元の画像を選択しますテキストを抽出します。新しいファイルの選択中に、プログラムは拡張フィルターのリストを提供します。必要な画像の拡張子を選択し、ファイルを選択します。画像全体からテキストを抽出する場合は、[ツール]-> [テキストのコピー元]に移動して[画像全体]を選択するか、Cキーを使用しますtrl + F ホットキー. 画像の一部のみを選択する場合は、[ツール]-> [エリアテキストOCR]に移動します。

エリアテキストOCR

完了したら、描画して目的のテキストを選択しますその周囲の四角形とダイアログボックスがポップアップし、コピーされたテキストが表示されます。キャンセル、続行、または再試行のいずれかのオプションがあります。 [再試行]オプションを選択すると、テキスト認識が再度実行され、最初の試行で発生した可能性のあるエラーが変更されます。 [続行]を選択して、テキストをクリップボードにコピーします。次に、メモ帳などのテキストエディタを開き、そこにテキストを貼り付けます。

グラウンドトゥルース3

Ground Truth TextはBMP、JPEG、GIF、TIFFをサポートしていますおよびPNG画像形式。テスト中に、フォント認識に関する問題が発生しました。問題は、定型化されたフォントではテキスト認識が少し台無しになる可能性があることです。画像上のテキストがデザインを追加せずにシンプルなフォントで書かれている限り、プログラムは正常に動作します。ただし、抽象的なフォントデザインからテキストを正確に認識することはできません。

このプログラムは、Windows XP、Windows Vista、およびWindows 7で実行されます。

Ground Truth Textをダウンロード

[ghacks経由]

コメント