- - Витягування тексту з кольорових зображень із основним текстом правди

Витягування тексту з кольорових зображень із основним текстом правди

В той чи інший час ми всі були в аситуація, коли ми відчуваємо потребу витягти текст із зображення. Витягнення тексту з зображення, як правило, виконується в той момент, коли текст потрібно швидко. Зазвичай вводьте слова вручну, читаючи їх з джерела і набираючи їх на клавіатурі, але це може бути досить стомлюючою та трудомісткою діяльністю, коли з зображення є великі абзаци, які потрібно скопіювати. Більш ефективним способом отримання тексту з зображення є використання програмного забезпечення OCR, а не просто вводити все вручну. Текст основної правди (gttext) - це програма з відкритим кодом, яка може витягтитекст майже з будь-якого зображення. Програма дає вам свободу вибору всього зображення або лише його частини, залежно від ваших вимог. Ви також можете збільшувати або зменшувати зображення, якщо зображення занадто мало або занадто велике.

Для початку виберіть зображення, з якого ви хочетевитягнути текст. Під час вибору нового файлу програма видасть вам список фільтрів розширень. Виберіть розширення потрібного зображення та виберіть файл. Якщо ви бажаєте витягнути текст із цілого зображення, перейдіть до Інструменти -> Скопіюйте текст із та виберіть Повне зображення або просто скористайтесь клавішею Ctrl + F гаряча клавіша. Якщо ви хочете вибрати лише частину зображення, перейдіть до Інструменти -> Обласний текст OCR.

Текст області OCR

Після завершення виберіть потрібний текст, намалювавши апрямокутник навколо нього, і з'явиться діалогове вікно, де відображатиметься скопійований текст. У вас буде можливість скасувати, продовжити або спробувати ще раз. Вибравши параметр "Спробувати знову", знову розпочнеться розпізнавання тексту, щоб змінити помилки, які могли виникнути під час першої спроби. Виберіть Продовжити, щоб скопіювати текст у буфер обміну. Тепер відкрийте будь-який текстовий редактор, наприклад Блокнот і вставте текст там.

Основна правда 3

Текст Ground Truth підтримує BMP, JPEG, GIF, TIFFі формати зображень PNG Під час тестування у нас виникли проблеми з розпізнаванням шрифту. Проблема полягає в тому, що розпізнавання тексту може бути трохи зіпсовано для стилізованих шрифтів. Програма працює чудово, поки текст на зображенні написаний простим шрифтом, без будь-якого додаткового дизайну. Однак він не в змозі точно розпізнати текст із абстрактних шрифтових конструкцій.

Програма працює на Windows XP, Windows Vista та Windows 7.

Завантажте текст основної правди

[через ghacks]

Коментарі