Op een of ander moment hebben we allemaal in eensituatie waarin we de behoefte voelen om tekst uit een afbeelding te extraheren. Het extraheren van tekst uit een afbeelding gebeurt meestal op een moment dat u de tekst snel wilt hebben. Normaal gesproken voert u de woorden handmatig in door ze uit de bron te lezen en op het toetsenbord te typen, maar dat kan een behoorlijk vervelend en tijdrovend proces zijn wanneer er grote alinea's moeten worden gekopieerd van een afbeelding. Een efficiëntere manier om tekst uit een afbeelding te halen, is door OCR-software te gebruiken in plaats van alles met de hand te typen. Ground Truth-tekst (gttext) is een open source-applicatie die kan extraherentekst van bijna elke afbeelding. Het programma geeft u de vrijheid om de hele afbeelding of een deel ervan te selecteren, afhankelijk van uw behoefte. U kunt ook inzoomen en uitzoomen op afbeeldingen als de afbeelding te klein of te groot is.
Selecteer om te beginnen de afbeelding waarvan u wilttekst uitpakken. Tijdens de selectie van een nieuw bestand krijgt u van het programma een lijst met extensiefilters. Kies de extensie van uw gewenste afbeelding en selecteer het bestand. Als u tekst uit de hele afbeelding wilt extraheren, gaat u naar Extra -> Tekst kopiëren van en selecteert u Volledige afbeelding of gebruikt u gewoon de Ctrl + F sneltoets. Als u slechts een deel van de afbeelding wilt selecteren, gaat u naar Extra -> OCR tekstgebied.

Selecteer vervolgens de gewenste tekst door een te tekeneneromheen en er verschijnt een dialoogvenster met de gekopieerde tekst. U kunt Annuleren, Doorgaan of Opnieuw proberen. Als u de optie Opnieuw proberen selecteert, wordt de tekstherkenning opnieuw uitgevoerd om eventuele fouten bij de eerste poging te wijzigen. Selecteer Doorgaan om de tekst naar het klembord te kopiëren. Open nu een teksteditor, bijvoorbeeld Kladblok en plak de tekst daar.

Ground Truth Text ondersteunt BMP, JPEG, GIF, TIFFen PNG-beeldformaten. Tijdens het testen kwamen we enkele problemen tegen met betrekking tot lettertypeherkenning. Het probleem is dat tekstherkenning een beetje in de war kan raken voor gestileerde lettertypen. Het programma werkt prima zolang de tekst op de afbeelding in een eenvoudig lettertype is geschreven, zonder toegevoegd ontwerp. Het is echter niet in staat om de tekst van abstracte letterontwerpen nauwkeurig te herkennen.
Het programma draait op Windows XP, Windows Vista en Windows 7.
Download Ground Truth-tekst
Comments