TopOCR

TopOCR

Voici un programme de reconnaissance de caractères gratuit, choses relativement rare dans ce secteur où les logiciels les plus performants sont payants, ou fournis à l'achat d'un scanner dans une version allégée. Comme tous les OCR gratuits, la reconnaissance est loin d'être parfaite, vous pouvez le voir sur la capture, où les caractères soulignés ont quelques problèmes, mais ils ont le mérite d'être légers et rapides. On repassera un peu derrière leur travail, ce qui se fait aussi pour d'autres.

L'intérêt de TopOCR est qu'il reconnaît les caractères français, il faudra lui préciser la langue avant de faire reconnaître votre document (il peut scanner pour vous ou ouvrir des images), dans le menu "settings" language : il s'agit bien de la langue du document à analyser, ce n'est pas celle du programme. Par ailleurs, il est conçu pour les webcams et smartphones.

On appréciera un mini traitement de texte - pas si mini et bien évolué en réalité - en accès direct pour modifier à la volée le texte reconnu. Ce module peut exporter le résultat de la reconaissance en html, rtf, txt et... PDF ! Ceci sans installer de module additionnel. Rare ! Les images peuvent subir un pré traitement par filtres pour améliorer le taux de reconnaissance, ceci pour aider lorsque la source était un téléphone portable par exemple ou un livre pris en photo, qui courbe les pages et déforme le texte : on peut tenter d'y remédier. Des zones "image" peuvent être définies pour les contenus mixtes (texte + image).

Un module à ajouter permet aussi de convertir le texte en voix (text to speech) au format MP3, et TopOCR accepte la ligne de commande. Je vous laisse découvrir le reste. ;-)

Dans le même style : SimpleOCR (cliquez pour accès direct au billet).

OS: Windows
Langue: Anglais
Licence: Freeware

Page officielle

Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

Haut de page