TopOCR

TopOCR

Voici un programme de reconnaissance de caractères gratuit, choses relativement rare dans ce secteur où les logiciels les plus performants sont payants, ou fournis à l'achat d'un scanner dans une version allégée. Comme tous les OCR gratuits, la reconnaissance est loin d'être parfaite, vous pouvez le voir sur la capture, où les caractères soulignés ont quelques problèmes, mais ils ont le mérite d'être légers et rapides. On repassera un peu derrière leur travail, ce qui se fait aussi pour d'autres.

L'intérêt de TopOCR est qu'il reconnaît les caractères français, il faudra lui préciser la langue avant de faire reconnaître votre document (il peut scanner pour vous ou ouvrir des images), dans le menu "settings" language : il s'agit bien de la langue du document à analyser, ce n'est pas celle du programme. Par ailleurs, il est conçu pour les webcams et smartphones.

On appréciera un mini traitement de texte - pas si mini et bien évolué en réalité - en accès direct pour modifier à la volée le texte reconnu. Ce module peut exporter le résultat de la reconaissance en html, rtf, txt et... PDF ! Ceci sans installer de module additionnel. Rare ! Les images peuvent subir un pré traitement par filtres pour améliorer le taux de reconnaissance, ceci pour aider lorsque la source était un téléphone portable par exemple ou un livre pris en photo, qui courbe les pages et déforme le texte : on peut tenter d'y remédier. Des zones "image" peuvent être définies pour les contenus mixtes (texte + image).

Un module à ajouter permet aussi de convertir le texte en voix (text to speech) au format MP3, et TopOCR accepte la ligne de commande. Je vous laisse découvrir le reste. ;-)

Dans le même style : SimpleOCR (cliquez pour accès direct au billet).

OS: Windows
Langue: Anglais
Licence: Freeware

Page officielle

Commentaires

1. Le dimanche 25 mai 2008, 00:44 par Unicornis

<troll> Le skin est horrible Argh </troll>

2. Le dimanche 25 mai 2008, 00:46 par Falkra

Je ne l'aime pas trop, et... mauvaise nouvelle : il n'y a que ça en stock dans le programme. ;-)

3. Le lundi 26 mai 2008, 22:31 par Raphaël

Voir aussi le site ocr1.sc.isc.tohoku.ac.jp/... qui donne des résultats encourageants (mais attention à ne pas uploader des textes trop sensibles, on ne sait jamais).

4. Le jeudi 27 février 2014, 18:16 par madou

C'EST UN LOGICIEL TRÈS INTÉRESSANT

5. Le samedi 1 mars 2014, 10:28 par Li-An

Tiens, les deux liens JOCR et SimpleOCR sont morts.

6. Le samedi 1 mars 2014, 12:02 par krigou

Corrigé! Merci Li-An

Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

Fil des commentaires de ce billet