jeudi, mai 1 2014

FreeOCR

FreeOCR
FreeOCR
Les programmes de reconnaissance de caractères (OCR) ne sont pas nombreux à être gratuits. FreeOCR propose les fonctions basiques de ce type de programmes. Il peut piloter votre scanner pour acquérir des images à convertir, traiter directement des images, ou bien des documents PDF. N'avez-vous jamais reçu des documents PDF qui étaient en fait des textes scannées, mais le PDF ne contenant que des photos de texte. FreeOCR peut les convertir en texte. Bien sûr (ou hélas) ce type de programmes est limité à un usage basique et des documents simples, sans mise en page invraisemblable et des images au milieu du texte.

En revanche, sur du texte absolument seul, il s'en sort honorablement : tout dépend de l'image de départ. Comme toujours il faut mettre la main à la pâte et corriger derrière la reconnaissance, car certaines lettres simples ne sont pas reconnues.

D'autres OCR gratuits sur le blog : Top OCR, JOCR, et Simple OCR

OS: Windows XP/Vista/7/8
Taille: 405 Ko
Langue: Anglais
Prix : Gratuit

homepage Page officielle

Fiche mise à jour par Krigou le 1 mai 2014 - première publication par Falkra, le 3 février 2009

dimanche, février 26 2012

Capture2Text

Capture2Text
Capture2Text
Ce logiciel OCR permet de capturer du texte inséré dans une image et de sauvegarder le résultat dans le presse papier. Pour déclencher le processus, pressez les touches Win + Q, sélectionnez ensuite le texte à scanner sur l'image à l'aide de la souris sans cliquer dessus. Pressez à nouveau les touches Win+Q et admirez le résultat dans la fenêtre pop-up qui s'ouvre.Advanced Renamer

Autres logiciels de ce type: Ground Truth Text (gttext)

OS: Windows XP/Vista/7
Taille: 36'852 Ko
Langue: Anglais
Prix: Gratuit

Homepage

mardi, octobre 11 2011

Ground Truth Text (gttext)

Ground Truth Text (gttext)

Ground Truth Text (gttext)
est une application open source qui permet d'extraire du texte à partir de presque n'importe quelle image. Le programme vous donne la liberté de sélectionner l'image entière ou seulement une partie de celle-ci. Vous pouvez zoomer, dézoomer l'image si trop petite ou trop grande. Le résultat est parfois surprenant et il est conseillé de cliquer plusieurs fois sur "Try Again" pour affiner le résultat.

Langue: Anglais
Taille:
5747 Ko
OS:
Windows XP/Vista/7/8
Prix: Gratuit

Page officielle

samedi, mai 24 2008

TopOCR

top OCR

TopOCR
Voici un programme de reconnaissance de caractères gratuit, choses relativement rare dans ce secteur où les logiciels les plus performants sont payants, ou fournis à l'achat d'un scanner dans une version allégée. Comme tous les OCR gratuits, la reconnaissance est loin d'être parfaite, vous pouvez le voir sur la capture, où les caractères soulignés ont quelques problèmes, mais ils ont le mérite d'être légers et rapides. On repassera un peu derrière leur travail, ce qui se fait aussi pour d'autres.

L'intérêt de TopOCR est qu'il reconnaît les caractères français, il faudra lui préciser la langue avant de faire reconnaître votre document (il peut scanner pour vous ou ouvrir des images), dans le menu "settings" language : il s'agit bien de la langue du document à analyser, ce n'est pas celle du programme. Par ailleurs, il est conçu pour les webcams et smartphones.

On appréciera un mini traitement de texte - pas si mini et bien évolué en réalité - en accès direct pour modifier à la volée le texte reconnu. Ce module peut exporter le résultat de la reconaissance en html, rtf, txt et... PDF ! Ceci sans installer de module additionnel. Rare ! Les images peuvent subir un pré traitement par filtres pour améliorer le taux de reconnaissance, ceci pour aider lorsque la source était un téléphone portable par exemple ou un livre pris en photo, qui courbe les pages et déforme le texte : on peut tenter d'y remédier. Des zones "image" peuvent être définies pour les contenus mixtes (texte + image).

Un module à ajouter permet aussi de convertir le texte en voix (text to speech) au format MP3, et TopOCR accepte la ligne de commande. Je vous laisse découvrir le reste. ;-)

Dans le même style : JOCR, et SimpleOCR (cliquez pour accès direct au billet).

OS : Windows 98 et suivants
Taille : 7,5 Mo
Langue : Anglais
Licence : Freeware

Site officiel

jeudi, février 14 2008

JOCR

omnipage


JOCR

    Voici un programme de reconnaissance de caractères (OCR) léger et portable. Contrairement aux OCR traditionnels, il n'a pas besoin de votre scanner, et n'ouvrira pas vos fichiers graphiques, il travaille à partir de copies d'écran qu'il fait lui-même, de fenêtres actives (il laisse 3 secondes pour mettre au premier plan la bonne fenêtre s'il y en a beaucoup), de régions de l'écran ou du bureau complet.

Une fois l'image saisie par JOCR, il suffit de sélectionner la langue dans le menu déroulant (elles sont nombreuses) et de cliquer sur "recognize". Le nombre de caractères trouvés s'affiche, et le bloc notes s'ouvre avec le résultat. Les langues ici ne sont pas à prendre comme une recherche avec dictionnaire, il s'agit en fait de jeux de caractères reconnus. La reconnaissance se fait caractère par caractères, et non mot par mot, ce qui serait bien plus lourd, le programme serait plus gros.

La reconnaissance n'est pas parfaite, ici sur un texte souligné, mais peut être bine utile pour recopier un message d'erreur sur un forum, une partie d'interface lorsqu'on écrit un tuto (exemple vécu), etc...

reconnaissance caractères

Pour un OCR alternatif gratuit plus traditionnel, voyez du côté de SimpleOCR. Pour les messages d'erreur, n'oubliez pas... cette astuce toute simple.

OS : Windows 2000, XP (Vista non mentionné)
Windows 95/98/ME/NT4 via ajout de dll fournies sur le site.
Ne nécessite pas Java malgré son nom
Taille :
85 Ko
Langue : anglais, reconnaît plusieurs langues
Licence : freeware

Site officiel
Téléchargement

mercredi, août 16 2006

SimpleOCR

simple ocr gratuit

    SimpleOCR est un outil de reconnaissance de caractères gratuit (et léger), chose rare dans cette catégorie de logiciels. Loin du niveau d'un omnipage, certes, mais performant tout en restant gratuit, ce programme intègre des dictionnaires français et anglais pour la reconnaissance des mots. L'interface du programme - elle - restera en anglais.
Comme tout OCR qui se respecte, il faut bien le paraméter pour en tirer de bons résultats, d'abord utiliser des textes imprimés (un module de reconnaissance d'écriture manuscrite est en démo pour 14 jours), et éviter de passer par le driver intégré, qui ne m'a pas convaincu. En fournissant au logiciel des images 2 couleurs préalablement scannées et recadrées, la reconnaissance était bien meilleure.

Une fois cette phase de configuration passée, le programme se montre plutôt efficace, et ne bute que sur quelques polices de caractères partiuclières ou des noms propres. En dehors de quelques espaces en trop, le taux de réussite est très bon. L'interface est austère mais fonctionelle, le logiciel restant gratuit, il faut y faire quelques concessions esthétiques.

OS: Windows (toutes versions)
Taille:
9,3 Mo
Langue: Anglais (interface),
anglais, français, hollandais (reconnaissance)
Licence:
Freeware

Page d'accueil et téléchargement

- page 1 de 2