Snipping OCR - extraire du texte d'une image / d'un document

Snipping OCR - extraire du texte d'une image / d'un document

Il est parfois utile de disposer du texte présent dans une image, en particulier pour les fenêtres d'avertissement du système d'exploitation. De nombreuses applications de bureau et services en ligne présentes sur le Web offrent des fonctionnalités de reconnaissance optique de caractères (optical character recognition -> OCR), vous permettant d'extraire du texte à partir d'images et de documents non interrogeables.

Snipping OCR est un programme open source qui vous permet de sélectionner du texte à partir de n’importe quelle zone de votre écran et d'effectuer une reconnaissance de caractères simplement. Il est très discret et n'a pas besoin d'être installé avant utilisation.

Une icône est placée dans la barre d'état système, double-cliquez sur cette icône ou utilisez le raccourci clavier Ctrl + Win + C pour afficher la boîte de sélection qui effectuera la saisie. Le texte peut alors être récupéré via le presse-papiers pour utilisation directe ou rectification des mots mal orthographiés.

Snipping OCR est un logiciel gratuit sans installation (portable) proposé par son développeur Federico Daniel Colombo (Mexico).

OS: Windows 7/8/10
Langue: Anglais et espagnol
Prix: Gratuit

Page de l'éditeur

Post et texte d'après Kappa. Merci à lui de l'avoir présenté sur le forum dans la rubrique "Les découvertes de Kappa". Plus de détails et prise en main, par Kappa, cliquez ici !

Commentaires

1. Le jeudi, 13 décembre, 2018, 10:49 par Loic

Bonjour, je viens de tester... Pas de dico OCR Fr et resultats OCR pas top...
Ce type d'appli en OS est tres tres rare... pas encore trouvé de bon produit à l'exception de ABBYY Screenshot reader mais il est payant :-(
Merci néanmoins à Libellules et à Kappa !

2. Le jeudi, 13 décembre, 2018, 14:52 par nicodan

Bonjour
pour le dico FR, recupere le fichier tesseract-ocr-3.02.fra.tar.gz depuis https://sourceforge.net/projects/te...

dezippe tous les fichiers fra.* dans le repertoire tessdata

supprime tous les fichiers spa.* et renomme les fichiers fra.* en spa.*

choisis la langue "spanish" dans le menu de l'application et le tour est joué.

3. Le jeudi, 13 décembre, 2018, 16:32 par Kappa

Bonjour

Pour un meilleur résultat, avez-vous testé Capture2text, un produit similaire mais plus ... bref vous verrez, c'est mieux :-)

https://www.libellules.ch/dotclear/...

La nouvelle version est là : https://sourceforge.net/projects/ca...

et la dernière mise à jour date du 22/04/2018 pour l'édition 4.6.0, disponible en 32 ou 64 bit ici, en format ZIP : https://sourceforge.net/projects/ca...

Mérite vraiment le détour.

4. Le vendredi, 14 décembre, 2018, 10:59 par Loic

Merci à vous deux. Les fichiers fr améliorent un peu SnippingOCR mais c'est l'OCR qui est pas trop performant.
J'avais déjà testé Capture2text mais je galere a chaque fois pour fixer le début de la zone à capturer :-( !
Merci. Loic

5. Le vendredi, 14 décembre, 2018, 16:43 par Kappa

Bonjour Loic,

Pour Capture2Text, le développeur a ajouté sur son site ( http://capture2text.sourceforge.net...) une explication détaillée pour la saisie. Effectivement, ce n'est pas toujours évident, surtout avec nos mauvaises habitudes ...
Voici ce qu'il faut faire pour ne pas être en "galère" :
1. Positionnez le pointeur de votre souris dans le coin supérieur gauche du texte que vous souhaitez OCR.
2. Appuyez sur le raccourci OCR (touche Windows + Q) pour commencer une capture OCR.
3. Déplacez votre souris pour redimensionner la zone de capture bleue sur le texte que vous souhaitez OCR. Vous pouvez maintenir enfoncé le bouton droit de la souris et faire glisser pour déplacer la zone de capture entière.
4. Appuyez de nouveau sur la touche OCR (ou cliquez avec le bouton gauche ou appuyez sur ENTER) pour terminer la capture OCR. Le texte de l'OCR sera placé dans le presse-papiers et une fenêtre contextuelle montrant le texte capturé apparaîtra (la fenêtre contextuelle peut être désactivée dans les paramètres).

Au début cela surprend car l'on est plus habitué à cliquer qu'à positionner sans cliquer ... mais c'est le choix du développeur.
Donc pas de clic tant que la zone bleue n'est pas définie :-)

Cordialement,
Kappa

Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

Fil des commentaires de ce billet