logiciel OCR oui mais?

Posez ici toutes les questions concernant un ou plusieurs logiciels, payants ou gratuits. Pour les demandes spécifiques aux systèmes d'exploitation, passez plutôt par les sections dédiées.

Modérateur: Modérateurs

logiciel OCR oui mais?

Messagepar benouville » 31 Mar 2009 14:59

Bonjours, une petite question aux personnes, qui ont déjà utiliser des logiciels OCR, donc pour convertir les textes figurants dans les images, en texte.

Donc moi je vient juste d'essayer simple ocr, certe il est gratuit, mais l'inconvénient, c'est que il fonctionne avec des dictionaires!
donc imaginez vous, lorsque l'utilisateur telecharge des affiches ou des images provenant du monde entier!
là il faudrait dans ce cas là, avoir tout les dictionaires de toutes les langues, avec toutes les variations.
Et qu'il désire intégré le texte dans word, pour le traduire.
Donc ici dans ce genre de cas, qui est la majorité des cas, ce genre de lociciel ocr, ne créer que des inconvénient à l'utilisateur.

Donc es ce que vous, vous connaissez des logiciels ocr, qui eux accepterons autant les texte contenant des caractères chinois,japonais,russes, langues allemandes, anglaise.....
et tout naturellement gratuit, celà vas de soit!

donc en fait un lociel, qui lui convertit simplement le texte qui est inscrit, et qui ne vas pas encore embêter l'utilisateur, en changeant les caractères inscrit sur le document convertit, par ceux qui se trouve dans le dictionaire.

merci par avance.

top ocr, gratuit, lui il comprend déjà les langues suivantes!
English, Danish, Dutch, Finnish, French, German, Italian, Norwegian, Portuguese, Spanish, Swedish.

ce qui est déjà bien, mais néenmoins, que faire avec les caractères non latin, donc cyrillic pour la langue russe, arabe, chinois et japonais?
benouville
 
Messages: 23
Inscription: 31 Mar 2009 14:43

Re: logiciel OCR oui mais?

Messagepar benouville » 31 Mar 2009 16:59

bon là je vient juste de m'apercevoir!
que Microsoft office, donc comme moi je l'avais déjà aquis il y'a quelques années, lui il posède déjà un lociel OCR, dans outils microsoft office\document imaging.

je l'ai de suite tester.
et micracle, il convertit le texte!
sauf petit hic dans l'affaire. Je ne sais pas pourqu'elle raison, mais il prend uniquement en charge 4 langues, or Word lui c'est tout une panoplie!
donc oui, pour les textes allemand,anglais néerlandais et francais.

et avec lui il suffit juste de cliquer avec le bouton droit de la souris, pour que le menu contextuelle propose de transferrer la selection dans le logiel de traitement de texte word.

et un autre hic!
c'est que après avoir transferrer le texte.
le format de texte original à disparu, donc il convertit bien le texte, malgré qu'il modifie certain caratère (du fait surrement de l'imperfection de la reconaissance des caractères), et ainsi après un petit peut de travail, il m'est ainsi possible de facillement reconstruire le texte dans sa langue originale, pour après enfin le traduire avec les outils de traduction disponible sur le net.

donc pour le moment celà me permet de résourdre seulement le problème au 2/3, mais en m'épargnant l'obligation de devoir installer un nouveau logiciel.

donc maintenant si vous avez une solution, pour les autres langues, je suis a votre écoutes.
ou du moins pour les caractères non latin.
benouville
 
Messages: 23
Inscription: 31 Mar 2009 14:43

Re: logiciel OCR oui mais?

Messagepar benouville » 31 Mar 2009 18:07

Et je revient maintenant, sur les logiciels ocr contenant des dictionaires tel que simple ocr.

l'inconvénient majeur que lui il détient, c'est bel et bien les dictionaires pour la reconaissance des phrases.
je dit bien l'inconvénient, du fait que si le dictionaire aurait été éditable comme tel avec un simple éditeur de texte, genre notepad (bloc note si vous préfèrer) celà aurait été moiins grâve!

Mais du fait que les dictionaires, eux sont compilé, ben l'unique moyen de rentrer les données, c'est de passer par le logiciel (j'ai même pas essayer, ou plutôt pas vérifier si il le permettait).
Donc rentrer mot par mots dans un dictionaires, celà équivaux à carément réécrire le texte inscrit sur l'image dans un logiciel de traitement de texte (baucoup plus rapide).

or si il y'aurait eut la possibilité à l'utilisateur, de simplement entrer les données via la fonction copier coller d'une liste d'un autre dictionaire existant, ben l'utilisateur aurait été aux anges (celà vas de soit, qu'il aurait eut tout de même un petit travail a effectuer) mais tout de même moins contraignant que de devoir mettre ç jours un dictionaire, via le logiciel en lui même.

ou bien il existe une autre possbilité, mais là ont perd aussi du temps, du fait qu'ils s'agit de lire le texte (donc vocale convertion en traitement de texte).
Mais là c'est une autre histoire, du fait que l'utilisateur auras besoin d'un micro, du logiciel vocale, et après, identiquement il y'a une énorme perte de temps en matière de réglage du logiciel, et il faut que l'utilisateur soit dans un environnement sans bruit, du fait que toutes les mots parler peuvent donné des imperfections dans le document écrit via la vocale.

Certe il y'a la possibilité de régler la reconaissance de la voix de l'utilisateur, mais néenmoins, cecis est uniquement bon pour les personnes, vivant tout seul, n'ayant pas de famille, ou étant cloitré dans un bureau, ou personne d'autres ne risque de faire une conversation avec la personne, ce qui risquerait que le lociciel encore une fois vas inscrire dans le document de l'utilisateur des mots de la conversation.....

et l'inconvénient majeur est, si il faut utiliser la dicté vocale pour transcrire une vingtaine de pages (texte images), ben on est plus rapide en effectuant des copier-coller des textes contenu dans les images, que de devoir lire tout une page pour transferrer le texte dans un document traitement de texte.
benouville
 
Messages: 23
Inscription: 31 Mar 2009 14:43

Re: logiciel OCR oui mais?

Messagepar benouville » 31 Mar 2009 21:37

ok maintenant je vous explique juste comment moi, je vient juste de travailler en ocr pour recuperer le texte de 3 pages, avec l'utilitaire de machin bourique du multimilliardiare!

oui certe je vous l'ai expliquer, comme le programme est intégrer dans la suite.
il faut disposer de la suite bureautique.
mais c'est vraiment enfentin avec cette utilitaire.

donc:
j'ai tout d'abord convertit les images gif dans le format TIFF. (le format tiff appartient au format standard, donc on n'a pas besoin d'utiliser des logiciel specifique pour faire la conversion du format, c'est identique avec le format gif, mais vue que l'utilitaire veux soit du tiff ou un autre format, et que le tiff, en terme de qualité il n'y aucun reproche a faire), j'ai donc convertit dans le format tiff mes 3 premier images format pages A4.

petite astuce lorsque le texte dans les images est écrit avec des petit caractère, (ben il n'y a pas trop le choix) du fait que si les caractères sont trop rapprochés des uns des autres, c'est ici, que l'identification des caractère faira défaut!

1)Donc il vaut mieux agrandir l'image dès le départ, pour que les caractères soit plus lissible par le logiciel (donc plus d'espace entre les différents caractères) sinon le logiciel interprètera cela en tant que caractère se raprochant le plus près du celui ci. (exemple 1 "m" pour lui pourras donné 2 caractère tel R+N comme ici: "rn ")

2) identiquement comme pour l'image en elle même, si vous voullez avoir le format de page identique au texte d'origine, ben il vaut mieux sélectionner paragraphe par paragraphe, que de transvaser toute la page.
et là aussi, il vaut mieux selectionner une plus zone, que de sélectionner uniquement la zone au raz du texte, sinon il y'a risque que le caractère soit coupé, et là toute la ligne de texte, contiendra des caractères non identifier.
(Donc moi là, j'ai sélectionner toujours la ligne d'avant+ la ligne d'après, et il me suffisait juste de faire un "CTRL+C- cliquer dans word et CTRL+V) pour que le transfere de ma sélection se fasse, même pas besoin de travailler plus avec la souris, ou de devoir enregistrer le texte convertit en format .doc etc..., donc çà oui je peut vous assurer que celà vaux 1 premier alleluja!

3) ben après chaque paragraphe de texte ocr transferrer dans word, j'ai de suite rectifier les mauvais caractère, et j'avoue, devoir corriger 2 voirs 3 caractères voir 2 à 3 mots dans un paragraphe, avec les outils de correction automatique que dispose le logiciel de traitement de texte, ben c'est vite fait, à raison que les mots figure dans le dictionaire du logiciel de traitement de texte.

et là en moins de quoi, 10 minutes j'avais reconstituer 3 pages de textes en langues allemande.
contenant aussi bien les "ß" les "ä" que les autres caractères qui sont spécifiques à la langue allemande.

et là moi il me suffit juste encore, comme ces paragraphes vont allez dans mon forum, ben je vais pour le faire en vitesse, utiliser les outils de traductions automatiques, du web, et après encore controler les phrases traduite, avant de le mettre dans le forum anglais.

bien sur le contrôle de la traduction, vas me prendre un temps plus grand, mais au moins j'ai l'avantage,d'être de nature trilingue, donc qui m'épargnera de simplement mettre un texte dans un forum qui est issue d'un traducteur automatique, du fait que les traducteurs automatiques, il effectue la traduction mot à mot.
donc du petit chinois, autant pour du russe vers la langue anglaise, comme de l'anglais vers le francais ou n'importe quel autre langue traduite.

Et là c'est le rôle de l'utilisateur qui entre en jeu, ou plutôt sa vision logique de la comprehension du sens des phrases traduites.

voilà!
benouville
 
Messages: 23
Inscription: 31 Mar 2009 14:43


Retourner vers Software - Logiciels

Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité