Lorsque vous souhaitez convertir un texte imprimé ou une écriture manuscrite en une copie numérique, vous n’avez pas besoin de le faire manuellement. Vous n’avez même pas besoin de dépenser une fortune pour des outils professionnels. Nous vous présentons les meilleurs programmes OCR (reconnaissance optique de caractères) qui convertissent gratuitement des images en texte.



Qu’est-ce que l’OCR ?

Logiciel de reconnaissance optique de caractères (OCR) convertit des images, ou même de l’écriture manuscrite, en texte. Les outils d’OCR analysent un document et le comparent aux polices stockées dans leur base de données, et/ou en notant les caractéristiques typiques des caractères. Certaines applications d’OCR le soumettent également à un correcteur orthographique pour « deviner » les mots non reconnus. Il est difficile d’atteindre une précision de 100 %, mais la plupart des logiciels s’efforcent d’en obtenir une approximation proche.

Les logiciels d’OCR peuvent constituer un raccourci de productivité pour les étudiants, les chercheurs et les employés de bureau qui ont besoin d’une copie lisible par machine d’un document numérisé. Nous allons donc en essayer plusieurs et trouver le meilleur logiciel d’OCR pour vos besoins.


1. OCR avec Microsoft OneNote

Microsoft OneNote dispose d’une fonctionnalité OCR avancée, qui fonctionne à la fois sur les images et les notes manuscrites.

  • Faites glisser un scan ou une image enregistrée dans OneNote. Vous pouvez également utiliser OneNote pour découper une partie de l’écran ou une image dans OneNote.
  • Cliquez avec le bouton droit de la souris sur l’image insérée et sélectionnez Copier le texte de l’image.
  • Le texte copié et reconnu optiquement est placé dans le presse-papiers et vous pouvez maintenant le coller dans OneNote ou dans n’importe quel programme comme Word ou Notepad.

Utilisation de l'OCR dans OneNote

OneNote peut également extraire du texte d’une impression multipage en un seul clic. Insérer un impression de plusieurs pages dans OneNote, puis cliquez avec le bouton droit de la souris sur la page sélectionnée.

  • Cliquez sur Copier le texte de cette page de l’imprimé pour copier le texte de la page sélectionnée uniquement.
  • Cliquez Copier le texte de toutes les pages de l’imprimé pour copier le texte de toutes les pages en une seule fois, comme vous pouvez le voir ci-dessous.

Extraire du texte des images d'un fichier imprimé sur plusieurs pages.

Notez que la précision de l’OCR dépend de la qualité de la photo. C’est pourquoi la reconnaissance optique de l’écriture manuscrite est encore un peu floue pour OneNote et d’autres logiciels d’OCR sur le marché. Cela dit, c’est l’une des fonctions clés de OneNote que vous devriez utiliser à chaque fois que vous en avez l’occasion.


2. SimpleView

SimpleView OCR

Si vous trouvez que d’autres outils, comme OneNote, ont du mal à convertir du texte manuscrit, utilisez la version d’essai gratuite de 30 jours de SimpleView, qui inclut la reconnaissance de l’écriture manuscrite grâce au moteur OCR de FineReader. Pendant la période d’essai ou avec la version payante, vous pouvez également convertir des fichiers en masse et éditer des images.

La version gratuite prend en charge la reconnaissance automatique de l’écriture d’un fichier jusqu’à 100 fichiers, à l’aide du moteur Open Source Tesseract OCR ou du moteur interne SimpleOCR. Utilisez ces conseils pour tirer le meilleur parti de la version gratuite :

  • Configurez-le pour qu’il lise directement à partir d’un scanner ou en ajoutant une page (formats JPG, TIFF, BMP).
  • Parcourez les dossiers pour obtenir des aperçus de vos documents.
  • Sous Editer tab &gt ; OCR (section du document), choisissez le moteur d’OCR et, si vous utilisez Tesseract, la langue du document.
  • Pour convertir des documents en langues étrangères, téléchargez les fichiers linguistiques pour plus de 100 langues différentes et copiez le dossier Tesseract décompressé dans votre répertoire d’installation de SimpleOCR.

SimpleView fonctionne bien avec du texte normal, mais sa gestion des mises en page multi-colonnes peut être décevante. Pour du texte standard, vous ferez probablement mieux avec les outils Microsoft.

Télécharger: SimpleView (Gratuit, version payante avec essai gratuit disponible)


3. LightPDF

LightPDF

LightPDF est un éditeur PDF moderne doté d’un large éventail de fonctionnalités, telles que la création de PDF à partir de zéro, l’édition de PDF, y compris la division et la fusion de fichiers PDF, la création de formulaires PDF et la reconnaissance optique de caractères (OCR).

Avec la version gratuite, vous êtes limité à la conversion des trois premières pages de chaque document, vous ne pouvez éditer qu’un maximum de trois fichiers par jour et les fichiers sont enregistrés ou imprimés avec un filigrane. Avec la version payante, vous perdez le filigrane, vous pouvez éditer jusqu’à 1 000 fichiers par jour et vous avez accès au traitement par lots et aux options d’édition avancées.

Pour exécuter l’OCR sur votre document numérisé, chargez votre PDF dans LightPDF, allez dans la fenêtre de l’OCR. Convertir et cliquez sur OCR. Vous pourrez faire quelques sélections :

  • Utiliser Mode amélioré pour une reconnaissance de texte plus précise, mais notez que cela peut prendre plus de temps.
  • Vous pouvez choisir de convertir toutes les pages, la page actuelle ou une sélection personnalisée de pages, mais LightPDF a ignoré notre sélection de « page actuelle » et a converti les trois premières pages à la place.
  • Choisissez toutes les langues incluses dans le document.

Pour relever le défi, nous avons demandé au logiciel de convertir des pages d’un livre de recettes allemand. Bien qu’il n’ait pas réussi à convertir tous les détails, il a fait un excellent travail en conservant le formatage en plusieurs colonnes et en convertissant correctement la plupart des caractères spéciaux.

Télécharger : LightPDF (Gratuit, version payante disponible)


4. Photo Scan

Photo Scan est une application OCR gratuite pour Windows 10.

Photo Scan est une application Windows OCR gratuite que vous pouvez télécharger depuis le Microsoft Store. Créée par Define Studios, l’application est à la fois un scanner OCR et un lecteur de code QR.

Dirigez l’application vers une image ou un fichier imprimé. Vous pouvez également utiliser la webcam de votre PC pour lui donner une image à regarder. Contrairement à plusieurs autres outils présentés dans cet article, Photo Scan ne fonctionne pas avec les fichiers PDF. Le texte reconnu est affiché dans une fenêtre adjacente.

La fonction de synthèse vocale est un point fort. Cliquez sur l’icône du haut-parleur et l’application lira à haute voix ce qu’elle vient de numériser. L’application n’est pas très performante pour les textes manuscrits, mais la reconnaissance des textes imprimés est satisfaisante. Lorsque tout est terminé, vous pouvez enregistrer le texte OCR dans plusieurs formats tels que Texte, HTML, Rich Text, XML, Log format, etc.

Télécharger : Photo Scan (Gratuit, achat dans l’application)


5. (a9t9) Application Windows OCR gratuite

a9t9 est une application OCR gratuite pour Windows

(a9t9) Le logiciel d’OCR gratuit est une application Universal Windows Platform, ce qui signifie que vous pouvez l’utiliser avec n’importe quel appareil Windows que vous possédez. Il existe également un équivalent OCR en ligne qui fonctionne avec la même API.

(a9t9) prend en charge 21 langues pour l’analyse de vos images et PDF en texte. L’application est également gratuite, et la publicité peut être supprimée par un achat in-app. Comme la plupart des programmes OCR gratuits, elle est idéale pour les documents imprimés et non pour le texte manuscrit.

Télécharger : a9t9 Free OCR (Gratuit, achat dans l’application)


6. Capture2Text

Menu des paramètres de Capture2Text

Capture2Text est un logiciel d’OCR gratuit pour Windows qui vous donne des raccourcis clavier pour OCR rapidement tout ce qui se trouve à l’écran. Il s’agit également d’un exécutable qui ne nécessite pas d’installation.

Utiliser le raccourci clavier par défaut Touche Win + Q pour activer le processus d’OCR. Vous pouvez ensuite utiliser la souris pour sélectionner la partie que vous souhaitez capturer. Appuyez sur Entrée pour déclencher la reconnaissance optique de caractères. Le texte capturé et converti apparaîtra dans une fenêtre contextuelle et, par défaut, sera également disponible dans le presse-papiers.

Capture2Text utilise le moteur OCR de Google et prend en charge plus de 100 langues. Il utilise Google Translate pour convertir le texte capturé dans d’autres langues. Consultez le menu de la barre d’outils Windows pour accéder à Paramètrespour activer ou désactiver l’enregistrement dans le presse-papiers, ou pour passer à la langue d’OCR par défaut.

Télécharger: Capture2Text (Gratuit)


7. Image Scan OCR

Image Scan OCR

Cette application du Microsoft Store est idéale pour traiter des fichiers par lots avec l’OCR. Elle utilise une conception en trois colonnes avec votre dossier de fichiers à gauche, le fichier sélectionné au milieu et le texte reconnu à droite. Image Scan OCR prend en charge les images et les PDF. Il n’a pas produit de résultats lisibles pour les échantillons d’écriture manuscrite, il faut donc s’en tenir au texte imprimé.

Lorsque vous le lancez pour la première fois, vous devez sélectionner un dossier à l’aide de la fonction OpenFolder . Vous pouvez également définir une langue pour améliorer la reconnaissance du texte. Lorsque nous avons ouvert des dossiers contenant de nombreux fichiers, l’application est devenue assez lente. Nous vous recommandons donc de choisir un dossier vide et d’y faire glisser vos fichiers au fur et à mesure.

Lorsque vous cliquez sur BatchProcessImage Scan OCR traitera tous les fichiers du dossier en cours. Une fois que vous avez traité une image ou un document, vous pouvez éditer le résultat dans la colonne de droite, puis le copier ou l’enregistrer dans un fichier texte.

Télécharger : Image Scan OCR (Gratuit)


8. OCR avec Google Docs

Si vous êtes loin de votre propre ordinateur, essayez les capacités d’OCR de Google Drive. Google Docs dispose d’un programme OCR intégré qui peut reconnaître du texte dans des fichiers JPEG, PNG, GIF et PDF. Mais tous les fichiers ne doivent pas dépasser 2 Mo et le texte doit avoir une taille de 10 pixels ou plus.

Google Drive peut également détecter automatiquement la langue des fichiers numérisés, bien que la précision des caractères non latins ne soit pas toujours optimale.

  1. Connectez-vous à votre compte Google Drive.
  2. Cliquez sur Nouveau &gt ; Téléchargement de fichier. Vous pouvez également cliquer sur My Drive &gt ; Upload Files.
  3. Recherchez sur votre PC le fichier que vous souhaitez convertir du PDF ou de l’image au texte. Cliquez sur le bouton Ouvrir pour télécharger le fichier.
  4. Le document se trouve maintenant dans votre Google Drive. Faites un clic droit sur le document et cliquez sur Ouvrir avec &gt ; Google Docs.

Cette capture montre comment utiliser l'OCR dans Google Drive

Google convertit votre fichier PDF ou image en texte à l’aide de l’OCR et l’ouvre dans un nouveau document Google. Le texte est modifiable et vous pouvez corriger les parties qui n’ont pas été correctement lues par l’OCR. Vous pouvez télécharger le document optimisé dans les différents formats pris en charge par Google Drive. Vous avez le choix entre Fichier &gt ; Télécharger sous menu.


Le meilleur logiciel d’OCR gratuit que vous puissiez choisir

Alors que les outils gratuits étaient adéquats pour le texte imprimé, ils n’ont pas fonctionné pour le texte manuscrit cursif normal. Ma préférence personnelle pour l’utilisation de l’OCR s’oriente vers Microsoft OneNote, car vous pouvez l’intégrer à votre flux de travail de prise de notes.

Photo Scan est une application universelle du Windows Store, et elle prend en charge les sauts de ligne avec la gamme de formats de documents que vous pouvez enregistrer. Mais ne laissez pas votre recherche de convertisseurs OCR gratuits s’arrêter là. Il existe d’autres moyens d’OCR pour vos images et votre texte.