Paramètres OCR |
Top Previous Next |
La boîte de dialogue des paramètres de l'OCR est ouverte à partir de l'écran Options tab.
L'OCR (reconnaissance optique de caractères) convertit le texte des images, telles que les documents numérisés ou faxés, en texte consultable. Les formats d'image pris en charge sont indiqués dans la liste Formats de fichier et les langues prises en charge sont indiquées dans le menu déroulant Langues.
Mise en cache du texte OCR
(Recommandé) L'OCR d'images est normalement une tâche exigeante pour le CPU et peut donc ralentir considérablement les recherches, mais il est possible de mettre en cache les résultats de l'OCR afin que les recherches ultérieures soient beaucoup plus rapides.
Paramètres PDF
Bien que le format PDF soit un format courant pour les documents numérisés, où le PDF n'est qu'une collection de fichiers d'images, le format PDF est également utilisé pour les documents qui contiennent du texte régulier et qui ne bénéficieraient pas d'une analyse OCR. Pour ignorer l'OCR pour les PDF contenant du texte consultable, utilisez l'option Ne pas effectuer d'OCR sur les PDF contenant du texte consultable. |