OCR

OCR

Le module OCR permet d’extraire du texte depuis un document numérisé au format TIFF ou PDF. Ceci permet d’effectuer des recherches sur le texte de ces documents images, de faire des copier-coller depuis le document vers des champs d’indexation ou vers de nouveaux documents textuels. L’OCR basique traite des documents imprimés, non manuscrits et écrits en langue française.
Cette fonction OCR basique est la première étape des outils de traitements documentaires disponibles dans Zensolutions, permettant la reconnaissance automatique de documents (RAD), la lecture automatique de documents (LAD) et l’indexation automatique des documents.

En plus des fonctionnalités de l’OCR basique, l’OCR étendu permet de traiter des documents multilingues, multiformats. Il possède des performances de reconnaissance améliorées et optionnellement il permet de générer un PDF image et texte, permettant la recherche de texte à l’intérieur du document PDF généré, avec toute visionneuse PDF, interne ou externe.
Outre la langue française, cet OCR permet de détecter que le document est dans d’autres langues comme l’Allemand, l’Italien, l’Espagnol, l’Anglais. Il ne permet pas le traitement de langues aux alphabets non latins, comme le Chinois ou le Russe. Contrairement à l’OCR basique, il comporte des limitations en volume de pages traitées.

badge planchette task newspaper settings gear map Exclamation Triangle Check code