OCR & indexation automatique
Sesin offre ses conseils en dématérialisation concernant l’entrée des documents dans le flux d’informations, également appelée capture de documents ou LAD / RAD. En plus de travailler avec des webservices et l’EDI pour échanger des informations avec des applications tierces, Sesin propose des modules d’indexation automatique à partir de l’extraction de données de documents.
Extraction de données de PDF texte
SESIN a créé un module d’extraction de données de PDF texte qui permet d’indexer des informations à partir de :
- Reconnaissance par zone fixe
- Reconnaissance d’un mot-clé, appelé techniquement chaîne de caractères
- Reconnaissance d’un élément variable selon un masque, comme une date, un numéro de contrat, un numéro de dossier, une référence client
- Recherche relative à d’autres éléments trouvés, afin de ne pas se limiter à des documents fixes.
Ces quatre méthodes de recherche d’éléments peuvent ainsi être combinées afin d’obtenir une plus grande précision. Ce module présente l’avantage de ne pas être lié à un OCR, ce qui signifie qu’il ne peut pas y avoir de doutes sur les caractères et que la vérification n’est pas nécessaire.
Les éléments trouvés peuvent servir à nommer le fichier et à l’indexer dans Poseidon ou toute autre plateforme.
Cette solution permet d’extraire les données de contrats, lettres et correspondances, bulletins de salaire et autres documents RH, formulaires générés directement en PDF par Adobe Acrobat ainsi que tous les documents PDF issus d’ERP ou d’autres solutions dont l’original est en PDF.
Indexation automatique par OCR
Pour l’extraction de données complexes à partir d’OCR, SESIN intègre ABBYY Flexicapture et réalise les paramétrages du projet et des types de documents grâce à un spécialiste certifié.
Flexicapture est un indexeur automatique de documents. Il permet de configurer des « templates » de documents, qu’ils soient fixes (comme un formulaire) ou variables (factures, diplômes, contrats, etc.). De plus, Flexicapture reconnaît le type de document et indexe automatiquement le document, permettant la vérification par un utilisateur, et exporte ensuite les résultats pour un fichier, répertoire, base de données ou solution de gestion des documents comme Poseidon.
ABBYY Flexicapture peut être utilisé pour la reconnaissance :
- automatique de factures
- de formulaires
- d’épreuves sous forme de questionnaires à choix multiples
Développement des templates Flexicapture
SESIN Brésil est partenaire certifié et a déjà réalisé des projets de reconnaissance variés.
Flexicapture permet de réaliser plusieurs validations d’informations, des plus simples comme une vérification d’un format de date ou du nombre de caractères jusqu’aux plus complexes avec des validations par script comme la clé de contrôle du numéro de Sécurité Sociale par exemple. Flexicapture utilise également des dictionnaires personnalisés pour faciliter la reconnaissance (liste des départements, prénoms et noms français, etc.).
Avec toutes les validations, nous pouvons assurer un haut niveau de reconnaissance en toute sécurité. En cas de détection d’erreurs, Flexicapture prévient l’opérateur de vérification de données, en indiquant quel type d’erreurs a été rencontré.
Prenez contact avec nous, nous vous aiderons à définir votre projet et choisir la meilleure solution pour votre entreprise.