OCR & indexation automatique -Sesin

OCR & indexation automatique

Sesin offre ses conseils en dématérialisation concernant l’entrée des documents dans le flux d’informations, également appelée capture de documents ou LAD / RAD. En plus de travailler avec des webservices et l’EDI pour échanger des informations avec des applications tierces, Sesin propose des modules d’indexation automatique à partir de l’extraction de données de documents.

Extraction de données de PDF texte

SESIN a créé un module d’extraction de données de PDF texte qui permet d’indexer des informations à partir de :

Reconnaissance par zone fixe
Reconnaissance d’un mot-clé, appelé techniquement chaîne de caractères
Reconnaissance d’un élément variable selon un masque, comme une date, un numéro de contrat, un numéro de dossier, une référence client
Recherche relative à d’autres éléments trouvés, afin de ne pas se limiter à des documents fixes.

Ces quatre méthodes de recherche d’éléments peuvent ainsi être combinées afin d’obtenir une plus grande précision. Ce module présente l’avantage de ne pas être lié à un OCR, ce qui signifie qu’il ne peut pas y avoir de doutes sur les caractères et que la vérification n’est pas nécessaire.

Les éléments trouvés peuvent servir à nommer le fichier et à l’indexer dans Poseidon ou toute autre plateforme.
Cette solution permet d’extraire les données de contrats, lettres et correspondances, bulletins de salaire et autres documents RH, formulaires générés directement en PDF par Adobe Acrobat ainsi que tous les documents PDF issus d’ERP ou d’autres solutions dont l’original est en PDF.

Indexation automatique par OCR

Pour l’extraction de données complexes à partir d’OCR, SESIN intègre ABBYY Flexicapture et réalise les paramétrages du projet et des types de documents grâce à un spécialiste certifié.

Flexicapture est un indexeur automatique de documents. Il permet de configurer des « templates » de documents, qu’ils soient fixes (comme un formulaire) ou variables (factures, diplômes, contrats, etc.). De plus, Flexicapture reconnaît le type de document et indexe automatiquement le document, permettant la vérification par un utilisateur, et exporte ensuite les résultats pour un fichier, répertoire, base de données ou solution de gestion des documents comme Poseidon.

ABBYY Flexicapture peut être utilisé pour la reconnaissance :

automatique de factures
de formulaires
d’épreuves sous forme de questionnaires à choix multiples

Copie d'écran indexation automatique

Développement des templates Flexicapture

SESIN Brésil est partenaire certifié et a déjà réalisé des projets de reconnaissance variés.

Flexicapture permet de réaliser plusieurs validations d’informations, des plus simples comme une vérification d’un format de date ou du nombre de caractères jusqu’aux plus complexes avec des validations par script comme la clé de contrôle du numéro de Sécurité Sociale par exemple. Flexicapture utilise également des dictionnaires personnalisés pour faciliter la reconnaissance (liste des départements, prénoms et noms français, etc.).

Avec toutes les validations, nous pouvons assurer un haut niveau de reconnaissance en toute sécurité. En cas de détection d’erreurs, Flexicapture prévient l’opérateur de vérification de données, en indiquant quel type d’erreurs a été rencontré.

Prenez contact avec nous, nous vous aiderons à définir votre projet et choisir la meilleure solution pour votre entreprise.

ESPACE CLIENTS | HOTLINE

Actualité 2026 : Sesin intègre le Groupe Infotel

En rejoignant le groupe Infotel, Sesin engage une nouvelle phase de croissance et enrichit son offre en gestion documentaire.

Opportunités d’emploi

Dans le cadre de notre croissance continue, nous renforçons nos équipes et recherchons des développeurs·euses passionné·es et motivé·es. Nous offrons des opportunités à Marseille dans plusieurs domaines.