Automatiser l'illisible avec la GenAI

Domaine
Fintech
Expertise
Product Management & IA
Durée
1 an
Contributeur•trice
Raphaël Bellalou

Contexte

Quand le papier devient un goulot d’étranglement

Tout commence dans le back-office d'un établissement de paiement. Chaque mois, c’est le même rituel : des milliers de courriers arrivent. Ce sont des saisies administratives (DGFIP, Douanes, amendes). Pour cette Fintech, c'est une obligation légale de traiter ces dettes mais pour les équipes c’est un enfer logistique.

Le processus est resté bloqué à l'ère du papier : réception des courriers, scans, puis des gestionnaires qui passent une partie de leur temps à "apparier" manuellement les courriers avec le bon client dans la base de données. Une tentative d’automatisation avait été mise en place avec l’OCR, une technologie qui permet de lire automatiquement du texte à partir de documents scannés. Mais face à la diversité des formats et au manque de standardisation, ses limites apparaissaient rapidement. L’extraction ne fonctionnait plus dès qu’un document sortait un peu du format attendu.

On se retrouve alors avec un processus vieillissant, difficile à faire évoluer et qui freine le quotidien des équipes bien qu’essentiel.

Objectifs

Automatiser la compréhension, pas seulement la lecture

  • Dans ce contexte, Raphaël s’est donc tourné vers la Gen AI pour sortir d’un système qui sait lire mais ne comprend pas. L’enjeu n’est pas simplement d’extraire du texte, mais de permettre au produit d'identifier les bonnes informations, même quand les documents ne respectent aucun standard.L’ambition de Raphaël est double :
    • Fiabiliser : Automatiser l’extraction des données pour supprimer les erreurs de saisie liées à la répétition.
    • Libérer : Redonner de l’air aux équipes en les sortant des tâches répétitives pour qu’elles se concentrent sur les dossiers demandant réellement une expertise métier.
    • Le tout dans un environnement où la sécurité des données est une religion.

Stratégie

Une approche produit structurée autour de la Gen AI

Plutôt que de lancer directement le développement ou de rester sur un système manuel, Raphaël a structuré son approche en deux volets : l’expérimentation brute et la diplomatie de gouvernance.

1. Le crash-test du réel (POC)

Raphaël a fait le choix de Gemini 2.5 Flash, un modèle taillé pour la vitesse et les contextes visuels variés. Mais au lieu de tester sur des cas simples, il a constitué un dataset en prenant uniquement les documents que l'ancien OCR rejetait.

  • L’affinage : Au début, l'IA s'est emmêlée les pinceaux, confondant le signataire en bas de page avec le créancier. En pilotant un travail de Prompt Engineering intensif et en fixant la température à 0, il a stabilisé l’extraction.
  • Le résultat : Les données sont non seulement lues, mais structurées au bon format, prêtes à être injectées dans le Back-Office.

2. Convaincre les "Gardiens du Temple"

Faire de l'IA dans un établissement de paiement, c'est savoir rassurer les comités Data, SSI et RGPD. Raphaël a défendu son projet sur deux axes :

  • L’analyse de risques : Prouver qu'une erreur mineure d'IA (ex: Se tromper de civilité dans une réponse via mail) est un risque acceptable comparé à l'erreur humaine née de la fatigue du traitement de masse.
  • La sécurisation des flux : Démontrer que le système ne génère aucun risque de perte en capital et respecte les contraintes de confidentialité les plus strictes.

Résultats

Faire du "non-structuré" un avantage compétitif

  • L’approche de Raphaël a prouvé que la Gen AI est le levier de production massif qui manquait au traitement documentaire.

Performance Technique & PrécisionViabilité Économique & ROI

  • 90% d'Accuracy sur un dataset stress-testé (documents hétérogènes)

En clair : Le modèle a été mis à l'épreuve sur les documents les plus complexes (papiers froissés, mises en page changeantes, tampons sur le texte). Résultat : 9 décisions sur 10 sont parfaitement exactes, là où les systèmes classiques échouaient.

  • Extraction native en JSON pour une injection automatisée dans le SI.

En clair : L'IA ne se contente pas de "lire", elle traduit l'image en un langage informatique structuré. Les données (nom, montant, date) sont rangées dans des cases précises, permettant au système informatique de la banque de les intégrer instantanément, sans aucune intervention humaine.

  • Capacité de traitement de documents jusque-là inexploitables par l'OCR.

En clair : Nous avons levé un verrou technologique. Les documents qui, jusqu'ici, obligeaient un humain à prendre le relais à cause de leur format imprévisible, sont désormais gérés par l'IA avec une compréhension quasi humaine du contexte.

Viabilité économique & ROI

  • +10 Jours-Homme (JH) économisés par mois, soit un gain d'efficience majeur pour le service client. (120 JH par an)
  • Coûts d'exploitation marginaux : Une facture de tokens annuelle limitée à quelques centaines d'euros pour des milliers de documents.
  • Amortissement rapide de l'investissement initial de conception et développement.

Impact Organisationnel & Humain

  • Recentrage métier : Les équipes se concentrent sur les cas complexes à forte valeur ajoutée.
  • Acculturation IA : Le projet a servi de catalyseur pour identifier d'autres projets d'inefficacité automatisables.
  • Adoption facilitée grâce à la démonstration d'un cas d'usage concret, utile et sécurisé.

Conclusion

La principale leçon tirée :

Le traitement du non-structuré n’est plus une limite technologique, mais un terrain d’innovation à fort potentiel, à condition de l’aborder avec une approche produit rigoureuse.