Test de l'analyse des factures fournisseurs

Cette onglet permet de tester l'analyse d'un ensemble de factures fournisseurs contenu dans un répertoire sur votre pc.

Cette analyseur n'est pas encore mis en service. Pour l'instant  il est en test

Statistiques 

L'analyse est générique et basée sur des expressions régulières appliqué sur la traduction en fichier texte avec pdftotext . (option layout!). Apres l'analyse un contrôle des valeurs est effectué et les anomalies sont enregistrées dans le membre CodeWarning .

Un clic sur le nom du fichier vous permet d'afficher le fichier et sa version texte à droite.

Cf les spécification dans le wiki (bouton ci-dessus)

Gestion du développement

Les fichiers utilisés pour la mise au point sont sous  le repertoire provider de ce composant  : gma.root/docanalysis/accounting_regex . Ces fichiers sont donc embarqué dans git avec le dev .

Il faut y déposer les fichiers pdf pour lesquels vous voulez faire une adaptation.  

A chaque exécution, vous avez les tests de non regression sur tous les fichiers déjà présents.  Les valeurs exactes sont enregistré dans un fichier .OT de même nom.

Il suffit de cliquer sur les données pour initialiser le fichier avec les données calculées par l'algorithme.  Vous devez ensuite corriger les erreurs  manuellement en éditant le fichier.  

ATTENTION comme le fichier est corrigé à la main il ne faut pas écraser les données des fichiers déjà traité. 

Si une valeur n'existe pas il faut mettre '???' comme valeur de référence dans le fichier OT. 

Si l'analyse est complète par rapport au fichier .OT on affiche OK .  Si une valeur ne peut être extraite (pas présente ou dans une image ou  impossible à analyser raisonnablement, il faut ajouter une explication à la suite de la valeur.  L'analyse maque alors le fichier avec le code Vu . Le texte de votre explication est affiché en tooltip sur la valeur.

Une fois vos modifications terminées, un clic sur les data de votre fichier permet d'enregistrer les valeurs de référence dans un fichier .OT pour les prochains tests de non régression.

Nb. Err.   :    nb de divergence avec les fichiers de référence OT.

Err. NoW :    nb d'erreur sans warning .Ces erreurs sont bien sur à éviter au maximum.

Fichier Ok :     toutes les valeurs sont Ok et on été vérifiées et son Ok

Fichier Vu :  Toutes les valeurs sont ok ou impossible à analyser.