Extraction Automatique de l'Information Juridique
Encadrant
Marie BONNIN
Jihad ZAHIR
Jihad ZAHIR
Financement
IRD
Date de fin de stage
Juin 2022
Résumé
L’extraction d’informations (IE) est un domaine du traitement du langage naturel (NLP) dédié à l’obtention d’informations ou des données spécifiques à partir de textes non structurés ou semi-structurés. Lors de ce stage chez l’INSTITUT DE RECHERCHE POUR LE DEVELOPPEMENT (IRD), nous avons travaillé sur l’extraction d’information plus précisément sur l’extraction des métadonnées (titre du document, le numéro du document, la date d’application, pays établissant la réglementation, le type de document, etc.), les articles et leurs types (définitions, interdictions, sanctions), les activités interdites, les amendes à payer, etc. et de stocker ces informations dans une base de données qui sera utilisée pour les études futures. Et à la fin nous avons fourni une application (Streamlit) qui permet à l’entreprise de réaliser ces différentes tâches. Notre approche utilise les expressions régulières et les règles de base. Nous avons principalement travaillé sur quelques documents juridiques concernant les sacs plastiques des 4 pays qui sont la France, Le Monaco, le Maroc et la Tunisie. Ces documents ont été collectés sur les sites ecolex.org et faolex.org qui disposent des bases de données publiques contenant des documents juridiques de plus 200 pays chacune.
Les principales contributions de ce stage sont :
• Permettre de faire une analyse rapide, par exemple voir quels sont les pays qui ont une juridiction stricte sur les sacs plastiques, ou le nombre de documents sur les sacs plastiques par pays.
• Permettre de faciliter et gagner du temps en lecture du droit.
• Avoir une base de données pour les futures études.
Les principales contributions de ce stage sont :
• Permettre de faire une analyse rapide, par exemple voir quels sont les pays qui ont une juridiction stricte sur les sacs plastiques, ou le nombre de documents sur les sacs plastiques par pays.
• Permettre de faciliter et gagner du temps en lecture du droit.
• Avoir une base de données pour les futures études.
Mahamadou GOLOMANTA
Étudiant