(C) Markus Mainka/Shotshop.com
Les textes juridiques peuvent être lus sur Internet, mais ils sont rarement utilisés de manière interactive. Les experts ont développé une technologie pour résoudre le problème.
Par le passé, les lois et règlements étaient écrits uniquement dans le but d'être lus par des humains et non analysés par des machines. Pour cette raison le Service central de législation (SCL) du ministère d'État s'est associé à l'Interdisciplinary Centre for Security, Reliability and Trust (SnT) de l’Université du Luxembourg afin d'élaborer des technologies de traitement de textes juridiques avancées qui amélioreront considérablement la façon dont les citoyens, tout comme les experts juridiques, pourront utiliser les lois et règlements et interagir avec ceux-ci.
Le projet de collaboration entre le SCL et le SnT, également soutenu par Digital Lëtzebuerg, a déjà commencé à porter ses fruits. Au début de l'année 2017, le SCL a donné un élan majeur à « LegiLux », le portail juridique numérique qui permet aux citoyens luxembourgeois d'accéder aux informations juridiques, y compris au Journal officiel du Grand-Duché. La collaboration entre le SCL et le SnT a joué un rôle central dans le traitement des codes juridiques en vigueur et leur conversion dans le format utilisable sur le web analysable par ordinateur déployé par le nouveau site LegiLux.
Les visiteurs du site LegiLux sont le grand public, mais aussi le personnel administratif et des publics plus spécifiques dans les professions juridiques. Depuis son lancement en janvier 2017, le nouveau site LegiLux a enregistré plus de 12 millions de visiteurs et comptabilisé plus de 13 millions de recherches.
Formats permettant uniquement d'imprimer ont des options limitées
Traditionnellement, LegiLux, comme d'autres portails juridiques nationaux partout dans le monde, s'appuyait sur des formats qui permettent uniquement d'imprimer, tels que les PDF, pour la publication et la diffusion de documents juridiques. « On sait depuis longtemps que les formats permettant uniquement d'imprimer sont assez limités lorsqu'il s'agit de développer des services juridiques intelligents et interactifs. Nous avons besoin de formats souples qui supportent non seulement le mode de travail classique avec des textes juridiques mais aussi des formes d'interaction plus avancées et assistées par ordinateur » explique John Dann, directeur du SCL.
« Les nouvelles technologies peuvent apporter une valeur ajoutée en générant automatiquement des enseignements et des analyses utiles à partir de documents juridiques. Connecter différentes sources d'information telles que la législation et les statistiques ou des données GPS est aujourd'hui devenu un objectif réalisable. Pour tirer profit de ces technologies, nous devons nous concentrer sur des formats analysables par ordinateur présentant des renseignements explicites intégrés sur la structure et la sémantique du contenu juridique » poursuit-il.
Un nouvel outil détecte automatiquement les éléments structurels des textes juridiques
L'une des questions clés qui se posent est de savoir ce qu'il faut faire des milliers de pages de codes juridiques existants. « Transformer manuellement le corpus juridique de tout un pays à partir d'un texte brut dans un format numérique lisible par machine n'est pas une mince affaire, surtout si l'on tient compte de tous les renvois aux articles juridiques qui relient les différentes dispositions. Pour dire les choses simplement, effectuer cette tâche manuellement tout en maintenant la qualité est extrêmement coûteux et long » explique le Dr Mike Sabetzadeh, chercheur principal attaché au projet.
C'est pourquoi une équipe de chercheurs comprenant le Dr Nicolas Sannier, le Dr Mike Sabetzadeh et le professeur Lionel Briand a développé un outil appelé ARMLET. ARMLET, qui utilise un traitement automatique du langage naturel complexe, détecte automatiquement les éléments structurels des textes juridiques (chapitres, articles, paragraphes par exemple) et crée un document comportant des liens navigables pour les renvois. « Nous avons déjà utilisé ARMLET durant le déploiement du nouveau site LegiLux. À titre d'exemple, le code civil est désormais disponible dans une présentation moderne comportant des renvois navigables. Grâce à la solution ARMLET, 90 % du travail de structuration, qui est une tâche longue et répétitive, a déjà été mis en œuvre. Au fil du temps, notre objectif est d'utiliser cet outil pour transformer la plupart des codes juridiques au Luxembourg » explique John Dann.
Harmoniser la représentation des textes législatifs au sein de l'Union Européenne
Le Luxembourg est depuis longtemps à l'avant-garde en matière de formats utilisables sur le web pour les textes juridiques. Plus spécifiquement, John Dann est le fondateur et le principal artisan de l'Identifiant Européen de la Législation (European Legislation Identifier, ELI). « ELI est une structure d'appellation intuitive des éléments sémantiques de textes juridiques, les renvois constituant un exemple de ces éléments. ELI est par essence indépendant des pays et des juridictions. ELI nous permettra finalement d'harmoniser la représentation des textes législatifs au sein de l'Union Européenne, de sorte qu'ils pourront être reliés sans problème » explique J. Dann.
« Avec l'aide de John [Dann] et de son équipe du SCL, nous souhaitons étendre notre expertise et proposer les solutions que nous avons développées pour d'autres pays. Dans cette perspective, nous œuvrons désormais pour une technologie modulable permettant de transformer automatiquement et avec précision des textes juridiques de référence en un format numérique moderne » déclare le professeur Briand, vice-directeur du SnT et chef du laboratoire de validation et de vérification du logiciel (SVV), unité de recherche du SnT qui collabore avec le SCL.
Seulement le début de ce qui promet d'être une activité de recherche longue et fructueuse
Pour la prochaine étape, le SCL et le SnT étudient la meilleure façon d'appliquer leurs outils au domaine de la conformité juridique. « Le fait que les conditions devant être satisfaites pour atteindre cette conformité ne sont souvent pas formulées de façon à pouvoir être interprétées par ordinateur constitue une source de difficulté majeure. Nous utilisons le traitement automatique du langage naturel et des techniques d'apprentissage automatique pour extraire automatiquement les exigences de conformité des textes juridiques et transformer ces exigences en règles précises » explique le Dr Sabetzadeh.
« Outre le soutien financier à long terme généreux du Fonds National de la Recherche (FNR), le laboratoire de validation et de vérification du logiciel bénéficie amplement de notre collaboration étroite avec des partenaires de l'industrie et du secteur public dans tous nos projets. Les résultats de notre collaboration avec le SCL constituent un excellent exemple de ce que nous avons pour ambition de réaliser par la recherche. Ce que nous avons fait jusqu'à présent est seulement le début de ce qui promet d'être une activité de recherche longue et fructueuse » précise le professeur Briand.
Photo: Markus Mainka/Shotshop.com