Bases de données et jurisprudence

Connaissez-vous https://www.data.gouv.fr et l’OpenData ?

Non ? Cela ne vous dit rien ?

Depuis 2005, la loi relative à la liberté d’accès aux documents administratifs et à la réutilisation des informations publiques, prévoit la possibilité de réutiliser les informations publiques à d’autres fins que celles pour lesquelles elles sont détenues ou élaborées.

Les données publiées sur le site « data.gouv.fr » sont des données publiques produites ou reçues dans le cadre d’une mission de service public : impôts, budgets mais aussi des statistiques concernant le territoire (tourisme, pollution, …), les effectifs, etc.

Le site « data.gouv.fr » a également l’ambition d’être un outil à la disposition des citoyens pour leur permettre de produire, d’enrichir ou de compléter ces données ou de partager des données d’intérêt public, qu’il s’agisse par exemple de l’inventaire d’une bibliothèque communale, de l’état de la voirie, de la composition nutritionnelle de produits alimentaires ou du bilan environnemental d’une entreprise. Je vous invite en complément à prendre connaissance des conditions auxquelles l’usage de ces données reste soumis.

Dans le cas présent, ce sont les bases de données à coloration « juridique », plutôt axées sur la jurisprudence, qui m’ont intéressé.

Dans ce domaine, celles proposées par data.gouv.fr sont nombreuses et il y en a pour tous les goûts :

  • INPI
    Jurisprudence et Décisions d’opposition
    Jurisprudence judiciaire française (Brevets, Marques, Dessins et Modèles) avec les décisions d’oppositions (marques françaises)
  • Cour des Comptes
    Jurisprudence anonymisée de la Cour des comptes (2006-2008 et 2010-2015)
    Dans le cadre de sa #DataSession des 27 et 28 mai 2016, les juridictions financières ont décidé d’ouvrir en open data le texte intégral de leur jurisprudence.
  • CAPP
    Ce fonds documentaire de jurisprudence des cours d’appel et des juridictions de premier degré est composé d’une sélection de décisions en matière civile et pénale. La sélection des décisions est effectuée par les juridictions selon le décret n° 2005-13 du 7 janvier 2005.
  • INCA
    Les arrêts inédits (non publiés au Bulletin) sont diffusés par le fonds de concours de la Cour de cassation depuis 1989.
  • JADE
    Les décisions du Conseil d’Etat, des cours administratives d’appel et du tribunal des conflits. Pour le Conseil d’État : les « grands arrêts » fondateurs du droit administratif ; les décisions publiées au Recueil officiel des décisions du Conseil d’Etat (recueil Lebon) depuis 1965 ; une sélection de décisions.
  • CASS
    Les grands arrêts de la jurisprudence judiciaire ; les arrêts de la Cour de cassation : publiés au Bulletin des chambres civiles depuis 1960, publiés au Bulletin de la chambre criminelle depuis 1963. Texte intégral des arrêts complété par des titrages et des sommaires rédigés par les magistrats.
  • Cour de discipline budgétaire et financière (1954-2015)
    Arrêts de la Cour de discipline budgétaire et financière (1954-2015)

Comment exploiter tout ceci ?

L’idée n’est bien sûr pas de concurrencer las bases professionnelles de jurisprudence, ni même Légifrance, mais pourquoi ne pas monter un outil permettant d’expérimenter des pistes de recherches aujourd’hui toujours perfectibles ?

Dans un premier temps, je me suis concentré sur le fonds proposé par la Cour de Cassation (CASS), plus précisément les chambres civiles et commerciale pour un début.

Les jeux de données se trouvent à l’adresse suivante : https://www.data.gouv.fr/fr/datasets/cass/Ces données proviennent d’un service public certifié et fournit les grands arrêts de la jurisprudence judiciaire ; les arrêts de la Cour de cassation :

  • publiés au Bulletin des chambres civiles depuis 1960 (mais j’en ai trouvés des plus anciens),
  • publiés au Bulletin de la chambre criminelle depuis 1963,
  • Texte intégral des arrêts complété par des titrages et des sommaires rédigés par les magistrats de la Cour de Cassation.

Ce dernier point apparait assez intéressant pour les juristes : la plupart de ces arrêts (mais pas tous malheureusement) sont en effet accompagnés de sections  analyse et sommaire rédigées par les magistrats eux-mêmes.

Pour la Cour de Cassation, les arrêts sont disponibles sous la forme de fichiers au format XML.

J’ai d’abord conçu un petit utilitaire qui parcourt automatiquement tous les répertoires où sont placées toutes les décisions récupérées, analyse les éléments significatifs des arrêts, leur url, génère le cas échéant un index des mots signifiants les plus utilisés dans le texte et accumule ces éléments dans un fichier agencé au format csv. L’idée étant de réimporter le tout (mais sans le contenu de la décision elle-même) au sein d’une base MySql pour pouvoir être exploité d’une manière plus pratique.

La tâche n’en reste pas moins conséquente car c’est bien dans cette partie d’organisation ou d’indexation de certains mots discriminants (voire de notions …)  que se cache l’une des parties des plus intelligentes de l’application qui reste à construire.

Précisons aussi, au chapitre « loisir » que, dans l’idée d’économiser dans le volume de la base de données, le texte intégral de l’arrêt reste là où il est dans mon répertoire, sans modification, au format XML, et n’est pas ajouté dans la base. Seule la référence (l’url de la décision) est mémorisée.

Une autre piste réside peut-être dans l’exploitation des données pour constituer un index de recherche pertinent, en se contentant de cibler ensuite directement la décision sur le site de Légifrance, ce qui serait tout aussi, voire plus, efficace (j’ai ajouté un lien pour cela dans les résultats de la recherche).

Dans un premier temps (pour mon hébergement web actuel, en attendant mieux), l’outil pour exploiter tout cela est simplement une application web en PHP/jQuery. Celle-ci sert d’interface avec les données, par le biais de requêtes SQL vers la base MySql qui lui restitue des liens et un résumé de la décision quand celui-ci est disponible. Une petite routine fait qu’un clic sur le lien fourni déclenche la conversion dynamique nécessaire, par le biais d’un fichier XSLT, du fichier source XML en affichage exploitable par un utilisateur humain.

Tout n’est pas encore achevé et il reste une tonne de choses à faire, bien sûr ! Aussi, je vous donne rendez-vous ici-même pour la suite (notamment le mode d’emploi de l’application en lien ci-dessous … si vous essayez, n’oubliez pas de cliquer sur le bouton « Chercher » pour voir le résultat ) !

Vos commentaires à cet article sont les bienvenus ! et si vous avez des idées sur l’application aussi !

Vous pouvez aller tester une première version de l’application en ligne ICI ! (n’oubliez pas de cliquer sur « Chercher » pour que ça marche !). Mode d’emploi en cours …

 

Publicités
Publié dans droit, Informatique | Laisser un commentaire

Une application web sur les biorythmes

Cette galerie contient 8 photos.

Connaissez-vous les biorythmes ? J’ai conçu une petite application en ligne plutôt destinée aux smartphones (mais pas seulement) qui joue avec les arts divinatoires mais avec de jolies formules et des courbes en couleurs 🙂 Lien de l’application : BioMove Les biorythmes … Lire la suite

Galerie | Tagué , , | Laisser un commentaire

Une appli pour la réforme du droit des contrats, du régime général et de la preuve des obligations

Cette galerie contient 17 photos.

A compter du 1er octobre 2016, une importante réforme du droit des contrats, du régime général et de la preuve des obligations est initiée par l’ordonnance n° 2016-131 du 10 février 2016. Elle se traduit notamment par un gros remaniement … Lire la suite

Galerie | Tagué , , , , , , | 3 commentaires

Adobe Reader XI plante au démarrage

Un proche me demande de « nettoyer » son PC portable ASUS sous Windows 7 64bits. Au cours de la manoeuvre et de diverses désinstallations, je décide d’installer Adobe Reader sur la machine pour que la personne qui en est propriétaire puisse … Lire la suite

Galerie | 117 commentaires