Rechercher

(1/5) Texte juridique: du document à l'approche "data"



Les organisations soumises à des régulations toujours plus complexes ne peuvent plus conserver une approche documentaire de la norme juridique. Il leur faut passer à une démarche centrée sur la data. Voila le premier article d'une série de cinq que nous publierons dans les semaines à venir.


Un document juridique est un texte qui a un statut particulier car il est normatif, il oblige les personnes à effectuer ou non certaines actions en fonction de règles établies. C’est l’aspect « performatif » [1] du texte juridique qui est premier dans son usage et sa structuration. Cette dimension performative est portée par des éléments qui vont au-delà du texte, : auteurs, personnes visées, circonstances, processus d’élaboration et de révision : qui l’a relu, qui l’a validé, qui en a été informé.

Un document juridique est ainsi composé de :

  • Un texte ( Contenu du document, Annexes, Image / Schéma / Tableau)

  • Un contexte ou paratexte [2] (langue du document, date de création, date de publication)

  • Des références ou hypertextes (références externes, références internes)

  • Des éléments d’indexation ou métatexte (tags / thématiques, personnes ciblées)

  • Un processus de rédaction ou architexte (rédacteur, relecteurs, validateurs, consentement, preuves)

Ces différents niveaux sont présents dans n’importe quel document juridique, de manière explicite ou implicite, et peuvent être gérés sous un format papier ou texte numérisé pour un ensemble restreint et homogène de documents juridique. Mais dès lors que cet ensemble prend une certaine ampleur et devient un véritable corpus normatif, à savoir des documents mis à jour constamment, suivant des réglementations plurielles, avec des processus de validation hétérogènes et qui s’appliquent à des populations cibles différentes, la masse de données à manipuler devient trop importante pour être gérée uniquement sous format textuel.

Pour prendre en compte l’ensemble de ces éléments du corpus normatif, il faut dépasser l’approche documentaire classique pour entrer dans une approche ‘Data’ du document, où le texte est enrichi par l’ensemble des étapes du processus d’élaboration.

Après être passé du texte, à l’hypertexte (liens entre documents) puis au métatexte (indexation grâce aux tags), le corpus juridique initie une nouvelle évolution du document : l’architexte [3].

Nous explorerons ces concepts dans des articles à venir.


Nous serions heureux de discuter de vive-voix avec vous si vous le souhaitez. Contactez nous ici.


Pauline Armary est data analyst chez Legalcluster. Après des études littéraires et philosophiques, elle a mis son expertise du clustering par ressemblance au service de la digitalisation des opérations juridiques et conformité


[1] J. L. Austin, Quand dire, c’est faire, 1962

[2] Terminologie des niveaux de lecture d’un texte reprise à G. Genette, Palimpseste, 1982

[3] Ce terme a été repris à la terminologie définie par Gérard Genette dans Palimpseste. Il recouvre dans notre proposition tous les éléments normatifs qui permettent de définir un texte comme un texte juridique. Par extension, cette nomination a été retenue pour l’élément central de l’architecture de Legalcluster.