En France, dans le cadre du mouvement accéléré par la loi sur une République numérique, l’Open Data pose de manière sensible la nécessité de trouver des solutions pertinentes d’anonymisation des décisions de jurisprudence.

Mais plus largement encore, l’enjeu de l’anonymisation se pose au final sur l’ensemble des documents comportant des données nominatives, que ces derniers soient des documents publics ou privés (appartenant à des entreprises par exemple).

Le développement des traitements Big Data permettant d’extraire des noms de personnes et de fonctions, et de détecter ainsi des liens de responsabilités entre des entreprises, des collectivités, des associations et bien d’autres structures encore…, nécessite, pour le bien de la protection des données personnelles, de mettre en place des solutions d’anonymisation robustes et efficaces, dans une équation économique raisonnable.

S’appuyant sur sa longue expérience sur l’anonymisation des décisions de jurisprudence des Cours d’appels, mais également des décisions de la Cour des Comptes, des Chambres régionales de la Cour des Comptes, des Cours administratives d’appel et de décisions de tribunaux de grandes instances, Numen a 3 convictions :

  • Les automates de text-mining ne permettent pas d’obtenir une solution d’anonymisation optimale, les procédés de machine learning sont nécessaires.
  • Le full automatique est un mythe, le challenge est dans la minimisation de l’intervention humaine.
  • Des flux gratuits de données complètement anonymisées coexisteront avec des flux payants non anonymisés destinés aux analystes.

En tant qu’entreprise d’ingénierie documentaire experte en structuration et extraction de data contenues dans les documents, Numen Digital propose un service d’anonymisation complet qui intègre un algorithme ultra-performant permettant une très large automatisation. L’environnement est full web, accessible quel que soit le lieu, pour laisser au détenteur de fonds la possibilité de traiter les doutes repérés, afin d’assurer une qualité d’anonymisation optimale et mesurable.