Centre d’accès sécurisé aux données


Créé en 2010, le CASD est une entité du GENES qui a développé un équipement conçu pour permettre aux chercheurs, data scientists, consultants, etc. de travailler sur des données individuelles très détaillées, soumises à la confidentialité, dans des conditions de sécurité élevées.

Le projet est né de la conjugaison des forces de deux acteurs incontournables dans l’analyse des données : l’Insee, guidé par sa mission de service public et son exigence éthique, et le GENES qui apporte l’excellence de ses deux grandes écoles et de son centre de recherche. Pour envisager l’ouverture des données administratives françaises à des fins de recherche scientifique dans les meilleures conditions de sécurité, de réactivité et de souplesse, les équipes du CASD ont intégré les limites et les faiblesses des expérimentations conduites dans d’autres pays et en ont tiré les enseignements nécessaires.

Le CASD fournit aujourd’hui un service fondé sur un équipement technique dédié qui garantit des conditions optimales de sécurité. Situé au point de rencontre entre le système d’information et le métier de data scientist, le Centre offre une triple expertise – sécurité informatique, conception et mise en œuvre d’infrastructures de calcul et de gestion de données, paramétrage et optimisation des logiciels de traitement statistique – au monde de la recherche scientifique dont il est issu.

Le projet CASD est l’un des lauréats de l’appel à projet Equipex 2011 lancé dans le cadre du programme Investissements d’avenir. Le projet a été développé par un consortium réunissant des acteurs de premier plan : le GENES, l’Insee, le GIS Quételet, l’ENS Cachan, l’Ecole Polytechnique et HEC.

 

Données clés

  • Une équipe de 27 personnes réparties en 5 pôles
  • 157 sources de données représentant 1393 produits
  • 500 projets depuis 2010
  • 1569 utilisateurs représentant 234 organisations publiques et privées en France et à l’étranger


Accès sécurisé aux données : la technologie du CASD rassure

Six ans après sa création, le CASD s’est imposé comme une référence dans le monde très sensible et complexe de la sécurisation des données. Très proche du milieu de la recherche scientifique, ses équipes anticipent les besoins, innovent et contribuent à bâtir un cadre réglementaire compatible avec une société numérique à la fois ouverte et protectrice.

Si les données individuelles produites par la sphère publique sont de plus en plus nombreuses et à forte valeur ajoutée d’un point de vue scientifique, leur utilisation restait jusqu’ici difficile pour des raisons de confidentialité. Lancée en 2010, la technologie du CASD – une bulle hermétique accessible à distance par un boitier dédié « la SD-Box » embarquant un système d’authentification biométrique – garantit des conditions optimales de sécurisation des données. Longtemps réticentes au partage de leurs fichiers, les administrations semblent avoir trouvé avec le CASD le tiers de confiance qui leur manquait. « Notre dispositif a fait ses preuves et rassure » explique Kamel GADOUCHE. Une fois identifié et connecté grâce à sa SD-Box©, l’utilisateur retrouve l’interface familière d’une station de travail, mais il n’a accès qu’aux données pour lesquelles une autorisation lui a été accordée. Impossible d’imprimer, d’insérer une clé USB, d’accéder à internet ou de faire un copier-coller » poursuit le directeur du Centre qui revendique ainsi 157 sources de données issues de l’Insee, de l’éducation, de l’agriculture, de la justice, de l’administration fiscale… Depuis mars 2016, certaines données de santé font également partie des ressources accessibles, l’Agence technique de l’information sur l’hospitalisation (ATIH) ayant choisi le CASD pour assurer la protection des microdonnées qu’elle diffuse (voir ci-dessous).

Nouveaux usages et synergie public-privé

Côté utilisateurs, la demande est également en forte hausse : 1569 utilisateurs ont été « enrôlés* » dans le cadre de 500 projets depuis 2010, avec une hausse de 30% du nombre de projets accueillis en 2016. 80 % des utilisateurs sont issus d’institutions publiques et 20 % d’organisations privées, de grands groupes présents dans l’énergie, le transport, la banque ou l’assurance. Dans sa bulle hermétique, grâce à large gamme de logiciels, l’utilisateur peut analyser, traiter, croiser les données avec plusieurs sources et collaborer à distance avec des utilisateurs d’autres pays impliqués sur le même projet. « Il y a une vraie diversification des usages de notre technologie et notamment l’émergence de synergies nouvelles sur des projets public-privé de type Big Data » observe Kamel GADOUCHE.

La Loi numérique de 2016 pour cadre

Un mouvement qui devrait encore s’amplifier avec la Loi pour une République numérique à laquelle le CASD a apporté ses retours d’expérience et son expertise. Promulguée le 7 octobre 2016, elle « promeut l’innovation et le développement d’une société numérique ouverte, fiable et protectrice des droits des citoyens » et prévoit notamment de faciliter l’accès sécurisé aux données pour les chercheurs et statisticiens publics grâce à des technologies comme celle proposée par le CASD. L’évolution de ce cadre règlementaire constitue un levier important sur le nombre de travaux de recherche qui pourront être conduits via le CASD dans les années à venir. Cette simplification juridique rend également plus aisés les appariements sur la base du numéro de sécurité sociale (NIR) pour les projets de recherche. Le CASD a ainsi été désigné comme tiers de confiance sur trois opérations d’appariement en 2016 et plusieurs projets sont déjà en cours de discussion pour 2017.

*Une formation de 3 heures qui pose le cadre juridique et technique de l’utilisation de la technologie du CASD et des données sensibles mises à disposition des utilisateurs habilités.

Santé, travail, environnement : de nouvelles données accessibles

Après une phase d’expérimentation menée en 2014 et 2015, l’Agence technique de l’information sur l’hospitalisation (ATIH) a retenu en 2016 le CASD pour assurer la mise à disposition sécurisée des données issues du Programme de médicalisation des systèmes d’information (PMSI), qui constitue l’un des plus importants gisements de données dans ce domaine, tant en volume qu’en termes de contenu. La Direction de l’animation de la recherche, des études et des statistiques (DARES) du Ministère du Travail et le Ministère de l’Ecologie ont également rejoint en 2016 la communauté des producteurs de données accordant leur confiance au CASD pour la mise à disposition sécurisée de leurs données.

EN 2016, BNP Paribas et Edenred choisissent le CASD

Le groupe bancaire international (30 millions de clients dans 74 pays, 190 000 employés) et le leader mondial des solutions transactionnelles au service des entreprises, des salariés et des commerçants (Tickets Restaurants©, Kadeos©…) ont également choisi le CASD afin d’ouvrir l’accès à leurs données à forte valeur ajoutée pour leurs activités respectives. Edenred a notamment expérimenté un projet Big Data sécurisé en utilisant la technologie du CASD associée à l’expertise en datascience de DATASTORM.

Des utilisateurs satisfaits des services

Dans un souci d’amélioration continue de ses services, le CASD a mené une enquête de satisfaction en ligne du 24 octobre au 25 novembre 2016 auprès de ses utilisateurs. Résultat : deux-tiers d’entre eux jugent la qualité de service au-dessus de 7/10 tandis que 20 % des répondants lui ont attribué une note de 10/10. Si l’indice de satisfaction globale progresse de 0.7 points (6.9 à 7.6) par rapport à la précédente enquête menée en 2014, le CASD compte poursuivre ses efforts via notamment le développement de nouveaux outils de communication. Retrouvez tous les résultats de l’enquête.