Confidentialité et anonymat

confidentitalité et sécurité des données E4N

Toutes les précautions ont été prises pour garantir la confidentialité absolue des données que les volontaires acceptent de transmettre à l’étude E3N-Générations (anciennement étude familiale E3N-E4N).

Confidentialité et anonymat

Dans le cadre d’une étude épidémiologique, un principe est fondamental : les informations communiquées par les volontaires sont strictement confidentielles. Dans la mesure où l’intérêt de la cohorte E3N-Générations réside dans un suivi sur une très longue durée des participants, elle ne peut cependant pas être strictement anonyme, puisque l’actualisation des données exige que les questionnaires d’un même participant puissent être reliés entre eux. En outre, il faut être en possession des coordonnées des participants pour pouvoir les contacter par courrier postal (envoi de questionnaires, kit salive, etc.), par email, voire par téléphone. Il est donc indispensable de mettre en place et de garantir des procédures hautement sécurisées pour le recueil, le stockage et le transfert des données.

L’équipe en charge de l’étude E3N-Générations a toutes les compétences nécessaires pour gérer des données confidentielles selon les règles des bonnes pratiques scientifiques de l’Association des épidémiologistes de langue française (« Recommandations en épidémiologie de l'Adelf ») et elle a par ailleurs acquis une expertise solide avec 34 ans de gestion des données de la cohorte E3N.

Hébergement et sécurisation des données

1ère génération - G1

Pour assurer la sécurisation de ces données, l’équipe E3N-Générations a attribué aléatoirement un numéro unique (identifiant E3N) à touts les volontaires de la 1ère génération. Cet identifiant unique a été attribué à chacun d'entre eux lors de l'envoi du premier questionnaire (en 1990 pour les femmes G1, à partir de 2014 pour les hommes G1).

Dans une première base de données se trouvent l’identité et les coordonnées des volontaires G1, ainsi que leur identifiant E3N. Cette base de données est la seule à faire le lien entre le nom des volontaires et leur identifiant. Elle est installée sur un serveur indépendant, isolé du reste de l’infrastructure informatique. Son accès est limité aux seuls membres habilités de l’équipe de recherche E3N-Générations.

Une seconde base de données, celle à partir de laquelle les recherches de l’équipe sont menées, rassemble toutes les données épidémiologiques des volontaires G1 de la cohorte E3N-Générations. Les réponses aux questionnaires successifs sont rattachées à leur identifiant, sans aucune indication nominative. Ce dispositif assure une exploitation, à des fins statistiques et épidémiologiques, complètement confidentielle des données de l’étude par les chercheurs autorisés à les exploiter.

Les données ainsi collectées sont stockées sur des serveurs sécurisés agréés pour l'hébergement des données de santé, à Gustave Roussy, et bénéficient de tous les outils de protection de l’hôpital, qui gère en permanence des données médicales sensibles.

2eme génération - G2

Les données brutes que nous recueillons sur notre plateforme de questionnaires (développée par la société Gide) sont hébergées sur des serveurs certifiés pour l'hébergement de données de santé (HDS), norme qui impose de nombreuses contraintes pour assurer la sécurité des données de santé.

Pour l'analyse scientifique des données et le suivi de l'étude, les données collectées sont ensuite sauvegardées et stockées sur des serveurs dédiés au sein de l'infrastructure de la cohorte E3N-Générations hébergée par l'Institut Gustave Roussy, l'hôpital où nous avons nos locaux. Ces serveurs sur lesquels nous travaillons au quotidien bénéficient ainsi de tous les moyens de protection de l’hôpital, qui gère en permanence des données médicales sensibles.

Protection des données identifiantes

Un des principes qui guide notre travail est la protection de vos données identifiantes (nom, prénom, coordonnées). Parmi les nombreuses mesures prises, ces données identifiantes sont stockées sur un serveur séparé de vos réponses aux questionnaires et donc de vos données de santé. Vos données de santé sont pseudonymisées (vos informations directement identifiantes comme les noms et prénom n'y apparaissent pas) et même votre identifiant E3N-Générations, attribué aléatoirement, est transformé par une clef de hachage.

Seule une petite équipe interne est habilitée à accéder aux serveurs contenant des informations nominatives, comme le rappelle la notice d'information, document qui nous engage juridiquement. Elles servent uniquement au suivi de la cohorte, pour pouvoir envoyer des emails d'invitation à remplir des questionnaires ou dépanner les participants qui rencontrent des difficultés de connexion ou de remplissage. Les seuls personnels habilités (moins de dix) sont tous membres de notre équipe de recherche Inserm U1018 Exposome et hérédité.

Les chercheurs, même internes, et les statisticiens qui les aident, reçoivent eux des données déjà pseudonymisées pour leurs analyses scientifiques. Ils n'ont pas accès à votre identité.

Pour les éventuelles collaborations avec des chercheurs externes (autres équipes Inserm ou universitaires, par exemple), le partage de données pseudonymisées avec ces chercheurs externes doit faire l'objet d'une information aux participants via notre site e3n-generations.fr pour vous permettre de retirer votre consentement ou faire l'objet d'un consentement spécifique. Les participants seront donc dûment informés dès qu'une telle collaboration scientifique pouvant concerner leurs données sera envisagée.