Popis: |
Introduction En recherche clinique, les donnees sont saisies dans des cahiers d’observations electroniques (eCRF) et stockees dans des bases dediees. Le regroupement de ces donnees permet la realisation de meta-analyses plus puissantes que chaque etude prise individuellement. Depuis 2003, 56 etudes de cancerologie ont ete promues par le centre Antoine Lacassagne (CAL) chacune permettant l’obtention de bases de donnees electroniques. La qualite et la securite des donnees de ces etudes est assuree par les « data managers » de l’unite d’epidemiologie et de biostatistiques (UEB) a l’aide du logiciel dedie Ennov Clinical®. Notre objectif est de realiser un entrepot de donnees avec toutes les bases issues de ces essais. L’interet pour l’equipe de « data management » est de renforcer le niveau de standardisation de toutes les donnees des etudes et de mettre au point une procedure informatique permettant d’agglomerer ces donnees en temps reel. L’interet pour les cliniciens et les biostatisticiens est de disposer d’une grande base de donnee fiable, requetable et analysable. Methodes Au prealable, une etude de faisabilite a ete realisee en se focalisant sur tous les essais promus par l’institution et incluant des questionnaires qualite de vie EORTC QLQ-C30. Dans chaque etude une table d’export standard de 21 variables a ete creee (une variable relative a l’identification unique du patient, trois variables de demographie, une variable de signes vitaux, cinq variables d’anatomopathologie, trois variables identifiant les visites et huit variables de qualite de vie). Chaque table d’export a ete concue en suivant les recommandations du « Clinical Data Interchange Standards Consortium » (CDISC). Les donnees ont ete exportees a partir de chaque etude puis empilees en une base de donnees unique a l’aide du logiciel SAS®. Afin de tester cette base, une analyse descriptive a ete realisee sous le logiciel R®. Resultats Seize etudes ont ete empilees : une etude de phase I, quatre de phase II, trois de phase I/II, deux de phase III et six etudes de cohorte. Ce qui correspondait a 2115 patients (31 % de femmes et 69 % d’hommes) et 7515 questionnaires de qualite de vie QLQC30. Cinq etudes (31 %) contenaient plus de 100 patients (209 a 710 patients), trois etudes (19 %) incluaient 50 a 100 patients (56 a 99 patients) et huit etudes (50 %) contenaient moins de 50 patients (14 a 46 patients). Les principales pathologies tumorales representees etaient les suivantes : sein (55 %), ORL (14 %), urologie (8 %), digestif (7 %), poumon (6 %). Les patients metastatiques representaient 12 % de la population. Conclusion Cette premiere etape de faisabilite nous permet de conclure que la creation d’un entrepot de donnees exploitables a partir des donnees des essais therapeutiques est un objectif realisable. La conception de telles bases est un travail long et rigoureux necessitant de standardiser tres precisement les variables d’interets en amont. Cette methode trouve ses limites lorsqu’un ajout de variable s’avere necessaire. La seconde etape de ce travail sera de generaliser cette methode a l’ensemble des donnees des etudes promues par l’institution et ainsi creer une grande base requetable concue comme une etude clinique unique. La standardisation de nos etudes, depuis 2014, au format CDISC permettra de simplifier ce travail. Un tel entrepot permettra la realisation d’analyses supervisees ou non supervisees plus puissantes que sur les bases de donnees des etudes initiales. |