Neuropsychiatrie Imputation multiple des données manquantes en recherche épidémiologique et clinique: potentiel et pièges

Imputation multiple des données manquantes en recherche épidémiologique et clinique: potentiel et pièges

Les données manquantes sont inévitables dans la recherche épidémiologique et clinique mais leur potentiel à miner la validité des résultats de la recherche a souvent été négligé dans la littérature médicale .1 Cela tient en partie au fait que les méthodes statistiques permettant de résoudre les problèmes découlant des données manquantes n’ont, jusqu’à récemment, pas été facilement accessibles aux chercheurs médicaux. Cependant, l’imputation multiple est une approche relativement souple et polyvalente pour traiter les données manquantes. Elle est maintenant disponible dans un logiciel statistique standard, 2

3

4

5 permettant de gérer les données manquantes semiroutinely. Les résultats basés sur cette méthode de calcul intensif sont de plus en plus rapportés, mais ils doivent être appliqués soigneusement pour éviter des conclusions trompeuses. Dans cet article, nous passons en revue les raisons pour lesquelles les données manquantes peuvent conduire à des biais et des pertes d’information. Nous discutons des circonstances dans lesquelles l’imputation multiple peut aider en réduisant le biais ou en augmentant la précision, ainsi qu’en décrivant les pièges potentiels dans son application. Enfin, nous décrivons l’utilisation récente et les rapports d’analyses utilisant l’imputation multiple dans les revues médicales générales, et suggérons des lignes directrices pour la conduite et la présentation de telles analyses acheter.