Prévision des risques de cancer sur la base des données sanitaires nationales
Si les cancers sont détectés à un stade précoce, les chances de guérison sont généralement plus élevées
Si les cancers sont détectés à un stade précoce, les chances de guérison sont généralement plus élevées et les patients ont besoin d'un traitement moins intensif. Cependant, les programmes de dépistage précoce du cancer n'existent que pour quelques maladies tumorales, et toutes les personnes ne profitent pas de ces offres.
S'il existait un moyen simple de filtrer les personnes présentant un risque très élevé de développer un cancer, des programmes de dépistage pourraient être développés spécifiquement pour les personnes à risque. Des chercheurs dirigés par Moritz Gerstung du DKFZ et de l'Institut européen de bioinformatique EMBL-EBI, à Hinxton (Royaume-Uni), viennent de publier une étude de faisabilité sur ce sujet. Les data scientists ont utilisé les données complètes du registre danois de la santé, dans lequel sont stockés tous les diagnostics cliniques de la population, pour quantifier les risques individuels de maladie pour 20 types de cancer différents.
Les chercheurs ont d'abord formé un modèle de prédiction sur les données de 6,7 millions de Danois adultes entre 1995 et 2014. L'ensemble des données d'entraînement comprenait plus de 1 000 diagnostics antérieurs différents, ainsi que le cancer chez les membres de la famille, l'âge et - lorsqu'elles étaient disponibles - les données corporelles de base et les facteurs de risque tels que la consommation de tabac ou l'obésité.
Le modèle a ensuite été validé sur les ensembles de données de 2015 à 2018, couvrant 4,7 millions de Danois, et a fourni un niveau élevé de précision prédictive. Le modèle permet de prédire les risques individuels de développer 20 types de cancers différents. Au cours d'une vie, le modèle a atteint une précision de 81 %. En tenant compte des effets de l'âge et du sexe, la précision était de 59 %. Le modèle a atteint la plus grande précision pour les cancers du système digestif, de la thyroïde, du rein et de l'utérus.
Afin de vérifier si cette performance prédictive était également confirmée dans les données de santé d'autres pays, les chercheurs ont également validé leur modèle en utilisant les données de la UK Biobank et ont obtenu une précision comparable. Les analyses ne permettent pas de prédire exactement quelle personne développera un cancer. Cependant, elles déterminent le risque individuel et permettent une comparaison avec des personnes d'âge similaire.
"Avec cette étude, nous voulions démontrer qu'il est possible de modéliser les risques individuels de cancer sur la base des données nationales de santé", explique Moritz Gerstung. Une telle stratification des risques pourrait permettre de proposer des tests de détection précoce supplémentaires aux personnes qui en bénéficieraient le plus. Outre les méthodes établies de détection précoce, il pourrait s'agir à l'avenir de tests de dépistage du cancer à partir du sang, par exemple, qui font l'objet de recherches intensives dans le monde entier et sont déjà testés dans le cadre d'essais cliniques dans certains cas. L'espoir sous-jacent est qu'à l'avenir, un certain nombre de tests puissent détecter davantage de cancers grâce à la stratification des risques, ce qui permettrait d'éviter aux personnes à faible risque des tests inutiles, des résultats faussement positifs et des surdiagnostics.
Toutefois, comme l'explique Moritz Gerstung, une base de données fiable est essentielle à cette fin. "Les données sanitaires danoises sont uniques car elles couvrent une longue période et peuvent être reliées entre elles. Seuls quelques pays européens offrent quelque chose d'équivalent, comme la Finlande et la Suède ou des cohortes de recherche spéciales au Royaume-Uni.
Des efforts sont également déployés en Allemagne pour mettre en place des infrastructures nationales de santé numérique. "Il serait judicieux de réfléchir, dès la phase de planification, au type de données le mieux adapté à l'évaluation du risque de cancer", explique M. Gerstung. Dans ses travaux actuels, les codes de diagnostic de la CIM-10, qui sont également utilisés dans d'autres systèmes de santé européens, se sont révélés utiles.
Des informations de base sur les mensurations et les facteurs de risque connus, tels que la consommation de tabac, ayant également fourni des informations importantes, il semble souhaitable de faciliter la collecte de ces données au niveau de la population. "Si ces données avaient été disponibles dans l'ensemble des registres de santé danois, notre modèle de prédiction aurait probablement été encore plus précis", résume M. Gerstung.
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.
Publication originale
Alexander W Jung, Peter C Holm, Kumar Gaurav, Jessica Xin Hjaltelin, Davide Placido, Laust Hvas Mortensen, Ewan Birney, S⊘ren Brunak, Moritz Gerstung; "Multi-cancer risk stratification based on national health data: a retrospective modelling and validation study"; The Lancet Digital Health, Volume 6