Un nouvel outil open-source pour l'analyse de données de santé complexes

Trier, regrouper et analyser des ensembles de données volumineux, hétérogènes et complexes sans hypothèses préexistantes

13.09.2024

Sous la direction du centre Helmholtz de Munich, des scientifiques ont mis au point un logiciel accessible spécialement conçu pour l'analyse de données médicales complexes. Le logiciel libre appelé "ehrapy" permet aux chercheurs de structurer et d'examiner systématiquement de grands ensembles de données hétérogènes. Le logiciel est mis à la disposition de la communauté scientifique mondiale qui peut l'utiliser et le développer.

Copyright: Meshal Ansari

Ehrapy vise à combler une lacune importante dans l'analyse des données de santé, explique Lukas Heumos, l'un des principaux développeurs et scientifique à l'Institut de biologie informatique du Helmholtz de Munich et de l'Université technique de Munich (TUM) : "Jusqu'à présent, il n'existait pas d'outils normalisés pour analyser systématiquement et efficacement des données médicales diverses et complexes. Nous avons changé cela avec ehrapy". L'équipe à l'origine d'ehrapy est issue de la recherche biomédicale et possède une grande expérience dans l'analyse d'ensembles de données scientifiques complexes. "Le secteur de la santé est confronté à des défis similaires à ceux des laboratoires en matière d'analyse de données", a fait remarquer M. Heumos au début du projet ehrapy.

Approche exploratoire - Analyse sans hypothèse

Avec de nombreux autres contributeurs, M. Heumos a mis à profit son expertise en matière de développement de logiciels scientifiques pour créer une solution d'analyse des données des patients : "Ehrapy peut découvrir de nouveaux modèles et générer des idées sans avoir besoin d'analyser les données sur la base d'une supposition ou d'une hypothèse spécifique". Cette approche exploratoire, explique M. Heumos, est une caractéristique unique d'Ehrapy.

Ehrapy permet aux chercheurs de trier, de regrouper et d'analyser des ensembles de données volumineux, hétérogènes et complexes sans aucune hypothèse préexistante. Cela permet d'ouvrir de nouvelles perspectives qui peuvent ensuite être explorées plus avant. Heumos explique : "L'approche exploratoire apporte de nouvelles perspectives à l'analyse des données de santé. En raison de leur complexité et de leur hétérogénéité, ces données ne sont souvent pas analysées aussi efficacement qu'elles pourraient l'être." Ehrapy ouvre donc de nouvelles voies pour rendre les données de santé plus utiles à la recherche et à la pratique médicales.

L'objectif à long terme : l'utilisation courante dans la pratique clinique

Ehrapy a été conçu dès le départ comme un logiciel libre. "Il était important pour nous de mettre le logiciel à la disposition de la communauté scientifique dès le premier jour", souligne M. Heumos. Le logiciel est disponible sous forme de paquetage Python sur GitHub, une plateforme en ligne pour le développement de logiciels, et peut être utilisé et développé par des chercheurs du monde entier.

Actuellement, ehrapy se concentre sur l'analyse efficace et rapide d'ensembles de données de recherche, tels que ceux stockés dans les grands centres de recherche en santé. "L'utilisation courante dans la pratique clinique est un objectif à long terme, mais pour l'instant, nous nous concentrons sur la fourniture d'un outil puissant à la communauté des chercheurs", explique M. Heumos.

À l'avenir, l'équipe prévoit de fournir des bases de données normalisées pour les dossiers médicaux électroniques (DME). Ces bases de données permettront d'améliorer l'intégration et l'analyse de grands volumes de données médicales. En outre, cela facilitera l'élaboration d'atlas de DSE qui pourront servir d'ensembles de données de référence pour contextualiser et annoter de nouveaux ensembles de données.

Un long voyage

"Ehrapy permet une analyse complète des données à travers les systèmes, ce qui peut être une étape clé pour les futurs systèmes d'IA en médecine. J'espère donc une adoption relativement rapide dans différents sites", déclare le professeur Fabian Theis, directeur de l'Institut de biologie informatique du Helmholtz de Munich et professeur à la TUM : "La mise en place de telles technologies en médecine est un processus long qui peut prendre des décennies. Notre objectif est de combler le fossé entre la recherche biomédicale et l'application pratique en médecine". Theis explique en outre que l'équipe de développement se concentre sur les méthodes d'analyse exploratoire des données sous une forme holistique afin de révéler plus facilement les connexions cachées. "Nous essayons également de soutenir les acteurs universitaires et commerciaux du secteur des soins de santé."

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.

Publication originale

Autres actualités du département science

Actualités les plus lues

Plus actualités de nos autres portails