Contexte
La thromboembolie veineuse (MTEV) est un trouble chronique avec un fardeau sanitaire et économique important. Plusieurs modèles de prédiction clinique (CPM) spécifiques à la MTEV ont été utilisés pour aider les médecins dans la prise de décision, mais présentent plusieurs limites. Cette revue systématique explore si l'apprentissage automatique (ML) peut améliorer les CPM en analysant de nombreuses données sur les patients dérivées des dossiers de santé électroniques (DSE). Notre objectif était d'explorer les applications des ML-CPM dans la MTEV pour la stratification des risques, la prédiction des résultats, le diagnostic et le traitement.
Méthodes
Trois bases de données ont été consultées : PubMed, Google Scholar et la bibliothèque électronique IEEE. Les critères d'inclusion se sont concentrés sur les études utilisant des données structurées, excluant les publications non anglaises, les études sur des non-humains et certains types de données tels que le traitement du langage naturel et le traitement d'images. Les études impliquant des femmes enceintes, des patients atteints de cancer et des enfants ont également été exclues. Après avoir exclu les études non pertinentes, un total de 77 études ont été incluses.
Résultats
La plupart des études rapportent que les ML-CPM ont surpassé les CPM traditionnels en termes de zone opérationnelle du récepteur sous la courbe dans les quatre domaines cliniques explorés. Cependant, la majorité des études étaient rétrospectives, monocentriques et manquaient de description détaillée de l'architecture du modèle et de validation externe, essentielles à l'audit de qualité. Cette revue a identifié des lacunes dans la recherche et mis en évidence les défis liés aux rapports standardisés, à la reproductibilité et à la comparaison des modèles.
Conclusion
Les ML-CPM sont prometteurs pour améliorer l'évaluation des risques et les recommandations de traitement individualisées dans la MTEV. Apparemment, il existe un besoin urgent de rapports et de méthodologies standardisés pour les modèles ML, la validation externe, les études de données prospectives et réelles, ainsi que les études interventionnelles pour évaluer l'impact de l'IA sur la MTEV.
Commentaire : le travail ne fait que commencer mais avec plus de méthodologie standardisée pour le ML
ARTICLE 2
Muñoz AJ, Souto JC, Lecumberri R, Obispo B, Sanchez A, Aparicio J, Aguayo C, Gutierrez D, Palomo AG, Fanjul V, Del Rio-Bermudez C, Viñuela-Benéitez MC, Hernández-Presa MÁ. Development of a predictive model of venous thromboembolism recurrence in anticoagulated cancer patients using machine learning. Développement d'un modèle prédictif de récidive de thromboembolie veineuse chez les patients cancéreux anticoagulés grâce à l'apprentissage automatique
Thromb Res. 2023 Aug;228:181-188. doi: 10.1016/j.thromres.2023.06.015. Epub 2023 Jun 16. PMID: 37348318.
Introduction
Les patients atteints de cancer et de thromboembolie veineuse (MTEV) présentent un risque élevé de récidive de MTEV pendant le traitement anticoagulant. Cette étude visait à développer un modèle prédictif pour évaluer le risque de récidive de MTEV dans les 6 mois au moment du diagnostic primaire de MTEV chez ces patients.
Matériels et méthodes
Grâce à la technologie EHRead®, basée sur le traitement du langage naturel (NLP) et l'apprentissage automatique (ML), les données non structurées des dossiers de santé électroniques de 9 hôpitaux espagnols entre 2014 et 2018 ont été extraites. Une sélection de caractéristiques cliniquement et basée sur l'apprentissage automatique a été effectuée pour identifier les prédicteurs de récidive de MTEV. Des algorithmes de régression logistique (LR), d'arbre de décision (DT) et de forêt aléatoire (RF) ont été utilisés pour former différents modèles de prédiction, qui ont ensuite été validés dans un ensemble de données d'exclusion.
"À partir d'une population source de 2 893 108 individus, 21 227 atteints d'un cancer actif et d'une MTEV sous traitement anticoagulant ont été identifiés . Parmi eux, 16 407 étaient éligibles pour être inclus dans cette étude . Environ la moitié des patients étaient des hommes ( n = 8 925, 54,4 %) avec un âge médian (Q1, Q3) de 70 (59, 80) ans. Les comorbidités les plus courantes au moment du diagnostic de MTEV étaient l'hypertension ( n = 9 583, 58,4 %), les affections neurologiques, notamment la neurotoxicité , la neuropathie ou la douleur neurologique ( n = 8 544, 52,1 %) et la dyslipidémie ( n = 6 647, 40,5 %). )
Le type de MTEV primaire le plus courant était la TVP ( n = 11 026, 67,2 %), suivi de l'EP ( n = 4 360, 26,6 %), de la thrombose veineuse viscérale ( n = 1 207, 7,4 %) et de l'EP/TVP synchronique ( n = 759, 4,6 %) ( Tableau 2 ). Des antécédents familiaux de TEV ont été documentés chez 2,5 % des patients ( n = 416). En ce qui concerne les caractéristiques liées au cancer, les localisations de cancer les plus fréquemment observées étaient colorectales ( n = 1 705, 10,4 %), du poumon ( n = 1 471, 9 %) , de la vessie ( n = 1 210, 7,4 %) et du sein ( n = 1 135, 6,9). %). De plus, des métastases ont été signalées chez près de la moitié des patients ( n = 7 822, 47,7 %)
Résultats : Au total, 16 407 patients atteints d'un cancer traités par anticoagulant et présentant un diagnostic de MTEV ont été identifiés (54,4 % d'hommes et un âge médian de 70 ans). Une thrombose veineuse profonde, une embolie pulmonaire et des métastases ont été observées respectivement chez 67,2 %, 26,6 % et 47,7 % des patients. Au cours du suivi de l'étude, 11,4 % des patients ont développé une MTEV récurrente, plus fréquente chez les patients atteints d'un cancer du poumon.
La sélection des caractéristiques et la formation du modèle basée sur
l'embolie pulmonaire primitive identifiée par ML,
la thrombose veineuse profonde,
les métastases,
l'adénocarcinome,
les taux d'hémoglobine
créatinine sérique,
la numération plaquettaire
la numération leucocytaire,
les antécédents familiaux de MTEV
l'âge des patients
en tant que prédicteurs de récidive de TEV dans les 6 mois suivant Diagnostic de MTEV. Le modèle LR avait une AUC-ROC (IC à 95 %) de 0,66 (0,61, 0,70), le DT de 0,69 (0,65, 0,72) et le RF de 0,68 (0,63, 0,72).
Conclusions
Il s'agit du premier modèle prédictif basé sur le ML conçu pour prédire la récidive de MTEV à 6 mois chez les patients atteints de cancer. Ces résultats recèlent un grand potentiel pour aider les cliniciens à identifier les patients à haut risque et à améliorer leur prise en charge clinique.
Points forts
- L'AUC ROC permet d'évaluer la performance globale d'un modèle. Il est égal à 100% pour un modèle parfait et à 50% pour un modèle non informatif. La performance d'un modèle de Machine Learning se situe donc entre ces valeurs.
Les données non structurées des dossiers de santé électroniques ont été extraites avec la PNL.
Nous avons identifié 16 407 patients adultes atteints de cancer ayant reçu un diagnostic de TEV dans 9 hôpitaux.
11,4 % des patients ont eu une MTEV récurrente, 9,2 % dans les six mois suivant l'événement primaire.
La sélection de fonctionnalités basée sur l'apprentissage automatique a identifié 10 prédicteurs de récidive de TEV.
Les modèles prédictifs de récidive de MTEV chez les patients cancéreux avaient une ROC-AUC > 0,7.
Schéma de la conception de l’étude et organigramme de l’étude. Date de l'index = heure du diagnostic de MTEV ; ML = Apprentissage automatique ; NLP = Traitement du Langage Naturel ; MTEV = thromboembolie veineuse.
Modèle prédictif de récidivede MTEV chez les patients atteints de cancer. À partir d'un ensemble initial de 95 variables, 82 prédicteurs ont été obtenus après avoir exclu les variables à variance nulle, les variables numériques avec des valeurs manquantes supérieures à 20 % et quantifié l'étendue de la corrélation entre un prédicteur et les autres via le facteur d'inflation de la variance (VIF). La sélection des caractéristiques (forêt aléatoire) a identifié 10 facteurs prédictifs de MTEV récurrente au cours des six premiers mois suivant le diagnostic de MTEV. L'importance relative de chaque variable et les mesures de performance globales du modèle sont affichées. VIF : Facteur d'inflation de la variance.
RESUME GRAPHIQUE
Commentaire : des facteurs classiques pertinents pour la prédiction de la récidive de MTEV chez les patients atteints d'un cancer.
Au meilleur de nos connaissances, il s'agit du premier modèle prédictif basé sur ML conçu pour prédire la récidive de MTEV chez les patients cancéreux sous traitement anticoagulant dans les 6 mois, au moment du diagnostic primaire de MTEV.
Notre modèle montre que l'âge, l'EP, la DTV, les métastases, l'histologie de l'adénocarcinome, les antécédents familiaux de MTEV ainsi que certains paramètres analytiques tels que les plaquettes, sont des caractéristiques cliniques importantes à prendre en compte chez ces patients.
Des études futures sont nécessaires pour évaluer la validité de nos résultats.
Cependant, ils sont prometteurs pour améliorer la capacité du milieu clinique à stratifier les patients cancéreux présentant des événements thrombotiques en fonction de leur risque récurrent de TEV. Cela pourrait à terme permettre de mieux prendre en charge les TEV et de prévenir les récidives chez ces patients
Commentaire
Très belle étude
Il faut maintenant compte tenu des paramètres de récidive de MTEV dans la cadre du cancer les appareiller entre eux, déterminer leur impact respectif afin de pouvoir les utiliser dans la vraie vie et rapidement .
A LIRE IA et SANTE (INSERM)
https://www.inserm.fr/dossier/intelligence-artificielle-et-sante/