"Le plan de la médecine du futur : vers une médecine 4P
La médecine jusqu’alors essentiellement curative évoluera demain vers une médecine 4P :
- Une médecine personnalisée ou médecine de précision : médecine tenant compte du profil génétique ou protéique de l’individu et permettant de proposer un traitement ciblé ou un changement de choix de vie.
- Une médecine prédictive : médecine capable de prédire les risques de développement d’une maladie avant son apparition.
- Une médecine préventive : médecine, plus classique, prenant en charge les problèmes de santé en se concentrant sur le mieux-être de la personne et non sur la maladie.
- Une médecine participative : médecine amenant les patients à être de plus en plus responsable de leur santé et de leurs soins."
Shmatko, A., Jung, AW, Gaurav, K. et al.Nature (2025).
https://www.nature.com/articles/s41586-025-09529-3
Article en libre accès

La prise de décision en santé repose sur la compréhension des états de santé passés et présents des patients, afin de prédire et, à terme, de modifier leur trajectoire future.
Les méthodes d'intelligence artificielle (IA) offrent la promesse d'aider à cette tâche en apprenant les schémas d'évolution des maladies à partir de larges corpus de dossiers médicaux. Cependant, leur potentiel reste encore peu évalué à grande échelle.
Dans cette étude, l'architecture de type transformateur GPT a été adaptée pour modéliser la progression et le caractère performant des maladies humaines. Le modèle, Delphi-2M, a été entraîné sur les données de 400 000 participants de la UK Biobank et validé sur celles de 1,9 million de patients danois, sans modification des paramètres.
Delphi-2M a prédit l'incidence de plus de 1 000 maladies — conditionnellement aux individus détectés — avec une précision comparable à celle des modèles monopathologiques existants. Sa nature générative permet également de simuler des trajectoires de santé futures synthétiques et d'estimer la charge potentielle de morbidité pour les 20 prochaines années. Il devient ainsi possible d'entraîner des modèles d'IA sans accès aux données réelles.
L'utilisation de méthodes d'IA explicables apporte un éclairage sur les prédictions de Delphi-2M, révélant des grappes de comorbidités au sein et entre différentes catégories de maladies, et leurs conséquences temporelles sur la santé future. Cependant, ces analyses dévoilent également les biais hérités des données d'entraînement.
En résumé, les modèles fondés sur l'architecture transformateur s'avèrent adaptés aux tâches prédictives et génératives dans le domaine de la santé, exploitables à l'échelle populationnelle et capables d'élucider les dépendances temporelles entre événements morbides, avec des perspectives concrètes pour le risque personnalisé et la médecine de précision.

Ce document traite de l'utilisation de modèles de transformateurs génératifs pour prédire la progression des maladies humaines et comprendre les risques de multimorbidité à partir de données de santé.
Modèle de prédiction de la progression des maladies
Le modèle Delphi-2M utilise une architecture de transformateur pour prédire la progression des maladies humaines en s'établissant sur des données de santé historiques.
- Le modèle a été formé sur 0,4 million de participants du UK Biobank et validé sur 1,9 million de Danois.
- Prédit les taux de plus de 1 000 maladies en fonction de l'historique de santé des individus.
- Précision comparable aux modèles de maladies uniques existants.
- Capacité à générer des trajectoires de santé synthétiques sur 20 ans.
- Utilisation de méthodes d'IA explicables pour comprendre les prédictions et identifier les biais.
Importance de la compréhension des comorbidités
Comprendre les risques de multimorbidité est essentiel pour personnaliser les décisions de santé.
- Les comorbidités sont influencées par le mode de vie, les traits héréditaires et le statut socio-économique.
- Les modèles de prédiction actuels se concentrent souvent sur des maladies spécifiques, négligeant les interactions entre plusieurs maladies.
- La prévalence des maladies chroniques augmente, avec une prévision d'augmentation de 77 % des diagnostics de cancer d'ici 2050.
Développement et validation du modèle Delphi-2M
Le modèle a été développé pour surmonter les limitations des modèles de multimorbidité existants.
- Utilisation de l'architecture GPT-2 modifiée pour intégrer des données de santé continues.
- Entraînement sur 402 799 participants, avec validation sur 100 639 participants.
- Capacité à prédire les taux de maladies avec une AUC moyenne de 0,76 dans les données de validation.
Prédictions des incidences des maladies
Delphi-2M prédit les incidences des maladies avec une précision élevée.
- Les courbes d'incidence varient selon les maladies et les sexes.
- AUC pour la prédiction de la mort est de 0,97, indiquant une forte prévisibilité.
- Les performances du modèle surpassent celles des scores de risque clinique pour des maladies comme le diabète et la démence.
Simulation des trajectoires de santé futures
Le modèle permet de simuler des trajectoires de santé établies sur l'historique médical.
- Évaluation de 63 662 trajectoires simulées par rapport aux données observées.
- Les taux de maladies simulés à 70-75 ans correspondent bien aux taux observés.
- Prédictions plus précises que celles basées uniquement sur l'âge et le sexe.
Explication des prédictions du modèle
Des analyses permettent de comprendre comment Delphi-2M prédit les taux de maladies futures.
- Les codes de maladies se regroupent par chapitres selon les cooccurrences observées.
- Les maladies avec une mortalité aiguë, comme l'infarctus du myocarde, se regroupent avec la mort.
- Les valeurs SHAP montrent l'impact des antécédents médicaux sur les prédictions.
Modèle Delphi-2M pour la progression des maladies
Le modèle Delphi-2M est un modèle basé sur l'IA qui prédit la progression des maladies grâce à des données de santé longitudinales.
- Utilise des données de la UK Biobank, incluant 402,799 participants.
- Prédit les taux de maladies sur une période allant jusqu'à 20 ans.
- Montre une augmentation de la mortalité, par exemple, le cancer du pancréas augmente le risque de mortalité de 19 fois.
- Les effets des maladies sont souvent symétriques, indiquant des dépendances mutuelles.
Analyse des valeurs SHAP pour les risques
L'analyse SHAP permet d'évaluer l'influence des diagnostics sur les risques futurs de maladies.
- 778 diagnostics ont été analysés, montrant des contributions significatives à la mortalité.
- Les maladies du tractus digestif augmentent le risque de cancer du pancréas de 19 fois.
- Les effets des maladies sont souvent plus forts au sein des mêmes chapitres ICD-10.
Validation externe et évaluation des biais
Le modèle a été testé sur des données de registre de population danoise pour évaluer sa généralisation.
- AUC moyenne de 0,67 sur les données danoises, légèrement inférieure à 0,69 pour la UK Biobank.
- Les biais d'échantillonnage incluent une surreprésentation des participants blancs et plus éduqués.
- Les données de la UK Biobank montrent des biais de mortalité, car les décès avant le recrutement ne sont pas enregistrés.
Applications et implications du modèle
Delphi-2M a des applications potentielles dans la prise de décision médicale et la planification des soins de santé.
- Peut identifier les individus à risque élevé pour des tests de dépistage.
- Utile pour projeter les besoins futurs en soins de santé dans les populations vieillissantes.
- Peut être intégré avec d'autres données, comme les informations génomiques et les biomarqueurs.
Limitations et considérations éthiques
Le modèle présente des limitations et des considérations éthiques à prendre en compte.
- Les biais de sélection et de données peuvent affecter les prédictions.
- Nécessité d'un cadre réglementaire pour utiliser les systèmes d'aide à la décision clinique.
- Les résultats doivent être interprétés avec prudence, sans établir de relations causales directes.
Évaluation des modèles de prédiction de maladies
L'article présente une évaluation des performances du modèle Delphi-2M par rapport à d'autres modèles de référence dans la prédiction des maladies.
- Comparaison des performances de Delphi-2M avec des biomarqueurs cliniques sur un ensemble de données de validation UKB.
- L'AUC (Area Under Curve) pour le modèle Delphi-2M, comparé à un prédicteur simple de santé globale, montre des résultats significatifs.
- Boxplots illustrant les AUC de Delphi-2M, stratifiés par sexe, chapitre de maladie et facteurs de style de vie, avec n = 906 diagnostics pour les hommes et n = 957 pour les femmes.
Intégration des prédictions avec d'autres données
L'intégration des prédictions de Delphi-2M avec d'autres types de données améliore la précision des prévisions de maladies.
- Utilisation de modèles de régression linéaire combinant les logits de Delphi avec des scores de risque polygénique et des biomarqueurs.
- AUC validée pour des groupes d'âge de 40 à 80 ans, stratifiée par sexe, montrant des résultats prometteurs.
Calibration des prédictions instantanées de Delphi-2M
L'évaluation de la calibration des prédictions instantanées de Delphi-2M pour différentes maladies et groupes d'âge.
- Résultats pour 9 maladies sélectionnées, avec des taux observés calculés à partir des données de validation.
- Graphiques de calibration sur des données de test longitudinales danoises, comparant les taux prévus et observés.
Importance des hyperparamètres dans le modèle
Une analyse de l'importance des hyperparamètres dans le modèle Delphi-2M et leur corrélation avec la perte de validation.
- Validation de l'entropie croisée pour différents paramètres architecturaux, avec des boxplots montrant la distribution des résultats.
- Importance des hyperparamètres évaluée par un modèle de forêt aléatoire, indiquant des corrélations significatives avec la perte de validation.
Effets de l'ethnicité et de la déprivation
L'impact de l'ethnicité et de la déprivation sur les taux de maladies modélisés par le modèle Delphi-2M.
- Taux modélisés par an, séparés par sexe et origine ethnique, avec des boxplots illustrant les variations.
- Analyse des AUC stratifiées par âge et sexe pour 10 maladies sélectionnées, avec des intervalles de confiance de 95 % calculés.
Trajectoires de santé simulées
Évaluation des trajectoires de santé simulées à partir de l'âge de 60 ans, en utilisant les données de validation.
- Comparaison des taux de maladies simulés et observés pour différents groupes de consommation de tabac, d'alcool et d'IMC.
- Stratification des trajectoires en groupes de risque bas, moyen et élevé pour des diagnostics sélectionnés et la mortalité.

Décryptage PERPLEXITY
L'article « Apprendre l'histoire naturelle des maladies humaines avec des transformateurs génératifs » d'Artem Shmatko et al. présente un modèle d'IA basé sur les transformateurs, appelé Delphi-2M, capable de prédire le risque et la chronologie de plus de 1 000 maladies sur la vie entière d'un individu à partir de ses données médicales présentées.
Contexte et méthode
-
Delphi-2M adapte l'architecture GPT pour modéliser la progression temporelle et la multimorbidité à partir des codes diagnostiques (CIM-10), des décès, du sexe, de l'IMC et des facteurs de mode de vie.
-
Le modèle est utilisé sur les données du UK Biobank (402 799 participants pour l'apprentissage, 100 639 pour la validation, 471 057 pour le test), puis validé sur 1,9 million de personnes issues des registres danois.
-
Des modifications ont été suggérées pour tenir compte spécifiquement des données de santé : encodage continu de l'âge, prédiction du délai jusqu'au prochain événement, masquage d'attention pour éviter que des événements concomitants s'influencent mutuellement.
Résultats clés
-
Le modèle prédit le risque et la succession temporelle de diagnostics pour plus de 1 000 maladies, avec une précision comparable ou supérieure à celle des outils monopathologiques pour de multiples affections.
-
Delphi-2M permet des simulations de trajectoires de santé sur 20 ans et génère des données synthétiques proches de la réalité épidémiologique sans révéler d'identifiants personnels.
-
Il met en évidence des motifs de comorbidité selon les chapitres CIM-10, ainsi que la persistance du risque de mortalité après certains diagnostics majeurs (ex. cancers).
Limites et perspectives
-
Les prédictions impliquent les biais des bases (ex. : effet healthy volontaire du UK Biobank, différences d'ascendance, biais de recrutement), et restent corrélationnelles sans implication causale directe.
-
Les performances varient selon les pathologies (ex. prévision du diabète inférieure à celle de l'HbA1c mais robuste sur d'autres trajectoires).
-
L'outil ne se substitue pas à un jugement clinique individuel : il vise à soutenir la recherche, la prévention personnalisée, la planification de santé publique, et à générer des jeux de données protégeant la vie privée.
Conclusion
Delphi-2M démontre le potentiel des modèles génératifs pour cartographier la trajectoire individuelle et populationnelle de la santé humaine, forgeant ainsi de nouveaux outils pour la médecine préventive et l'épidémiologie du vieillissement.
SYNTHÈSE
Article scientifique décrivant un nouveau modèle d'intelligence artificielle nommé Delphi-2M, qui est une modification de l'architecture de transformateur GPT pour modéliser la progression et la nature concurrentielle des maladies humaines. L'étude explique que la prise de décision en santé nécessite de comprendre les antécédents des patients pour prédire leur évolution future. L'IA peut apporter son aide en apprenant des schémas de progression de maladies à partir de vastes corpus de dossiers médicaux dans ce domaine. Entraîné sur des données du Royaume-Uni et validé avec succès sur celles danoises, le modèle Delphi-2M est capable de prédire les taux de plus de 1000 maladies. Il fournit ainsi des estimations de l'évolution de la charge de morbidité sur une période de plus de deux décennies. L'article détaille également la capacité du modèle à générer des trajectoires de santé synthétiques et à fournir des explications sur ses prédictions, mettant en lumière les dépendances temporelles entre les événements pathologiques et les biais appris dans les données d'entraînement. En somme, cette recherche positionne les modèles établis sur des transformateurs comme des outils prometteurs pour la médecine de précision et la planification des soins de santé à l'échelle des populations. NoteBookKLM
Commentaire
DELPHI-2M nous fait entrer dans un monde nouveau.
Est-ce une boite de Pandore ou une acquisition majeure pour l'humanité ?
Si tout est sous contrôle, Pandore non .
Toutefois il faut être positif , cette anticipation de la santé par DELPHI-2M est en même temps passionnante et assez incroyable quand tout fonctionnera au mieux.
Mais, attention, dans ce contexte l'éthique sera à préserver.
Pourquoi ne pas s'orienter vers un dépistage et une prédiction des maladies cardiovasculaires, du diabète et du cancer ?
Ces affections dépistées très tôt sont et seront curables.
Ainsi, on pourra faire de la prévention très précoce pour ces populations et ça fonctionnera.
La prévention primaire sera ainsi révolutionnée et enfin efficace !
Affaire à suivre de très près !
À LIRE
Delphi-2M : une IA pour prédire des maladies « plus d'une décennie à l'avance »
https://genethique.org/delphi-2m-une-ia-pour-predire-des-maladies-plus-dune-decennie-a-lavance/
Delphi-2M - L'IA qui prédit les maladies que vous aurez dans quelques années
En bref
- Cette IA prédit vos maladies des 20 prochaines années mais exclut totalement les jeunes, les non-Blancs et les non-Britanniques – discrimination algorithmique assumée.
- Delphi-2M ressuscite numériquement les morts pour prédire l'avenir des vivants - quand l'IA joue avec les fantômes pour soigner les mortels.
- Les assurances et employeurs vont adorer cette IA qui prédit vos futures maladies - fini l'embauche, bonjour la discrimination médicale préventive.
Delphi-2M n’est de toute façon pas encore prête pour une utilisation clinique. C’est plus un outil de recherche qu’un Nostradamus médical, mais j’imagine que dans quelques années, quand on ira chez le médecin, il lancera Delphi-jesaispascombien, et il vous sort : “Bon, vous allez avoir de l’arthrite en 2043, un AVC en 2051, et mourir d’un cancer du pancréas en 2063. Des questions ?”
Ça fait flipper non ?
https://korben.info/delphi-2m-ia-prediction-maladies.html
Apprendre l'histoire naturelle des maladies humaines avec des transformateurs génératifs
Implications pour les soins de santé
Médecine personnalisée
Planification de la santé publique
Approches de médecine de précision
Limites et instructions futures
biais de données
Généralisation du modèle
Alors que Delphi-2M a démontré une robustesse sur différents ensembles de données, une validation supplémentaire dans diverses populations est nécessaire pour garantir sa généralisation et son applicabilité dans divers établissements de soins de santé.
https://divmagic.com/fr/blog/learning-the-natural-history-of-human-disease-with-generative-transformers-871bgt