Le domaine de l’intelligence artificielle connaît une évolution sans précédent, les grands modèles de langage (LLMs) devenant capables d’exécuter des tâches cognitives complexes en médecine. De la réponse précise à des questions médicales à choix multiples jusqu’à l’élaboration d’un diagnostic différentiel avancé, l’IA démontre aujourd’hui son potentiel dans l’aide au diagnostic médical.
Selon les statistiques, les erreurs de diagnostic entraînent chaque année la mort ou un handicap permanent chez environ 795 000 patients rien qu’aux États-Unis. En raison du coût élevé des erreurs de diagnostic ou des retards, l’intelligence artificielle pourrait jouer un rôle vital pour améliorer la précision des diagnostics et réduire les erreurs médicales. Au cours des deux dernières années, les modèles d’IA propriétaires, comme GPT-4 d’OpenAI, se sont distingués dans le diagnostic de cas médicaux complexes, s’intégrant progressivement aux applications de soins de santé.
Mais les modèles open source n’avaient jusqu’ici pas atteint ce niveau de performance.
Cependant, une étude menée par des chercheurs de la Harvard Medical School révèle que les modèles open source récents, comme Llama 3.1 développé par Meta, sont capables de rivaliser avec les modèles propriétaires. L’étude, publiée le 17 mars 2025 dans le JAMA Health Forum, a montré que Llama 3.1 obtenait des résultats prometteurs dans des tests cliniques avancés, comparables à ceux de certains des meilleurs modèles fermés pour diagnostiquer des cas complexes.
Faisant partie de la série Llama, Llama 3.1 est proposé par Meta comme une alternative open source permettant aux chercheurs de l’utiliser, de l’adapter et de le former librement, sans restriction commerciale. Les modèles open source présentent aussi l’avantage d’être personnalisables pour des besoins spécifiques (par exemple, entraînement sur des données internes tout en préservant la confidentialité des patients), contrairement aux modèles fermés, souvent limités à des serveurs externes et à un usage propriétaire.
Diagnostic des maladies
Les modèles d’IA, qu’ils soient ouverts ou fermés, s’appuient sur d’énormes bases de données (ouvrages médicaux, études cliniques, données de patients) pour analyser et poser un diagnostic. Confrontés à un nouveau cas, ils comparent les informations reçues à leur savoir accumulé pour générer des hypothèses diagnostiques.
Dans cette étude, Llama 3.1 a été soumis à un test sur 70 cas cliniques complexes et 22 cas inédits.
Résultats :
70 % de précision globale, contre 64 % pour GPT-4 ;
41 % de diagnostics exacts dès la première suggestion, contre 37 % pour GPT-4 ;
Sur les cas nouveaux, la précision est montée à 73 %, avec 45 % de bonnes réponses en premier choix.
Avis des chercheurs
Le Dr Arjun Manrai, auteur principal de l’étude et professeur en biomédecine à Harvard, affirme que l’intelligence artificielle, bien intégrée aux systèmes de santé, pourrait devenir un assistant fiable pour les médecins.
Dans une déclaration au journal Asharq Al-Awsat, il souligne que les modèles open source permettent de garder les données en local (dans les hôpitaux), garantissant ainsi la confidentialité, alors que les modèles fermés nécessitent l’envoi des données vers des serveurs externes, ce qui suscite des préoccupations sécuritaires. Il ajoute que les modèles open source sont plus flexibles et moins coûteux, donc plus adaptés aux établissements à budget limité.
Cependant, il note aussi des défis à surmonter, notamment la nécessité de compétences techniques pour la maintenance, la difficulté d’intégration aux systèmes hospitaliers existants (contrairement aux solutions fermées plus « clé en main ») et le besoin d’essais cliniques supplémentaires pour garantir fiabilité, sécurité et réduction des biais.
Plateformes open source en santé
Plusieurs plateformes open source sont aujourd’hui disponibles :
Azure AI Foundry (Microsoft) : propose des modèles IA pour analyser des images médicales et générer automatiquement des rapports de radiologie.
Parmi ses outils :
MedImageInsight : classification d’images et détection d’anomalies,
MedImageParse : délimitation des tumeurs et des organes,
CXRReportGen : analyse de radiographies thoraciques et génération de rapports.
MONAI : développée par Nvidia en collaboration avec le King’s College London, cette plateforme soutient la création et l’entraînement de modèles IA pour l’imagerie médicale, avec un accent sur la confidentialité et la précision du diagnostic.
OpenMEDLab : lancée par des chercheurs de l’université Cornell en mars 2024, cette plateforme open source développe des modèles multimodaux pour la santé, en s’appuyant notamment sur Gemini de Google, et vise à stimuler l’innovation dans le secteur médical.