Depuis la création d'IBM Watson en 2007, l'humanité n'a cessé de développer l'intelligence artificielle (IA) médicale. Un système d'IA médicale performant et utilisable recèle un potentiel considérable pour transformer tous les aspects de la médecine moderne, permettant des soins plus intelligents, plus précis, plus efficaces et plus inclusifs, améliorant ainsi le bien-être du personnel soignant et des patients, et améliorant ainsi considérablement la santé humaine. Ces 16 dernières années, malgré les efforts considérables des chercheurs en IA médicale dans divers domaines, ils n'ont pas encore réussi à concrétiser la science-fiction.
Cette année, grâce au développement révolutionnaire des technologies d'IA telles que ChatGPT, l'IA médicale a réalisé d'importants progrès dans de nombreux domaines. Des avancées sans précédent ont été réalisées dans le domaine de l'IA médicale : la revue Nature a constamment lancé des recherches sur le modèle de langage large et le modèle de base d'imagerie médicale ; Google a lancé Med-PaLM et son successeur, atteignant un niveau expert dans les questions de l'examen de médecine américain. De grandes revues académiques se concentreront sur l'IA médicale : Nature publie ses perspectives sur le modèle de base de l'IA médicale générale ; après une série d'analyses de l'IA en médecine plus tôt cette année, le New England Journal of Medicine (NEJM) a publié sa première analyse de santé numérique le 30 novembre et a lancé le premier numéro de la sous-revue NEJM AI le 12 décembre. Le terrain d'atterrissage de l'IA médicale est plus mature : la sous-revue JAMA a publié l'initiative mondiale de partage des données d'imagerie médicale ; la Food and Drug Administration (FDA) américaine élabore actuellement un projet de lignes directrices pour la réglementation de l'IA médicale.
Ci-dessous, nous passons en revue les progrès significatifs réalisés par les chercheurs du monde entier en direction d'une IA médicale utilisable en 2023.
Modèle de base de l'IA médicale
La construction d'un modèle de base d'IA médicale est sans conteste le sujet de recherche le plus brûlant de cette année. Les revues Nature ont publié des articles de synthèse sur le modèle de base universel et le modèle de langage étendu des soins de santé au cours de l'année. Medical Image Analysis, revue de référence du secteur, a analysé et anticipé les défis et les opportunités de la recherche sur les modèles de base en analyse d'images médicales, et a proposé le concept de « pedigree of basic model » pour synthétiser et guider le développement de cette recherche. L'avenir des modèles d'IA de base pour les soins de santé se précise. S'appuyant sur les exemples réussis de modèles de langage étendus tels que ChatGPT, utilisant des méthodes de pré-entraînement auto-supervisées plus avancées et une vaste accumulation de données d'entraînement, les chercheurs en IA médicale tentent de construire 1) des modèles de base spécifiques à chaque maladie, 2) des modèles de base généraux et 3) de grands modèles multimodaux intégrant un large éventail de modes avec des paramètres massifs et des capacités supérieures.
Modèle d'IA d'acquisition de données médicales
Outre les grands modèles d'IA, qui jouent un rôle important dans les tâches d'analyse des données cliniques en aval, la technologie des modèles d'IA génératifs a également fait son apparition dans l'acquisition de données cliniques en amont. Les algorithmes d'IA permettent d'améliorer considérablement le processus, la rapidité et la qualité de l'acquisition des données.
Plus tôt cette année, Nature Biomedical Engineering a publié une étude de l'Université du Détroit de Turquie portant sur l'utilisation de l'IA générative pour résoudre le problème du diagnostic assisté par imagerie pathologique dans les applications cliniques. La présence d'artefacts dans les coupes congelées pendant la chirurgie constitue un obstacle à une évaluation diagnostique rapide. Bien que les tissus inclus dans le formol et la paraffine (FFPE) fournissent un échantillon de meilleure qualité, leur production est chronophage et prend souvent de 12 à 48 heures, ce qui les rend inadaptés à une utilisation chirurgicale. L'équipe de recherche a donc proposé un algorithme appelé AI-FFPE, capable de reproduire l'apparence des tissus sur coupe congelée. Cet algorithme a permis de corriger les artefacts des coupes congelées, d'améliorer la qualité de l'image et de conserver les caractéristiques cliniques pertinentes. En validation clinique, l'algorithme AI-FFPE améliore significativement la précision diagnostique des pathologistes pour les sous-types tumoraux, tout en réduisant considérablement le temps de diagnostic clinique.
Français Cell Reports Medicine présente un travail de recherche mené par une équipe du Troisième Collège Clinique de l'Université de Jilin, du Département de Radiologie, de l'Hôpital Zhongshan affilié à l'Université Fudan et de l'Université des Sciences et Technologies de Shanghai [25]. Cette étude propose un cadre de fusion de reconstruction itérative et d'apprentissage profond à usage général (Hybrid DL-IR) avec une grande polyvalence et flexibilité, montrant d'excellentes performances de reconstruction d'image en IRM rapide, CT à faible dose et PET rapide. L'algorithme peut réaliser un balayage multiséquence d'un seul organe par IRM en 100 secondes, réduire la dose de rayonnement à seulement 10 % de l'image CT et éliminer le bruit, et peut reconstruire de petites lésions à partir de l'acquisition PET avec une accélération de 2 à 4 fois, tout en réduisant l'effet des artefacts de mouvement.
L'IA médicale en collaboration avec le personnel médical
Le développement rapide de l'IA médicale a également incité les professionnels de santé à envisager et à explorer sérieusement les possibilités de collaboration avec l'IA pour améliorer les processus cliniques. En juillet dernier, DeepMind et une équipe de recherche multi-institutionnelle ont proposé conjointement un système d'IA appelé « Retardement du flux de travail clinique piloté par complémentarité » (CoDoC). Le processus diagnostique est d'abord établi par un système d'IA prédictif, puis évalué par un autre système d'IA sur la base du résultat précédent. En cas de doute, le diagnostic est finalement posé par un clinicien afin d'améliorer la précision diagnostique et d'équilibrer l'efficacité. En matière de dépistage du cancer du sein, CoDoC a réduit le taux de faux positifs de 25 % pour un taux de faux négatifs identique, tout en allégeant la charge de travail du clinicien de 66 %, par rapport au processus actuel d'arbitrage en double lecture au Royaume-Uni. Concernant la classification de la tuberculose, le taux de faux positifs a été réduit de 5 à 15 % pour un taux de faux négatifs identique, par rapport à l'IA et aux flux de travail cliniques indépendants.
De même, Annie Y. Ng et al., de la société Kheiron à Londres, au Royaume-Uni, ont introduit des lecteurs d'IA supplémentaires (en coopération avec des examinateurs humains) pour réexaminer les résultats en l'absence de résultats de rappel lors du processus d'arbitrage de double lecture, ce qui a amélioré le problème de détection manquée lors du dépistage précoce du cancer du sein, et le processus n'a enregistré quasiment aucun faux positif. Une autre étude, menée par une équipe de la faculté de médecine McGovern de l'Université du Texas et réalisée dans quatre centres de traitement des AVC, a appliqué une technologie d'IA basée sur l'angiographie par tomodensitométrie (ATDM) pour automatiser la détection des accidents vasculaires cérébraux ischémiques occlusifs (AVC) vasculaires importants. Les cliniciens et les radiologues reçoivent des alertes en temps réel sur leurs téléphones portables quelques minutes après la fin de l'imagerie TDM, les informant de la présence possible d'un AVC. Ce processus d'IA améliore les flux de travail hospitaliers pour les AVC ischémiques aigus, réduisant le délai entre l'admission et le traitement et offrant des possibilités de sauvetage réussi. Les résultats sont publiés dans JAMA Neurology.
Un modèle de soins de santé basé sur l'IA pour un bénéfice universel
L'année 2023 verra également de nombreux travaux de qualité utilisant l'IA médicale pour identifier des caractéristiques invisibles à l'œil humain à partir de données plus facilement accessibles, permettant ainsi un diagnostic universel et un dépistage précoce à grande échelle. En début d'année, Nature Medicine a publié des études menées par le Centre ophtalmologique Zhongshan de l'Université Sun Yat-sen et le deuxième hôpital affilié de l'Université de médecine du Fujian. Utilisant des smartphones comme terminaux d'application, ils ont utilisé des images vidéo de type dessin animé pour induire le regard des enfants et enregistrer leur comportement et leurs traits du visage. Ils ont ensuite analysé des modèles anormaux à l'aide de modèles d'apprentissage profond pour identifier avec succès 16 maladies oculaires, dont la cataracte congénitale, le ptosis congénital et le glaucome congénital, avec une précision de dépistage moyenne de plus de 85 %. Il s'agit d'un moyen technique efficace et facilement vulgarisable pour le dépistage précoce à grande échelle des déficiences visuelles infantiles et des maladies oculaires associées.
À la fin de l'année, Nature Medicine a présenté un travail réalisé par plus de dix institutions médicales et de recherche à travers le monde, dont l'Institut des maladies pancréatiques de Shanghai et le premier hôpital affilié à l'Université du Zhejiang. L'auteur a appliqué l'IA au dépistage du cancer du pancréas chez les personnes asymptomatiques dans les centres d'examen physique, les hôpitaux, etc., afin de détecter sur les images de tomodensitométrie standard des lésions difficiles à détecter à l'œil nu, et ainsi permettre un dépistage précoce efficace et non invasif du cancer du pancréas. En analysant les données de plus de 20 000 patients, le modèle a également identifié 31 cas de lésions cliniquement non détectées, ce qui a considérablement amélioré les résultats cliniques.
Partage de données médicales
En 2023, de nombreux autres mécanismes de partage de données plus parfaits et des cas réussis ont émergé dans le monde, garantissant une coopération multicentrique et l'ouverture des données dans le cadre de la protection de la confidentialité et de la sécurité des données.
Premièrement, grâce à l'IA elle-même, les chercheurs en IA ont contribué au partage des données médicales. Qi Chang et d'autres chercheurs de l'Université Rutgers aux États-Unis ont publié un article dans Nature Communications proposant un cadre d'apprentissage fédéral DSL basé sur des réseaux antagonistes synthétiques distribués. Ce cadre utilise l'IA générative pour entraîner les données générées par des centres multicentriques spécifiques, puis remplace les données réelles par les données générées. L'objectif est de garantir un entraînement de l'IA basé sur le big data multicentrique tout en protégeant la confidentialité des données. La même équipe a également publié en open source un ensemble de données d'images pathologiques générées et leurs annotations correspondantes. Le modèle de segmentation entraîné sur cet ensemble de données peut produire des résultats similaires à ceux des données réelles.
L'équipe de Dai Qionghai de l'Université Tsinghua a publié un article sur la santé numérique npj, proposant l'apprentissage relais, qui utilise le big data multi-sites pour entraîner des modèles d'IA, en s'appuyant sur le principe de la souveraineté locale des données et sans connexion réseau inter-sites. Ce système concilie les préoccupations de sécurité et de confidentialité des données avec la recherche de performances de l'IA. La même équipe a ensuite développé et validé CAIMEN, un système de diagnostic des tumeurs pan-médiastinales par scanner thoracique basé sur l'apprentissage fédéral, en collaboration avec le premier hôpital affilié de l'Université de médecine de Guangzhou et 24 hôpitaux du pays. Ce système, applicable à 12 tumeurs médiastinales courantes, a obtenu une précision supérieure de 44,9 % lorsqu'il était utilisé seul par rapport à une intervention humaine, et une précision diagnostique supérieure de 19 % lorsqu'il était assisté par des experts humains.
D'autre part, plusieurs initiatives sont en cours pour constituer des ensembles de données médicales sécurisés, mondiaux et à grande échelle. En novembre 2023, Agustina Saenz et d'autres chercheurs du département d'informatique biomédicale de la Harvard Medical School ont publié en ligne dans la revue Lancet Digital Health un cadre mondial de partage de données d'imagerie médicale intitulé « Données d'intelligence artificielle pour tous les soins de santé » (MAIDA). Ils collaborent avec des organismes de santé du monde entier afin de fournir des orientations complètes sur la collecte et la dépersonnalisation des données, en utilisant le modèle du partenaire de démonstration fédéral américain (FDP) pour normaliser le partage de données. Ils prévoient de publier progressivement des ensembles de données collectées dans différentes régions et contextes cliniques à travers le monde. Le premier ensemble de données devrait être publié début 2024, et d'autres suivront à mesure que le partenariat se développera. Ce projet constitue une tentative importante de constituer un ensemble mondial, à grande échelle et diversifié de données d'IA accessibles au public.
Suite à cette proposition, la UK Biobank a montré l'exemple. Le 30 novembre, elle a publié de nouvelles données issues du séquençage du génome entier de ses 500 000 participants. Cette base de données, qui publie la séquence complète du génome de chacun des 500 000 volontaires britanniques, est la plus grande base de données génomiques humaines complètes au monde. Les chercheurs du monde entier peuvent demander l'accès à ces données anonymisées et les utiliser pour étudier les fondements génétiques de la santé et des maladies. Les données génétiques ont toujours été très sensibles en termes de vérification, et cette réalisation historique de la UK Biobank prouve qu'il est possible de créer une base de données mondiale à grande échelle, ouverte et respectueuse de la vie privée. Grâce à cette technologie et à cette base de données, l'IA médicale est vouée à franchir une nouvelle étape.
Vérification et évaluation de l'IA médicale
Comparé au développement rapide de la technologie de l'IA médicale, le développement de la vérification et de l'évaluation de cette technologie est légèrement lent. La validation et l'évaluation dans le domaine général de l'IA ignorent souvent les besoins réels des cliniciens et des patients en matière d'IA. Les essais cliniques contrôlés randomisés traditionnels sont trop laborieux pour suivre la rapidité d'itération des outils d'IA. Améliorer au plus vite le système de vérification et d'évaluation adapté aux outils d'IA médicale est essentiel pour permettre à l'IA médicale de franchir un véritable cap vers la recherche et le développement et d'atteindre l'étape clinique.
Dans l'article de recherche de Google sur Med-PaLM, publié dans Nature, l'équipe a également présenté le référentiel d'évaluation MultiMedQA, utilisé pour évaluer la capacité des grands modèles linguistiques à acquérir des connaissances cliniques. Ce référentiel combine six bases de données de questions-réponses médicales professionnelles existantes, couvrant les connaissances médicales professionnelles, la recherche et d'autres aspects, ainsi qu'une base de données de questions médicales issues d'une recherche en ligne, prenant en compte les questions-réponses en ligne entre médecins et patients, afin de former l'IA à devenir un médecin qualifié sous de nombreux aspects. De plus, l'équipe propose un cadre basé sur l'évaluation humaine qui prend en compte de multiples dimensions : faits, compréhension, raisonnement et biais potentiels. Il s'agit de l'une des recherches les plus représentatives de l'évaluation de l'IA dans le domaine de la santé publiées cette année.
Cependant, le fait que les grands modèles de langage présentent un niveau élevé d'encodage des connaissances cliniques signifie-t-il qu'ils sont compétents pour les tâches cliniques concrètes ? Tout comme un étudiant en médecine qui réussit l'examen d'aptitude à la profession de médecin avec une note parfaite est encore loin d'être un médecin-chef autonome, les critères d'évaluation proposés par Google pourraient ne pas constituer une réponse parfaite à la question de l'évaluation des modèles d'IA médicale. Dès 2021 et 2022, des chercheurs ont proposé des lignes directrices pour la publication d'informations, telles que Decid-AI, SPIRIT-AI et INTRPRT, dans l'espoir de guider le développement et la validation précoces de l'IA médicale, en tenant compte de facteurs tels que la praticabilité clinique, la sécurité, les facteurs humains et la transparence/interprétabilité. Tout récemment, la revue Nature Medicine a publié une étude menée par des chercheurs des universités d'Oxford et de Stanford sur l'utilisation de la « validation externe » ou de la « validation locale récurrente » pour valider les outils d'IA.
L'impartialité des outils d'IA est également une orientation d'évaluation importante qui a retenu l'attention cette année dans des articles de Science et du NEJM. L'IA présente souvent des biais car elle se limite aux données d'entraînement. Ces biais peuvent refléter des inégalités sociales, qui peuvent ensuite évoluer vers une discrimination algorithmique. Les National Institutes of Health (NIH) ont récemment lancé l'initiative Bridge2AI, dont le coût est estimé à 130 millions de dollars, afin de constituer des ensembles de données diversifiés (conformément aux objectifs de l'initiative MAIDA mentionnée ci-dessus) permettant de valider l'impartialité des outils d'IA médicale. Ces aspects ne sont pas pris en compte par MultiMedQA. La question de la mesure et de la validation des modèles d'IA médicale nécessite encore une réflexion approfondie.
En janvier, Nature Medicine a publié un article d'opinion intitulé « La prochaine génération de médecine factuelle », rédigé par Vivek Subbiah, du MD Anderson Cancer Center de l'Université du Texas. Cet article examine les limites des essais cliniques mises en évidence dans le contexte de la pandémie de COVID-19 et souligne la contradiction entre innovation et respect du processus de recherche clinique. Enfin, il évoque un avenir de restructuration des essais cliniques : la prochaine génération d'essais cliniques utilisant l'intelligence artificielle, c'est-à-dire l'utilisation de l'intelligence artificielle à partir d'un grand nombre de données de recherche historiques, de données du monde réel, de données cliniques multimodales et de données issues d'appareils portables pour trouver des preuves clés. Cela signifie-t-il que l'IA et les processus de validation clinique par IA pourraient se renforcer mutuellement et évoluer ensemble à l'avenir ? C'est la question ouverte et stimulante de 2023.
Réglementation de l'IA médicale
Les progrès de l'IA posent également des défis en matière de réglementation, et les décideurs politiques du monde entier réagissent avec prudence. En 2019, la FDA a publié pour la première fois un projet de cadre réglementaire pour les modifications logicielles des dispositifs médicaux d'intelligence artificielle (projet de discussion), détaillant son approche potentielle de l'examen préalable à la mise sur le marché des modifications logicielles basées sur l'IA et l'apprentissage automatique. En 2021, la FDA a proposé le « Plan d'action pour les logiciels basés sur l'intelligence artificielle et l'apprentissage automatique en tant que dispositifs médicaux », qui a clarifié cinq mesures réglementaires médicales spécifiques à l'IA. Cette année, la FDA a réédité la soumission préalable à la mise sur le marché des fonctionnalités logicielles des dispositifs afin de fournir des informations sur les recommandations de soumission préalable à la mise sur le marché pour l'évaluation par la FDA de la sécurité et de l'efficacité des fonctionnalités logicielles des dispositifs, y compris certaines fonctionnalités utilisant des modèles d'apprentissage automatique entraînés par ces méthodes. La politique réglementaire de la FDA a évolué d'une proposition initiale à des orientations pratiques.
Suite à la publication de l'Espace européen des données de santé en juillet dernier, l'UE a de nouveau promulgué la loi sur l'intelligence artificielle. La première vise à optimiser l'utilisation des données de santé pour fournir des soins de santé de qualité, réduire les inégalités et étayer les données pour la prévention, le diagnostic, le traitement, l'innovation scientifique, la prise de décision et la législation, tout en garantissant aux citoyens européens un meilleur contrôle de leurs données de santé personnelles. La seconde précise que le système de diagnostic médical est un système d'IA à haut risque, et qu'il doit adopter une supervision rigoureuse et ciblée, une supervision tout au long du cycle de vie et une supervision préalable à l'évaluation. L'Agence européenne des médicaments (EMA) a publié un projet de document de réflexion sur l'utilisation de l'IA pour soutenir le développement, la réglementation et l'utilisation des médicaments, en mettant l'accent sur l'amélioration de la crédibilité de l'IA afin de garantir la sécurité des patients et l'intégrité des résultats de la recherche clinique. Globalement, l'approche réglementaire de l'UE prend progressivement forme, et les modalités finales de mise en œuvre pourraient être plus détaillées et plus strictes. En contraste frappant avec la réglementation stricte de l'UE, le projet de réglementation de l'IA du Royaume-Uni indique clairement que le gouvernement prévoit d'adopter une approche douce et de ne pas promulguer de nouveaux projets de loi ni de créer de nouveaux régulateurs pour le moment.
En Chine, le Centre d'examen technique des dispositifs médicaux (NMPA) de l'Administration nationale des produits médicaux a déjà publié des documents tels que « Points d'examen des logiciels de décision assistée par apprentissage profond », « Principes directeurs pour l'examen de l'enregistrement des dispositifs médicaux d'intelligence artificielle (projet pour commentaires) » et « Circulaire sur les principes directeurs pour la classification et la définition des produits logiciels médicaux d'intelligence artificielle (n° 47 en 2021) ». Cette année, le « Résumé des premiers résultats de la classification des dispositifs médicaux en 2023 » a été publié à nouveau. Cette série de documents clarifie et simplifie la définition, la classification et la réglementation des logiciels médicaux d'intelligence artificielle, et fournit des orientations claires pour le positionnement et l'enregistrement des produits des différentes entreprises du secteur. Ces documents fournissent un cadre et des décisions de gestion pour la réglementation scientifique des dispositifs médicaux d'intelligence artificielle. Il est à noter que l'ordre du jour de la Conférence chinoise sur l'intelligence artificielle médicale, qui s'est tenue à Hangzhou du 21 au 23 décembre, prévoyait un forum spécial sur la gouvernance médicale numérique et le développement de haute qualité des hôpitaux publics, ainsi qu'un forum sur le développement de l'industrie de la normalisation des technologies de test et d'évaluation des dispositifs médicaux d'intelligence artificielle. Des représentants de la Commission nationale du développement et de la réforme et de la NMPA participeront à cette réunion et pourraient publier de nouvelles informations.
Conclusion
En 2023, l'IA médicale a commencé à s'intégrer à l'ensemble du processus médical, en amont comme en aval, couvrant la collecte, la fusion et l'analyse des données hospitalières, le diagnostic et le traitement, ainsi que le dépistage communautaire. Elle collabore également de manière organique avec les professionnels de santé et de lutte contre les maladies, démontrant ainsi son potentiel pour améliorer la santé humaine. Des recherches sur l'IA médicale exploitable commencent à voir le jour. À l'avenir, les progrès de l'IA médicale ne dépendront pas seulement du développement technologique lui-même, mais nécessiteront également la pleine coopération de l'industrie, des universités et de la recherche médicale, ainsi que le soutien des décideurs politiques et des autorités de réglementation. Cette collaboration interdisciplinaire est essentielle à la mise en place de services médicaux intégrant l'IA et favorisera assurément le développement de la santé humaine.
Date de publication : 30 décembre 2023




