Une première méta-analyse sur le sujet vient de paraitre dans "the Lancet, digital health" .
Les auteurs ont pu analyser les données de 14 études relatives à la performance comparée des médecins, et de l’intelligence artificielle dite d’apprentissage profond.
Les calculs permettent de produire des indices de sensiblité et de spécificité à partir de la véracité du diagnostic posé (calculs à partir des diagnostic Vrai Poisitifs ou Negatif ou Faux Positif et Negatif). Les diagnostic sont posés à partir de multiples données cliniques et examens complémentaires sans confrontation directe au patient, on en est pas encore là pour l’IA.
On obtient les résultats suivants :

IA :
sens = 0.87 [IC : 0.83 ; 0.90]
spé = 0.925 [IC : 0.851 ; 0.964]

Humain :
sens = 0.864 [IC : 0.799 ; 0.91]
spé = 0.905 [IC : 0.806 ; 0.957]

Donc des résultats comparables avec un leger avantage à l’IA non significative (pour le moment !) et un intervalle de confiance plus serré.
Les auteurs notent toutefois des lacunes méthodologiques fréquentes dans les protocoles, mais bon, l’IA en passe de devenir plus performante que l’humain pour la pose d’un diagnostic, ça en prend bien le chemin.
Cela doit il remmettre en cause la présence des médecins, surement pas mais peut être à l’avenir un changement de rôle vis à vis du patient, peut être. Sinon on peut aussi imaginer une scène d’avenir du robot humanoïde qui conduit la consultation, ou du smartphone qui deviendrait votre médecin de famille. Il faut avouer que cela pourrait être sacrément pratique.

C’est en accès libre :

Liu X, Faes L, Kale AU, Wagner SK, Fu DJ, Bruynseels A, et al. A comparison of deep learning performance against health-care professionals in detecting diseases from medical imaging: a systematic review and meta-analysis. Lancet Digital Health. Published online September 24, 2019. DOI: 10.1016/ S2589-7500(19)30123-2