L’intelligenza artificiale in medicina sta entrando sempre più spesso nei flussi di lavoro di ospedali, medici e pazienti. Ma un recente editoriale di Nature Medicine invita alla prudenza: le evidenze disponibili, al momento, non sono sufficienti a dimostrare un reale valore clinico diffuso.
Il problema non riguarda solo l’accuratezza dei modelli in laboratorio, ma soprattutto ciò che accade quando vengono usati nel mondo reale, dove i casi sono meno puliti, i sintomi più ambigui e le informazioni spesso incomplete. È proprio qui che la distanza tra promesse e risultati si fa più evidente.
AI in medicina: il problema delle prove insufficienti
Secondo la rivista, le affermazioni sull’impatto dell’AI nella pratica sanitaria sono sempre più frequenti, sia nelle pubblicazioni scientifiche sia nei materiali commerciali delle aziende. Il punto critico è che non esiste ancora un accordo chiaro su quali standard debbano essere rispettati prima di considerare credibile una tecnologia.
Il risultato è un clima di incertezza scientifica che favorisce decisioni affrettate. In alcuni casi, gli strumenti vengono presentati come già pronti per l’adozione, anche se i dati a supporto non sono abbastanza solidi. Per Nature Medicine, questo squilibrio tra entusiasmo e verifica rappresenta un rischio concreto per pazienti e sistemi sanitari.
Un episodio recente aiuta a capire la portata del problema: una ricercatrice dell’Università di Göteborg ha inserito due studi falsi in un server di preprint, inventando perfino una malattia della pelle inesistente. Nonostante ciò, altre riviste peer-reviewed hanno citato quei lavori come se fossero fonti reali. Un segnale inquietante su quanto sia fragile l’ecosistema informativo in cui si muove anche l’AI.
Quando i modelli sbagliano con sintomi ambigui
Le criticità emergono soprattutto nei contesti più realistici. I modelli di AI possono produrre diagnosi dettagliate anche in assenza di dati sufficienti e, in alcuni casi, cadere in trappole costruite apposta dai ricercatori. Ma il problema non è solo tecnico: è clinico.
Uno studio citato in area JAMA Medicine mostra che, quando vengono presentati sintomi ambigui, cioè proprio la situazione più comune nella pratica quotidiana, i sistemi di AI falliscono la diagnosi corretta in oltre l’80% dei casi. È una percentuale che ridimensiona parecchio l’idea di un supporto diagnostico già affidabile in ogni scenario.
In condizioni sperimentali perfette, con dati ordinati e casi ben definiti, l’AI può sembrare molto efficace. Nella realtà, però, i pazienti hanno storie cliniche complesse, referti parziali e segnali non univoci. È in questo passaggio dal laboratorio al reparto che le prestazioni tendono a crollare.
La spinta verso l’adozione e la richiesta della rivista
Nonostante queste fragilità, milioni di persone chiedono già consigli medici ai chatbot, spesso al posto di un confronto con professionisti reali. In parallelo, anche grandi aziende stanno spingendo servizi dedicati, come strumenti che invitano gli utenti a caricare documenti clinici e referti. Il rischio è che l’uso cresca più rapidamente della comprensione dei limiti.
Per questo Nature Medicine chiede criteri chiari e condivisi per valutare l’AI in ambito sanitario: modalità di test, parametri di riferimento e metriche comparabili. Senza regole solide, avverte la rivista, le promesse rischiano di correre molto più veloce delle prove.
Il messaggio finale è netto: l’adozione dell’AI in medicina non può basarsi solo sull’innovazione percepita. Quando si parla di salute, anche un piccolo scarto tra aspettative e realtà può tradursi in conseguenze molto concrete. E spesso, purtroppo, anche gravi.











