L’allarme dei medici: chatbot IA inaffidabili nel 70% dei casi
Un’indagine approfondita ha rivelato che i chatbot medici alimentati dall’Intelligenza Artificiale (IA) possono generare risposte errate in una percentuale preoccupante di situazioni cliniche. Lo studio, premiato dall’ordine dei medici di Milano e dedicato alla memoria di Roberto Anzalone, figura storica della medicina milanese, ha evidenziato come, su un campione di 200 domande, i chatbot abbiano fornito almeno un errore in circa il 70% dei casi. Inoltre, circa il 30% delle risposte conteneva riferimenti bibliografici inaccurati o addirittura inesistenti.
Pubblicazione e metodologia dello studio
La ricerca è stata pubblicata sull’autorevole European Journal of Pathology, organo ufficiale della European Society of Pathology (ESP), e sottolinea l’importanza cruciale dell’esperienza clinica del patologo. I risultati suggeriscono che l’IA dovrebbe essere considerata un valido supporto, ma non un sostituto della competenza umana nel processo diagnostico. Vincenzo Guastafierro, specializzando in Anatomia Patologica presso l’Istituto Clinico Humanitas e Humanitas University di Rozzano, ha spiegato che il progetto, avviato nel 2023, mirava a valutare i rischi associati all’utilizzo dell’IA nella pratica clinica, in particolare dei chatbot impiegati come ausilio all’attività diagnostica e come strumento di apprendimento.
Dettagli dell’indagine: scenari clinici e risultati
I ricercatori hanno creato cinque scenari clinici, simulando un medico patologo che si avvale di ChatGPT per affinare le diagnosi. Sono state formulate 200 domande, sia aperte che a risposta multipla, con o senza riferimenti scientifici, allineate alle attuali linee guida diagnostiche e validate da patologi esperti. L’analisi ha rivelato che ChatGPT ha fornito risposte utili nel 62,2% dei casi, ma solo il 32,1% degli output era privo di errori. Sorprendentemente, il 17,8% dei riferimenti bibliografici forniti dall’IA erano inesistenti, indicando una fabbricazione completa di fonti da parte del sistema.
Errori diagnostici e implicazioni
Tra gli errori più significativi riscontrati, l’IA ha fornito una diagnosi errata di carcinoma alla pelle e ha identificato un tipo di tumore al seno diverso da quello reale, corredando le risposte con fonti bibliografiche errate. Questi risultati sollevano importanti interrogativi sull’affidabilità dell’IA nel settore medico, sia per i professionisti che per i pazienti che potrebbero utilizzarla per autodiagnosi. Nonostante le risposte utili fornite in un terzo dei casi, la frequenza degli errori e la loro variabilità ne sconsigliano l’uso diagnostico di routine. L’imprecisione dei riferimenti suggerisce inoltre cautela nell’utilizzo di questi strumenti come supporto all’apprendimento per i medici.
Il futuro della ricerca e il ruolo insostituibile dell’essere umano
La ricerca continuerà con le versioni più aggiornate dei chatbot per valutare l’evoluzione e l’affidabilità di questi strumenti nel tempo. Tuttavia, i risultati attuali sottolineano il ruolo insostituibile dell’esperienza e del giudizio clinico umano. L’IA può rappresentare un valido supporto, ma non può sostituire la competenza e la capacità di analisi critica del medico.
Riflessioni sull’IA in medicina: un supporto, non un sostituto
I risultati di questo studio ci invitano a riflettere sull’adozione dell’IA in medicina. Sebbene l’Intelligenza Artificiale possa offrire un valido supporto ai professionisti sanitari, automatizzando compiti e fornendo informazioni utili, è fondamentale non delegare completamente a essa il processo decisionale. L’esperienza clinica, il ragionamento critico e l’empatia umana rimangono elementi imprescindibili per una diagnosi accurata e una cura efficace. È necessario un approccio equilibrato, che integri le potenzialità dell’IA con le competenze umane, per garantire la sicurezza e la qualità delle cure.
