Un nuovo modello di apprendimento automatico potrebbe aiutare i funzionari della sanità pubblica ad affrontare la prossima crisi
Diagnosticare e contenere un’epidemia o gli effetti sulla salute di un evento distruttivo come un disastro naturale può essere un compito enorme. Uno studio pubblicato venerdì dalla New York University suggerisce che un nuovo modello di apprendimento automatico potrebbe migliorare la capacità dei funzionari sanitari di rispondere alle future pandemie e ad altre crisi sanitarie pubbliche.
La ricerca è stata condotta in collaborazione con la Carnegie Mellon University e il Dipartimento di Salute e Igiene Mentale di New York City.
Kimberly Adams di Marketplace parla con Daniel Neill, professore di informatica alla New York University e direttore del suo Machine Learning for Good Laboratory, che ha pubblicato lo studio. Spiega come funziona questo modello di apprendimento automatico. Quella che segue è una trascrizione modificata della loro conversazione.
Daniel Neill: Il nostro approccio utilizza dati testuali provenienti dalle visite al pronto soccorso. Quindi, in particolare, la cosa principale per cui il paziente è venuto al pronto soccorso. E quei dati testuali contengono dati molto più ricchi del semplice "una persona ha sintomi simil-influenzali". Potremmo sapere esattamente che tipo di sintomi hanno o a cosa sono stati esposti, e quindi, rilevando modelli in questi dati testuali, possiamo far emergere nuovi focolai, cose che la salute pubblica non stava già cercando così come altri tipi di eventi.
Kimberly Adams:Come potrebbe essere implementato questo algoritmo in un dipartimento sanitario per identificare focolai di malattie nuove o non identificate?
Neill: La speranza è che i dipartimenti di sanità pubblica adottino effettivamente questo tipo di approccio su base giornaliera, in cui ogni giorno l'algoritmo farebbe emergere cluster di dati nelle ultime 24 ore, diciamo, che la sanità pubblica potrebbe esaminare e, se necessario, rispondere a. Può anche aiutare la salute pubblica ad affrontare tutte le miriadi di cose che deve affrontare quotidianamente, che potrebbero essere un gruppo di casi derivanti dall'inalazione di fumo, o una sorta di esposizione chimica, o stiamo assistendo a un nuovo gruppo di overdose a causa di alcune nuove droghe sintetiche. Quindi, ancora una volta, l'obiettivo è dare loro la consapevolezza quotidiana di tutto ciò che accade nella loro giurisdizione.
Adams:Quindi forse potresti individuare, non so, un'epidemia di qualcosa come la malattia dei legionari prima di quanto faresti altrimenti?
Neill: Si, è esatto. Questo è un bell'esempio di qualcosa con sintomi rari. E potete anche immaginare se si presenta qualcosa con sintomi nuovi, cose che non abbiamo mai visto prima, come se il naso delle persone diventasse blu e cadesse. Ora, non dovrebbero volerci molti casi del genere per renderci conto che abbiamo qualcosa di nuovo e diverso di cui la salute pubblica deve occuparsi. Ma l’ironia è che i tipici sistemi di sorveglianza delle malattie si limiteranno a mapparli alle categorie di sindromi esistenti e sostanzialmente non si accorgeranno del fatto che in realtà c’è qualcosa di nuovo lì. Quindi ciò che forniamo è una rete di sicurezza per catturare tutti quei tipi di eventi che altri sistemi potrebbero perdere.
Adams:Cosa succede se c'è una lacuna nei dati o semplicemente non ci sono persone che parlano dei loro sintomi?
Neill: Giusto. Questa è assolutamente una limitazione del sistema, che dipende dalla qualità dei dati, dalla disponibilità e dalla tempestività dei dati. Quindi, ad esempio, se una giurisdizione non riceve tempestivamente i dati del pronto soccorso dagli ospedali locali, ciò avrà un impatto su tutta la sua capacità di rispondere a qualsiasi modello presente in tali dati. Allo stesso modo, se si verificassero errori gravi nel modo in cui sono stati raccolti i dati, questi potrebbero potenzialmente propagarsi a ciò che possiamo rilevare utilizzando tali dati. Inoltre, hai assolutamente ragione, le cose che potrebbero non comportare visite al pronto soccorso non sarebbero necessariamente rilevabili attraverso questa particolare fonte di dati. Esiste, tuttavia, un’ampia varietà di fonti di dati che la sanità pubblica utilizza per il rilevamento delle epidemie.
Adams: Uno dei modi in cui avete testato questo algoritmo è stato esaminando i dati arrivati negli ospedali dopo l'uragano Sandy. Puoi spiegarmi cosa hai visto e come ha risposto l'algoritmo?