Un nuovo studio, pubblicato sulla rivista JAMA Network Open, ha esaminato i fattori di rischio per i casi gravi di Covid-19 analizzando la progressione della malattia nel corso del tempo. Il tutto è stato realizzato grazie al supporto di modelli di machine learning per prevedere quali pazienti ospedalizzati avrebbero sviluppato un decorso grave sulla base delle informazioni raccolte durante il primo giorno di ricovero.
Covid-19, uno studio complesso con il machine learning per capire meglio la malattia
Per spiegare meglio di cosa tratta lo studio è bene partire dall’inizio. Un archivio centralizzato di cartelle cliniche legate al Covid-19 è stato creato lo scorso anno e sta adesso iniziando a mostrare i primi risultati. Stiamo parlando del più grande set di tracking della malattia mai creato finora, gestito da un team di ricercatori ed esperti che ha voluto vederci chiaro sfruttando le ultime tecnologie.
Il database centralizzato è chiamato National Covid Cohort Collaborative Data Enclave, o più semplicemente N3C, e ha utilizzato i dati di 34 centri medici includendo le informazioni di oltre 1 milioni di adulti: di questi, 174.568 sono risultati positivi al virus e 1.133.848 sono invece risultati negativi. L’archivio racchiude informazioni per l’intero anno solare 2020.
Ora, l’analisi si concentra su come il trattamento per combattere l’infezione da Covid-19 sia cambiato nel corso dei dodici mesi dello scorso anno, visto che i medici hanno provato nuovi trattamenti e acquisito di conseguenza maggiore esperienza. Durante il 2020, i trattamenti sono cambiati, i tassi di sopravvivenza hanno risposto alle cure sempre più efficaci e le varie complicanze riscontrate nei pazienti sono diventate col tempo più facili da combattere.
Il team di ricerca ha allora costruito modelli di apprendimento automatico utilizzando queste e altre informazioni che potrebbero prevedere quali pazienti rischiano di ammalarsi gravemente una volta contratta l’infezione. Questi modelli di machine learning possono eventualmente essere utilizzati come base per prendere decisioni riguardo test aggiuntivi.
Una risorsa come N3C non è perfetta, ma elude le tipiche limitazioni degli studi che avvengono in casi come questo, spesso confezionati a livello locale e dunque incapaci di avere un quadro d’insieme della situazione. L’archivio utilizzato dai ricercatori adesso include le informazioni di ben 73 strutture sanitarie, per oltre 2 milioni di pazienti da Covid-19. Da queste informazioni, sono nati più di 200 progetti di ricerca.
Come detto, non si tratta di un sistema perfetto, ma avere a disposizione un insieme di dati così vasto e vario è assolutamente importante per progettare nuovi strumenti con cui debellare la malattia. Lo scorso autunno, Elaine Hell, economista della salute dell’Università di Rochester, aveva ammesso ai microfoni di The Verge che questo sistema permette di condurre studi impossibili da affrontare con le sole risorse della propria istituzione.