Un team di ricercatori dell’Università di Washington ha programmato un software con apprendimento automatico capace di sviluppare proteine che possono essere utili come vaccini, trattamenti contro il cancro o persino strumenti per eliminare l’inquinamento da carbonio dall’aria. Lo studio è stato portato avanti dalla University of Washington School of Medicine e dalla Harvard University.
I risultati della ricerca sono stati pubblicati sulla rivista scientifica Science.
Apprendimento automatico generara farmaci e vaccini: ecco che cosa ha rivelato lo studio
“Le proteine che troviamo in natura sono molecole straordinarie, ma le proteine progettate possono fare molto di più”, ha affermato l’autore senior David Baker, un ricercatore HHMI e Professore di biochimica alla UW Medicine: “In questo lavoro, mostriamo che l’apprendimento automatico può essere utilizzato per progettare proteine con un’ampia varietà di funzioni”.
Per decenni, gli scienziati hanno utilizzato i computer per cercare di ingegnerizzare le proteine. Alcune proteine, come gli anticorpi e le proteine leganti sintetiche, sono state adattate in medicinali per combattere il COVID-19. Altri, come gli enzimi, aiutano nella produzione industriale. Ma una singola molecola proteica contiene spesso migliaia di atomi legati e anche con software scientifico specializzato, sono difficili da studiare e ingegnerizzare.
Ispirato dal modo in cui gli algoritmi di apprendimento automatico possono generare storie o persino immagini dai prompt, il team ha deciso di costruire un software simile per la progettazione di nuove proteine: “L’idea è la stessa: le reti neurali possono essere addestrate per vedere i modelli nei dati. Una volta addestrate, puoi dargli un suggerimento e vedere se può generare una soluzione elegante. Spesso i risultati sono convincenti o addirittura belli”, ha affermato il lead autore Joseph Watson, studioso post-dottorato presso UW Medicine.
L’équipe di biologi ha addestrato più reti neurali utilizzando le informazioni della Protein Data Bank, che è un archivio pubblico di centinaia di migliaia di strutture proteiche di tutti i regni della vita. Le reti neurali che ne sono risultate hanno sorpreso anche gli scienziati che le hanno create.
Gli scienziati hanno prodotto due approcci per la progettazione di proteine con nuove funzioni. Il primo, soprannominato “hallucination“, è simile a DALL-E o altri strumenti di IA generativa che producono nuovo output basato su semplici prompt. Il secondo, soprannominato “inpainting“, è analogo alla funzione di completamento automatico che si trova nelle moderne barre di ricerca e nei client di posta elettronica.
“La maggior parte delle persone può inventare nuove immagini di gatti o scrivere un paragrafo da un prompt se richiesto, ma con il design delle proteine, il cervello umano non può fare ciò che i computer ora possono fare”, ha affermato l’autrice principale Jue Wang, una ricercatrice post-dottorato presso UW Medicine. “Gli esseri umani non riescono a immaginare come potrebbe essere la soluzione, ma abbiamo creato macchine che lo fanno”, ha spiegato la scienziata, riferendosi all’apprendimento automatico.
Per spiegare in che modo le reti neurali “allucinano” una nuova proteina, la squadra di scienziati lo ha paragonato con il modo in cui potrebbe scrivere un libro: “Inizi con un assortimento casuale di parole, totalmente incomprensibili. Poi imposti un requisito come quello nel paragrafo di apertura, deve essere una notte buia e tempestosa.Quindi il computer con apprendimento automatico cambierà le parole una alla volta e si chiederà: “Questo dà più senso alla mia storia?” Se lo fa, manterrà le modifiche finché non sarà una storia completa scritto”, ha spiegato Wang.
Sia i libri che le proteine possono essere intesi come lunghe sequenze di lettere. Nel caso delle proteine, ogni lettera corrisponde a un elemento costitutivo chimico chiamato amminoacido. A partire da una catena casuale di amminoacidi, il software ad apprendimento automatico muta la sequenza più e più volte fino a quando non viene generata una sequenza finale che codifica la funzione desiderata. Queste sequenze amminoacidiche finali codificano per proteine che possono poi essere prodotte e studiate in laboratorio.
La squadra di biologi ha anche dimostrato che le reti neurali possono riempire i pezzi mancanti di una struttura proteica in pochi secondi. Tale software potrebbe aiutare nello sviluppo di nuovi farmaci: “Con il completamento automatico, o ‘dipinto proteico’, iniziamo con le caratteristiche chiave che vogliamo vedere in una nuova proteina, quindi lasciamo che il software elabori il resto. Queste caratteristiche possono essere motivi di legame noti o persino siti attivi di enzimi”, ha specificato Watson.
Tutti i vaccini funzionano presentando un frammento di un agente patogeno al sistema immunitario. Gli scienziati spesso sanno quale pezzo funzionerebbe meglio, ma creare un vaccino che raggiunga la forma molecolare desiderata può essere difficile. Utilizzando le nuove reti neurali, il team di studiosi ha sfruttato l’apprendimento automatico per riuscire a sviluppare nuove proteine che includessero il frammento patogeno necessario come parte della loro struttura finale. Il software è stato libero di progettare qualsiasi struttura di supporto attorno al frammento chiave, generando diversi potenziali vaccini con diverse forme molecolari.
“Ho iniziato a lavorare sul vaccino solo come un modo per testare i nostri nuovi metodi, ma nel bel mezzo del lavoro al progetto, mio figlio di due anni è stato infettato da RSV e ha trascorso una serata al pronto soccorso per controllare i polmoni.Qusata vicenda mi ha fatto capire che anche i problemi di “test” su cui stavamo lavorando erano in realtà piuttosto significativi”, ha affermato Wang.