211service.com
Un algoritmo impostato per rivoluzionare la scoperta della struttura proteica 3-D
Una delle grandi sfide della biologia molecolare è determinare la struttura tridimensionale di grandi biomolecole come le proteine. Ma questo è un compito notoriamente difficile e che richiede tempo.

La tecnica standard è la cristallografia a raggi X, che prevede l'analisi del pattern di diffrazione dei raggi X da un cristallo della molecola in esame. Funziona bene per le molecole che formano facilmente cristalli.
Ma molte proteine, forse la maggior parte, non formano cristalli facilmente. E anche quando lo fanno, spesso assumono configurazioni innaturali che non assomigliano alla loro forma naturale.
Quindi trovare un altro modo affidabile per determinare la struttura 3D di grandi biomolecole sarebbe un enorme passo avanti. Oggi, Marcus Brubaker e un paio di amici dell'Università di Toronto in Canada affermano di aver trovato un modo per migliorare notevolmente una tecnica di imaging 3-D che non ha mai eguagliato l'utilità della cristallografia a raggi X.
La nuova tecnica si basa su un processo di imaging chiamato criomicroscopia elettronica. Questo inizia con una soluzione purificata della molecola bersaglio che viene congelata in una pellicola sottile spessa solo una singola molecola.
Questo film viene quindi fotografato utilizzando un processo noto come microscopia elettronica a trasmissione: viene bombardato da elettroni e quelli che lo attraversano vengono registrati. In sostanza, questo produce ombretti bidimensionali delle molecole nel film. I ricercatori quindi scelgono ogni shadowgram e li usano per elaborare la struttura tridimensionale della molecola bersaglio.
Questo processo è difficile per una serie di motivi. Innanzitutto, c'è un'enorme quantità di rumore in ogni immagine, quindi anche l'ombra bidimensionale è difficile da distinguere. In secondo luogo, non c'è modo di conoscere l'orientamento della molecola quando è stata scattata l'ombra, quindi determinare la forma 3D è un'impresa enorme.
L'approccio standard per risolvere questo problema è poco più che congetture. Sogna una potenziale struttura 3D per la molecola e poi ruotala per vedere se può generare tutti gli shadowgram nel set di dati. In caso contrario, modificare la struttura, testarla e così via.
Ovviamente, questo è un processo che richiede tempo. L'attuale algoritmo all'avanguardia in esecuzione su 300 core impiega due settimane per trovare la struttura 3D di una singola molecola da un set di dati di 200.000 immagini.
Brubaker e co hanno sviluppato un metodo molto più veloce che può fare lo stesso lavoro in sole 24 ore lavorando su una singola workstation. La tecnica si basa su due innovazioni algoritmiche.
Il primo sfrutta il fatto che le immagini sono rumorose e quindi contengono grandi quantità di informazioni ridondanti. Il team risolve questo problema utilizzando un algoritmo che rimuove gran parte di questa ridondanza, lasciando solo un sottoinsieme dei dati originali. Il trucco, ovviamente, è sbarazzarsi dei dati inutili mantenendo le cose utili, qualcosa che gestiscono utilizzando un approccio di apprendimento automatico.
Ciò riduce la quantità di dati da elaborare, ma l'accelerazione principale deriva dalla seconda innovazione, una tecnica statistica chiamata campionamento di importanza.
L'idea principale qui è che alcuni dati sono più importanti di altri nel determinare la struttura 3D finale. Quindi trovare un modo per concentrarsi su quelli può accelerare notevolmente il processo.
Brubaker e co hanno trovato proprio un tale approccio. Si scopre che le grandi molecole congelate in film sottili finiscono quasi sempre per giacere su un fianco. Quindi gli shadowgram mostrano quasi sempre le molecole in questa posa piuttosto che in piedi sulla testa o sul sedere.
Costruire questa conoscenza nell'algoritmo aumenta notevolmente la velocità con cui si deposita su una potenziale struttura 3-D poiché può ignorare la possibilità che le immagini mostrino la molecola dall'alto o dal basso.
Il miglioramento che ne deriva è enorme. Ciò porta a incrementi di 100.000 volte o più, consentendo di determinare le strutture in un giorno su una moderna workstation, afferma Brubaker e co.
Il team prosegue dimostrando la propria tecnica su una serie di shadowgram di due note biomolecole. Il primo set di dati è costituito da più di 46.000 immagini di una grande molecola transmembrana chiamata ATP sintasi dal termofilo batteri. Il secondo consiste in quasi 6000 immagini di ATP sintasi mitocondriale bovina.
Il team ha anche sintetizzato un terzo set di dati prendendo 40.000 shadowgram casuali di GroEL-GroES-(ADP)7, una biomolecola con una struttura nota. Hanno quindi utilizzato il loro algoritmo per lavorare all'indietro per ricreare la struttura originale.
Infine, il team confronta il suo approccio con altri modelli all'avanguardia e mostra che il nuovo algoritmo supera in modo significativo questi metodi standard.
Questo è un risultato impressionante che ha il potenziale per cambiare radicalmente il panorama per i biologi molecolari che hanno lottato per anni per trovare nuovi metodi affidabili per determinare la struttura di grandi biomolecole.
La criomicroscopia elettronica sembra destinata ad assumere questo ruolo. Ed è probabile che la tecnica migliori man mano che la risoluzione di questa forma di microscopia migliora nei prossimi anni.
Rif: a rxiv.org/abs/1504.03573 : Costruzione di proteine in un giorno: efficiente ricostruzione molecolare 3-D