Focus

Nuovo record nella soluzione strutturale ab-initio delle proteine

Mentre il problema della fase in cristallografia è definitivamente risolto per le piccole molecole, esso è ancora una sfida per la cristallografia macromolecolare. Questa è una delle aree più stimolanti delle Scienze Moderne e costituisce lo strumento primario per studi strutturali su sistemi biologici complessi, e per spiegare i meccanismi alla base della vita. Infatti la cristallografia delle macromolecole permette di determinare la struttura cristallina di proteine, acidi nucleici, virus, etc. e fornisce dettagli per la comprensione di una larga varietà di processi vitali, quali la fotosintesi, la trasmissione delle informazioni ereditarie, delle infezioni virali, etc.
Di primaria importanza per la cristallografia macromolecolare sono i metodi cristallografici per la soluzione delle strutture cristalline: la loro efficacia è responsabile del successo o del fallimento della ricerca e governa gli aspetti economici delle attività (l'innovazione nei metodi può accelerare la ricerca, permette di risparmiare mesi-uomo e risorse, migliora la qualità dei risultati, facilita la creazione di gruppi di ricerca e servizi scientifici).
Generalmente la complessità molecolare e la bassa risoluzione dei dati sperimentali rendono i dati della sola proteina nativa insufficienti per la soluzione strutturale. Sono perciò utilizzate oltre alle tecniche ab-initio, quelle denominate SIR (Single Isomorphous Replacement), MIR (Multiple Isomorphous Replacement), SAS (Single Anomalous Scattering), MIRAS (combinazione delle tecniche MIR con gli effetti di diffusione anomala), MAD (Multiple Anomalous Dispersion) e MR (Molecular Replacement) costituiscono il corpo dei metodi attualmente adoperati per pervenire alla conoscenza delle strutture macromolecolari.

La ricerca sviluppata dall'IC ha dato un contributo rilevante in molti dei campi precedentemente illustrati. In particolare:
a) sono state sviluppate tecniche ab-initio che portano i limiti della risoluzione atomica a 2.0 Ångstrom, estendendo così largamente il numero di strutture trattabili con tali tecniche;
b) sono stati introdotti algoritmi per l'estrapolazione dei riflessi non misurati (Free-Lunch) per strutture con risoluzione non atomica. Essi sono in grado di favorire la soluzione e migliorare la interpretabilità delle mappe di densità elettronica;
c) sono state integrate le tecniche SIR-MIR-SIRAS-MIRAS-SAD-MAD con i metodi diretti: questi sono stati resi idonei al trattamento degli errori, sia quelli provenienti dagli esperimenti, che quelli legati al modello strutturale o alla perdita d'isomorfismo. Il metodo delle joint probability distribution functions è stato lo strumento matematico usato per la derivazione delle nuove formule.
Le nuove teorie probabilistiche ed i nuovi algoritmi sono state implementati in un package per la risoluzione automatica del problema della fase nelle macromolecole, denominato Il Milione (1).

L'applicazione a centinaia di strutture test di proteine mostra l'alta efficienza dell'approccio, la sua validità a fronte degli errori sperimentali, la sua capacità di fornire automaticamente un sensibile modello strutturale della proteina, praticamente senza l'intervento dell'utente. Sino al 2006 la più grande proteina risolta con tecniche ab-initio era la cytochrome C3 (Sheldrick 1998, 218 residui). Questo limite è stato superato nel 2006 da Mooers & Matthews che, utilizzando Sir2002, hanno risolta la struttura della bacteriophage P22 lysozyme (292 residui). Successivamente il software sviluppato dell'IC è stato in grado di estendere la complessità strutturale delle proteine risolvibili ab-initio portando il limite a 748 residui. Negli ultimi giorni è stato superato il record, detenuto comunque dai programmi sviluppati dall'IC, della proteina più grande risolta con tecniche ab-initio, raggiungendo il limite di 984 residui. La proteina, 1.65Å di risoluzione, PDB code 1E3U, si risolve in maniera del tutto automatica in 80 minuti. Il Milione costituisce un prezioso strumento per lo sviluppo della genomica e post-genomica ed è a disposizione della comunità scientifica. Il software è scaricabile dal sito web dell'Istituto di Cristallografia (www.ic.cnr.it).


(1) M.C. Burla, R. Caliandro, M. Camalli, B. Carrozzini, G.L. Cascarano, L. De Caro, C. Giacovazzo, G. Polidori, D. Siliqi, R. Spagna (2007). IL MILIONE: a suite of computer programs for crystal structure solution of proteins - J. Appl. Cryst. 40, 609-613