Loading…
Transcript

DNA & RNA

IL DNA

Il DNA fu inizialmente isolato dal biochimico svizzero Friedrich Miescher, il quale, nel 1869, individuò una sostanza microscopica contenuta nel pus di bende chirurgiche utilizzate. Dal momento che tale molecola aveva la sua localizzazione nel nucleo, egli la chiamò nucleina.

Nel 1943 Oswald Theodore Avery dimostrò, in un celebre esperimento insieme a Colin MacLeod e Maclyn McCarty, che il DNA è il principio trasformante alla base di questo fenomeno. Il ruolo del DNA nell'ereditarietà è stato provato, infine, nel 1953 da Alfred Hershey e Martha Chase attraverso un altro classico esperimento, che dimostrò che il materiale genetico del fago T2 è effettivamente il DNA.

CHE COS'E' IL DNA?

Il DNA è un lungo polimero costituito da unità ripetute di nucleotidi. La catena del DNA è larga tra i 22 ed i 26 Ångström (da 2,2 a 2,6 nanometri) ed ogni unità nucleotidica è lunga 3,3 Ångstrom (0,33 nanometri). Sebbene ogni unità occupi uno spazio decisamente ridotto, la lunghezza dei polimeri di DNA può essere sorprendentemente elevata, dal momento che ogni filamento può contenere diversi milioni di nucleotidi. Ad esempio, il più grande cromosoma umano (il cromosoma 1) contiene quasi 250 milioni di paia di basi.

Negli organismi viventi, il DNA non è quasi mai presente sotto forma di singolo filamento, ma come una coppia di filamenti saldamente associati tra loro. Essi si intrecciano tra loro a formare una struttura definita doppia elica. Ogni nucleotide è costituito da uno scheletro laterale, che ne permette il legame covalente con i nucleotidi adiacenti, e da una base azotata, che instaura legami idrogeno con la corrispondente base azotata presente sul filamento opposto. Il composto formato da una base azotata legata allo zucchero è definito nucleoside; un nucleotide è invece un nucleoside a cui sono legati uno o più gruppi fosfato.

La struttura laterale del DNA è composta da unità ripetute ed alternate di gruppi fosfato e di 2-deossiribosio, uno zucchero pentoso (a cinque atomi di carbonio) che si lega ai fosfati adiacenti attraverso legami fosfodiesterici presso il terzo ed il quinto carbonio; in pratica, ogni molecola di fosfato forma un ponte molecolare collegando, attraverso legami fosfodiesterici, il carbonio in posizione 3′ di una molecola di deossiribosio con quello in posizione 5′ dello zucchero successivo. Conseguenza di questi legami asimmetrici è che ogni filamento di DNA ha un senso, determinato dalla direzione dei legami fosfodiesterici. Le basi azotate, invece, si uniscono in posizione 1' dello zucchero desossiribosio con legami N-glicosidici. In una doppia elica, il senso di un filamento è opposto a quello del filamento complementare. Per tale motivo, i due filamenti che costituiscono una doppia elica sono detti antiparalleli. Le estremità asimmetriche di un filamento di DNA sono definite estremità 5′ (cinque primo) ed estremità 3′ (tre primo). La principale differenza tra il DNA e l'RNA è lo zucchero pentoso utilizzato: l'RNA, infatti, utilizza il ribosio.

La doppia elica del DNA è stabilizzata dai legami idrogeno che si instaurano tra le basi azotate presenti sui due filamenti. Le quattro basi che sono presenti nel DNA sono l'adenina (abbreviata con la lettera A), la citosina (C), la guanina (G) e la timina (T). Tutte e quattro le basi hanno struttura eterociclica, ma adenina e guanina sono, dal punto di vista strutturale, derivate della purina, e pertanto dette basi puriniche, mentre citosina e timina sono correlate alla pirimidina e dette basi pirimidiniche. Esiste una quinta base, di tipo pirimidinico, chiamata uracile (U), ma essa non è di norma presente nelle catene di DNA. L'uracile è altresì presente nei filamenti di RNA al posto della timina, dalla quale si differenzia per la mancanza di un gruppo metile. L'uracile è presente nel DNA solo come prodotto della degradazione della citosina. Solo nel batteriofago PBS1 tale base può essere utilizzata all'interno del DNA. Al contrario, è molto più frequente individuare la timina all'interno di molecole di RNA, a causa della metilazione enzimatica di diversi uracili. Questo evento avviene solitamente a carico di RNA con funzione strutturale o enzimatica (rRNA e tRNA).

La doppia elica è una spirale destrorsa. Con l'avvitarsi su sé stessi dei due filamenti, restano esposti dei solchi tra i diversi gruppi fosfato. Il solco maggiore è largo 22 Å, mentre il solco minore è largo 12 Å. La differente ampiezza dei due solchi si traduce concretamente in una differente accessibilità delle basi, a seconda che si trovino nel solco maggiore o minore. Proteine che legano il DNA, come i fattori di trascrizione, dunque, solitamente prendono contatto con le basi presenti nel solco maggiore.

Ogni tipo di base presente su un filamento forma un legame con la base posta sul filamento opposto. Tale evento è noto come appaiamento complementare. Le basi puriniche formano legami idrogeno con le basi pirimidiniche: A può legare solo T e G può legare solo C. L'associazione di due basi viene comunemente chiamata paio di basi ed è l'unità di misura maggiormente utilizzata per definire la lunghezza di una molecola di DNA. Dal momento che i legami idrogeno non sono covalenti, essi possono esser rotti e riuniti in modo relativamente semplice, poiché questi sono legami ad alta energia. I due filamenti possono essere allontanati tra loro, come avviene per una cerniera, sia dalle alte temperature che da un'azione meccanica (come avviene durante la replicazione del DNA).Conseguenza di questa complementarità è che tutte le informazioni contenute nella doppia elica possono essere duplicate a partire da entrambi i filamenti, evento fondamentale per una corretta replicazione del DNA.

I due tipi di paia di basi formano un numero differente di legami idrogeno: A e T ne formano due, G e C tre. Per tale motivo, la stabilità del legame GC è decisamente maggiore di quello AT. Di conseguenza, la stabilità complessiva di una molecola di DNA è direttamente correlata alla frequenza di GC presenti nella molecola stessa, nonché alla lunghezza dell'elica: una molecola di DNA è dunque tanto più stabile quanto più contiene GC ed è lunga. Un'altra conseguenza di tale evento è il fatto che le regioni di DNA che devono essere separate facilmente contengono un'elevata concentrazione di A e T, come avviene ad esempio per il Pribnow box dei promotori batterici, la cui sequenza è infatti TATAAT.

SENSO E ANTISENSO

Una sequenza di DNA è definita senso se la sua sequenza è la stessa del relativo RNA. La sequenza posta sul filamento opposto è invece detta antisenso. Dal momento che le RNA polimerasi lavorano producendo una copia complementare, il filamento necessario per la trascrizione è l'antisenso. Sia nei procarioti che negli eucarioti vengono prodotte numerose molecole di RNA antisenso a partire dalle sequenze senso. La funzione di questi RNA non codificanti non è stata ancora completamente chiarita. Si ritiene che gli RNA antisenso possano giocare un ruolo nella regolazione dell'espressione genica.

Esistono alcune sequenze di DNA, sia in procarioti che in eucarioti (ma soprattutto nei plasmidi e nei virus) in cui la differenza tra sequenze senso ed antisenso è meno chiara, dal momento che le sequenze di alcuni geni si sovrappongono tra loro. In questi casi, dunque, alcune sequenze rivestono un doppio compito: codificare una proteina se lette in direzione 5'→3′ su un filamento; codificarne un'altra se lette sull'altro (sempre in direzione 5'→3′). Nei batteri, questa sovrapposizione genica è spesso coinvolta nella regolazione della trascrizione, mentre nei virus il fenomeno è dovuto alla necessità di contenere in un piccolo genoma un'elevata quantità di informazioni. Un altro modo di ridurre le dimensioni genomiche è quello individuato da altri virus, che contengono molecole di DNA lineare o circolare a singolo filamento

Strutture alternative a doppia elica

Il DNA esiste in diversi tipi di conformazioni. Esse sono denominate A-DNA, B-DNA, C-DNA, D-DNA,E-DNA, H-DNA, L-DNA, P-DNAe Z-DNA. In ogni caso, solo le conformazioni A-DNA, B-DNA e Z-DNA sono state osservate nei sistemi biologici naturali. La conformazione del DNA può dipendere dalla sequenza, dal superavvolgimento, dalla presenza di modificazioni chimiche delle basi o dalle condizioni del solvente, come la concentrazione di ioni metallici.Di tali conformazioni, la conformazione B è la più frequente nelle condizioni standard delle cellule. Le due conformazioni alternative sono differenti dal punto di vista della geometria e delle dimensioni.

La forma A è un'ampia spirale destrorsa (il solco minore è largo ma poco profondo, quello maggiore è più stretto e profondo), con un passo di 2,9 nm (circa 11bp) ed un diametro di 2,5 nm. Tale conformazione è presente in condizioni non fisiologiche, quando il DNA viene disidratato. In condizioni fisiologiche, questa conformazione caratterizza gli eteroduplex di DNA e RNA e i complessi formati dalle associazioni DNA-proteina.

Le strutture del DNA A, B e Z

La conformazione Z è tipica invece delle sequenze che presentano modificazioni chimiche come la metilazione, e dei tratti di DNA ricchi di basi C e G. Essa assume un andamento sinistrorso, opposto rispetto alla conformazione B. Ha un passo di 4,6 nm ed un diametro di 1,8 nm, il solco maggiore più superficiale e quello minore più stretto; deve il suo nome all'andamento a zig-zag che la caratterizza. Queste strutture inusuali possono essere riconosciute da specifiche Z-DNA-binding proteins, con conseguenze notevoli nella regolazione della trascrizione, anche se non ne sono stati trovati esempi in natura.

Strutture alternative alla doppia elica

Le regioni terminali dei cromosomi lineari sono sequenze ripetute dette telomeri. La funzione principale di tali regioni è quella di permettere alla cellula di replicare le estremità dei cromosomi senza che ci sia perdita di informazioni geniche, dal momento che le DNA polimerasi coinvolte nella replicazione del DNA non sono in grado di replicare le estremità 3' dei cromosomi. Se un cromosoma non avesse telomeri, infatti, diventerebbe un po' più corto ad ogni replicazione, con il rischio di perdere sequenze codificanti. Attraverso un particolare tipo di DNA polimerasi (detto telomerasi), invece, i telomeri mantengono costantemente la loro lunghezza, proteggendo così la parte interna del cromosoma. Nelle cellule umane, i telomeri sono composti da alcune migliaia di ripetizioni di una semplice sequenza costituita da TTAGGG.

Questa sequenza ricca in guanina può stabilizzare le estremità dei cromosomi formando strutture insolite, composte da unità di quattro basi azotate al posto delle canoniche due. Ciò è dovuto all'interazione tra quattro guanine, che formano una struttura planare che si impila sopra ad altre strutture dello stesso tipo, ad ottenere un filamento stabile definito G-quadruplex structure. Tali strutture sono stabilizzate dalla formazione di legami idrogeno che si instaurano tra le sommità delle basi e dalla chelazione con uno ione metallico, situato al centro di ogni unità di quattro basi.

Oltre a queste, i telomeri generano anche strutture circolari, chiamate telomere-loops o T-loops. In questo caso, il singolo filamento di DNA si piega a formare ampie circonferenze, stabilizzate da proteine specifiche che legano i telomeri. Al termine del T-loop, il singolo filamento di DNA prende contatto con un doppio filamento, che si apre e forma una struttura a tripla elica. Questa struttura è chiamata displacement-loop o D-loop. La sua struttura è stata paragonata ad una lunghissima scala a pioli attorcigliata su sé stessa e composta da due montanti (filamenti costituiti da molecole di acido fosforico e di desossiribosio) e da tanti gradini (formati da quattro composti, detti basi azotate: adenina, guanina, citosina e timina). Le basi azotate si legano secondo una regola ben precisa: l'adenina si lega solamente con la timina. La guanina si lega esclusivamente con la citosina. Si dice perciò che le basi azotate adenina-timina e guanina-citosina sono complementari.

L'insieme di acido fosforico + zucchero desossiribosio + base azotata costituisce l'unità di base del DNA: questo insieme è detto nucleotide e si ripete in ciascun filamento per tutta la sua lunghezza. Ogni essere vivente possiede il proprio DNA, che contiene tutte le informazioni genetiche necessarie per controllare le attività dell'organismo. La particolare struttura del DNA ne consente la duplicazione e quindi la sostituzione di eventuali parti mancanti perfettamente uguali all'originale; ciò avviene durante l'interfase quando i cromosomi sono dispersi nel nucleo e hanno l'opportunità di duplicarsi.

La formazione delle proteine, detta sintesi delle proteine o traduzione, avviene nel citoplasma e segue fasi ben precise: il DNA nel nucleo fa da stampo per la formazione dell'RNA messaggero, mediante un processo chiamato trascrizione che è un meccanismo simile a quello della duplicazione. In questo modo la sequenza dei nucleotidi nel mRNA risulta complementare a quella del DNA con la base U al posto della base T.

Modificazioni di basi

Struttura della citosina senza (a sinistra) e con (al centro) il gruppo metile in posizione 5. In seguito ad una deaminazione, la 5-metilcitosina (al centro) acquisisce la stessa struttura della timina (a destra).

L'espressione genica di un determinato locus è influenzata dalla struttura che la cromatina assume presso il locus stesso. Regioni eterocromatiniche (caratterizzate da una espressione scarsa o assente) sono estesamente metilate sulle citosine. La metilazione della citosina, ad esempio, è fondamentale per l'inattivazione del cromosoma X. Il livello medio di metilazione è molto variabile tra i diversi organismi: Caenorhabditis elegans non presenta metilazione delle citosine, mentre i vertebrati mostrano livelli maggiori, con circa l'1% del genoma contenente 5-metilcitosina. La 5-metilcitosina, essendo suscettibile di deaminazione spontanea, è una base presso cui l'incidenza di mutazioni è elevatissima.

Ulteriori modificazioni di basi sono la metilazione dell'adenina (presente nei batteri) e la glicosilazione dell'uracile che produce le cosiddette basi J nei cinetoplastidi.

Danni al DNA

Il DNA può essere alterato dall'azione di numerosi agenti, genericamente definiti mutageni; è fondamentale notare però come una mutazione -ovverosia un cambiamento raro, casuale, che alteri la sequenza di basi azotate- non sia necessariamente un evento pernicioso ma anzi sia alla base dell'evoluzione: suddetta mutazione dovrà però farsi spazio nella fittissima rete cibernetica cellulare nonché nell'ambiente nel quale vive ed opera l'organismo vivente in questione; qualora vengano superati questi punti di restrizione (altamente selettivi vista la loro complessità intrinseca, la stragrande maggioranza delle mutazioni difatti si rivela non vantaggiosa od anche neutra), si avrà un organismo arricchito dalla mutazione. Tra gli agenti alteranti figurano ad esempio agenti ossidanti, agenti alchilanti ed anche radiazioni ad alta energia, come i raggi X e gli UV. Il tipo di danno causato al DNA dipende dal tipo di agente: gli UV, ad esempio, danneggiano il DNA generando la formazione di dimeri di timina, costituiti da ponti aberranti che si instaurano tra basi pirimidiniche adiacenti.

Agenti ossidanti come i radicali liberi o il perossido di idrogeno, invece, producono danni di tipo più eterogeneo, come modificazioni di basi (in particolare di guanine) o rotture del DNA a doppio filamento. Secondo diversi studi, in ogni cellula umana almeno 500 basi al giorno sono sottoposte a danni ossidativi. Di tali lesioni, le più pericolose sono le rotture a doppio filamento, dal momento che tali danni sono i più difficili da riparare e costituiscono l'origine primaria delle mutazioni puntiformi e frameshift che si accumulano sulle sequenze genomiche, nonché delle traslocazioni cromosomiche.

Molti agenti devono il loro potere mutageno alla capacità di intercalarsi tra due basi azotate consecutive. Gli intercalanti sono tipicamente molecole planari e aromatiche, come l'etidio, la daunomicina, la doxorubicina o la talidomide. Perché un intercalante possa trovare posto tra le due basi, occorre che la doppia elica si apra e perda la sua conformazione standard. Tali modifiche strutturali inibiscono sia la trascrizione che la replicazione del DNA ed aumentano la possibilità di insorgenza di mutazioni. Per tale motivo, gli intercalanti sono considerati molecole cancerogene, come dimostrato da numerosi studi su molecole come il benzopirene, l'acridina, l'aflatossina ed il bromuro di etidio. In ogni caso, proprio grazie alla loro capacità di inibire trascrizione e replicazione, tali molecole sono anche utilizzate in chemioterapia per inibire la rapida crescita delle cellule neoplastiche.

Disposizione del DNA

Negli eucarioti, il DNA è solitamente presente all'interno di cromosomi lineari (circolari nei procarioti). La somma di tutti i cromosomi di una cellula ne costituisce il genoma; il genoma umano conta circa 3 miliardi di paia di basi contenute in 46 cromosomi.

La disposizione finale a cromosomi segue precise regole gerarchiche di impacchettamento. Nelle cellule, infatti, il doppio filamento di DNA non può essere disposto a casaccio, ma deve seguire precise regole di ordinamento. Tali accorgimenti si rivelano necessari perché la lunghezza dei filamenti di DNA è solitamente molto elevata e creerebbe seri problemi alla cellula ospite. Ad esempio, il cromosoma di Escherichia coli, il procariote più studiato nella storia della biomedicina, misura circa 1 mm. In una cellula lunga solo 2 µm, come quella di E.coli, la disposizione casuale di un cromosoma del genere potrebbe generare problemi. Se una molecola di questa lunghezza si disponesse casualmente, infatti, ci sarebbe bisogno di una cellula grande almeno 1000 volte tanto. Le modalità di impacchettamento sono differenti tra gli organismi procarioti e quelli eucarioti.

PROCARIOTI

Nella maggior parte delle cellule batteriche il DNA è disposto su un unico cromosoma circolare (e presenta, come molti altri batteri, un'unica origine di replicazione), come previsto da numerosi esperimenti di linkage ed infine evidenziato in cellule cresciute con timina marcata con tritio.I meccanismi messi in atto dalla cellula procariote per ridurre lo spazio necessario consistono anzitutto nel mascheramento delle cariche negative presenti sul DNA attraverso la sua associazione con poliammine cariche positivamente, come la spermina e la spermidina. Oltre a queste, il DNA procariote prende contatto anche con numerose piccole proteine, che compattano la struttura complessiva del DNA. Tra di esse, figura H-NS, un dimero con funzioni molto simili agli istoni eucariotici. In ogni cellula di E.coli esistono in media 20000 molecole di H-NS, che si dispongono lungo il DNA a distanza di circa 400bp.Il DNA di E.coli è inoltre molto superavvolto. Tale fenomeno contribuisce ulteriormente al compattamento del DNA, permettendo ad esso di disporsi comodamente all'interno della cellula.

EUCARIOTI

Negli eucarioti l'impacchettamento è ottenuto attraverso diversi accorgimenti. Il DNA è associato ad un gran numero di proteine: l'associazione complessiva DNA-proteine è definita cromatina, la cui struttura è ampiamente conservata tra tutti gli organismi eucarioti.Le proteine cromatiniche più abbondanti sono gli istoni, una famiglia di polipeptidi basici presenti nel nucleo. Le principali proteine istoniche sono H1, H2A, H2B, H3 e H4. La basicità degli istoni è dovuta alla grande quantità di amminoacidi carichi positivamente (lisina e arginina), in grado di instaurare interazioni elettrostatiche con i gruppi fosfato del DNA. Le proteine istoniche sono anche pesantemente modificate, proprio sui residui carichi, da modificazioni post-traduzionali, tra cui l'aggiunta di acetili, di fosfati e di metili, che neutralizzano la carica positiva o la rendono negativa.

Le sequenze amminoacidiche di quattro dei cinque istoni (H2A, H2B, H3 e H4) sono altamente conservate, anche tra specie molto diverse. La sequenza di H1 presenta invece maggiori variazioni lungo l'evoluzione: in alcuni organismi, H1 non è nemmeno presente in tutti i tessuti (ad esempio negli eritrociti degli uccelli H1 è sostituita da un sesto istone, chiamato H5). La presenza di differenti H1, in ogni caso, non modifica sostanzialmente la struttura complessiva dell'apparato istonico (definito nucleosoma), che resta ampiamente conservato nell'architettura nella quasi totalità degli eucarioti.

Funzioni biologiche

Nel genoma, l'informazione è conservata in sequenze di DNA chiamate geni. La trasmissione dell'informazione contenuta nei geni è garantita dalla presenza di sequenze di basi azotate complementari. Infatti, durante la trascrizione, l'informazione può essere facilmente copiata in un filamento complementare di RNA. Solitamente, tale copia di RNA è utilizzata per sintetizzare una proteina, attraverso un processo definito traduzione (o sintesi proteica). In alternativa, una cellula può semplicemente duplicare l'informazione genetica attraverso un processo definito replicazione del DNA.

Struttura del genoma

Negli organismi eucarioti, il DNA genomico è localizzato all'interno del nucleo cellulare, nonché in piccole quantità all'interno di mitocondri e cloroplasti. Nei procarioti, il DNA è invece racchiuso in un organello irregolare, privo di membrana, contenuto nel citoplasma, chiamato nucleoide. L'informazione è contenuta all'interno dei geni, unità ereditarie in grado di influire sul fenotipo dell'organismo. Ogni gene contiene un open reading frame (regione in grado di essere trascritta a RNA) ed una regione regolatoria, costituita sia da un promotore che da enhancers.

In molte specie, solo una piccola frazione della sequenza totale di un genoma può essere trascritta e tradotta. Ad esempio, solo l'1,5% del genoma umano è costituito da esoni codificanti una proteina, mentre più del 50% consiste di sequenze ripetute di DNA non codificante. La ragione per cui ci sia una tale quantità di DNA non codificante non è tuttora completamente chiara ed è stata definita come enigma del C-value.In ogni caso, le sequenze di DNA che non codificano una proteina possono essere trascritte in RNA non codificante, coinvolto nella regolazione dell'espressione genica.

Una T7 RNA polimerasi (blu) mentre produce una molecola di mRNA (verde) a partire da uno stampo di DNA (arancione).

Alcune sequenze non codificanti ricoprono un ruolo strutturale per i cromosomi. Le regioni telomeriche e centromeriche contengono solitamente pochissimi geni, ma sono necessarie per la funzione e la stabilità dei cromosomi. Nell'uomo, grandi quantità di DNA non codificante si ritrovano negli pseudogeni, copie di geni rese inattive dalla presenza di una mutazione.Queste sequenze sono considerate come fossili molecolari, anche se esistono evidenze secondo le quali si può ipotizzare che siano una sorta di materiale grezzo necessario per la creazione di nuovi geni attraverso i processi di duplicazione genica e di evoluzione divergente.

Proteine che legano il DNA

Le proteine strutturali che legano il DNA sono esempi delle interazioni aspecifiche tra DNA e proteine. All'interno dei cromosomi, il DNA è associato a complessi di natura proteica, che si organizzano tra loro a formare una struttura compatta chiamata cromatina. Negli eucarioti, questa struttura presuppone il legame del DNA a piccoli complessi proteici basici chiamati istoni; nei procarioti, invece, sono coinvolti diversi tipi di differenti proteine. Gli istoni formano un complesso a forma di disco chiamato nucleosoma, che instaura interazioni di tipo ionico (tra i residui basici degli istoni e lo scheletro fosforico acido del DNA) con circa duecento paia di basi di DNA, che si avvolgono intorno al disco formando due giri completi, indipendentemente dalla sequenza che li caratterizza. Questi residui basici possono subire metilazioni, fosforilazioni e acetilazioni:tali modificazioni chimiche alterano l'interazione tra gli istoni e il DNA, rendendolo così più o meno accessibile ai fattori di trascrizione e modulando la velocità della trascrizione stessa.

Utilizzi del DNA

La moderna biologia e biochimica fa un uso intensivo del DNA. Con il termine di DNA ricombinante ci si riferisce a segmenti di DNA realizzati e assemblati artificialmente. Essi possono essere inseriti all'interno di organismi viventi sotto forma di plasmidi o mediante altri tipi di vettori. Gli organismi così prodotti sono detti geneticamente modificati e possono essere utilizzati per la produzione di proteine ricombinanti, necessarie per la ricerca biomedica, o per le coltivazioni agricole.