Notes on Molecular Biology of the Cell - RNA Processing and Genetic Code

Biologia Molecolare della Cellula: Processamento dell'RNA e Codice Genetico

Dogma Centrale della Biologia Molecolare

  • Il dogma centrale della biologia afferma che l'informazione genetica fluisce dal DNA all'RNA e infine alle proteine.

  • DNA viene trascritto in RNA (intermedio).

  • RNA viene tradotto in proteine.

Eucarioti vs. Procarioti

Differenze Fondamentali tra Cellule Eucariotiche e Procariotiche
  • Nucleo e Organelli: La principale differenza a livello della biologia cellulare è la presenza del nucleo e degli organelli negli eucarioti, assenti nei procarioti.

  • DNA Codificante:

    • Nei procarioti, il DNA è quasi totalmente codificante (si traduce in proteine).

    • Negli eucarioti, più del 97% del DNA non codifica per proteine.

  • Replicazione:

    • Nei batteri (procarioti) c'è una sola origine di replicazione.

    • Negli eucarioti ci sono origini di replicazioni multiple.

  • Istoni:

    • Gli istoni sono assenti nei batteri.

    • Gli istoni sono presenti negli eucarioti e negli archea (componente chiave per l'impacchettamento del DNA).

  • Compartimentazione:

    • Nei procarioti, trascrizione e traduzione avvengono nello stesso compartimento cellulare.

    • Negli eucarioti, trascrizione (nel nucleo) e traduzione (nel citosol) avvengono in compartimenti e tempi differenti.

  • Trascritto:

    • Nei batteri e nei virus, il trascritto è spesso policistronico (codifica per più proteine).

    • Negli eucarioti, il trascritto è monocistronico (un trascritto codifica una proteina).

  • Geni:

    • Nei procarioti, i geni sono continui.

    • Nei geni degli eucarioti sono divisi in introni (non codificanti) ed esoni (codificanti).

  • Processamento dell'mRNA:

    • Negli eucarioti, l'mRNA viene processato (capping, splicing, poliadenilazione) ed esportato fuori dal nucleo.

Processamento dell'RNA negli Eucarioti

Fasi del Processamento dell'mRNA Eucariotico

Il processamento dell'mRNA eucariotico avviene nel nucleo e comprende tre fasi principali:

  1. Capping: Aggiunta di un cappuccio all'estremità 5' dell'mRNA.

  2. Splicing: Rimozione degli introni e unione degli esoni.

  3. Poliadenilazione: Aggiunta di una coda di poli-A all'estremità 3' dell'mRNA.

Controllo Co-Trascrizionale
  • Tutti gli eventi sono controllati durante la trascrizione.

  • Modifiche all'mRNA avvengono in maniera co-trascrizionale.

  • L'RNA polimerasi II, tramite la sua coda C-terminale (CTD), recluta i fattori per il processamento dell'mRNA.

  • La fosforilazione delle serine sulla coda C-terminale dell'RNA polimerasi II permette il reclutamento dei fattori di modificazione dell'mRNA.

Capping

Processo e Funzioni del Capping
  • Il capping inizia quando circa 25 nucleotidi sono stati trascritti.

  • La fosforilazione della coda della polimerasi recluta le proteine che aggiungono il cappuccio.

  • Il capping consiste nell'aggiunta di una guanosina metilata all'estremità 5' dell'mRNA tramite un legame 5'-5'.

  • Questo legame protegge l'mRNA dalla degradazione da parte delle esonucleasi e facilita il trasporto dell'mRNA dal nucleo al citosol.

Funzioni del Capping
  • Protegge l'mRNA dalla degradazione.

  • Facilita il trasporto dell'mRNA nel citosol.

  • Aiuta la traduzione, facilitando il riconoscimento della metionina (codone di inizio).

Fasi del Capping
  1. La fosfatasi rimuove il gruppo fosfato dall'estremità 5' dell'mRNA.

  2. La guanylyl-transferase attacca GMP partendo da GTP con un legame 5'-5'.

  3. Metilazione sull'azoto 7 della guanosina.

  4. In alcuni casi metilazione all'ossigeno in posizione 2 del ribosio.

Splicing

Definizione e Importanza dello Splicing
  • Nei procarioti, il trascritto iniziale viene completamente tradotto.

  • Negli eucarioti, il trascritto iniziale (pre-mRNA) contiene introni ed esoni, ma solo gli esoni saranno presenti nell'RNA maturo.

  • Le regioni 5' UTR e 3' UTR (untranslated regions) non sono codificanti, ma hanno ruoli regolatori.

    • 5' UTR: posizionamento del ribosoma.

    • 3' UTR: regola l'emivita dell'mRNA.

  • Nei mammiferi, la maggior parte dei geni (circa il 95%) che codifica per proteine contiene introni ed esoni.

  • Durante l'evoluzione, è aumentato il numero di introni ed esoni.

  • La complessità non dipende dal numero dei geni, ma dal numero di introni ed esoni.

  • Gli esoni sono brevi (30-50 amminoacidi), mentre gli introni possono essere molto lunghi (fino a 30000 nucleotidi).

  • Gli introni evolvono più rapidamente degli esoni; le mutazioni negli introni hanno meno pressione selettiva.

Meccanismo dello Splicing
  • Lo splicing avviene grazie a ribonucleoproteine (snRNP) che formano lo spliceosoma.

  • Le snRNP contengono piccoli RNA nucleari (snRNA) chiamati U1, U2, U4, U5, U6.

  • U3 modifica l'RNA ribosomiale, ma non partecipa direttamente allo splicing dell'mRNA

  • I siti fondamentali per lo splicing sono:

    • Sito 5' (donatore di splicing): si trova alla fine dell'esone 1.

    • Sito di ramificazione (branch point): contiene un'adenosina di biforcazione al centro dell'introne.

    • Sito 3' (accettore di splicing): preceduto da un tratto di pirimidine.

Rimozione degli Introni
  1. Adenosina di ramificazione si lega a tre basi invece che due, tagliando l'introne.

  2. U1 si lega al sito 5', mentre BBP (branch-point binding protein) si lega al sito dell'adenosina di ramificazione.

  3. BBP recluta U2 sul sito dell'adenosina di ramificazione.

  4. Vengono reclutate U4, U5, U6, che interagiscono con U1 e U2, forzando la formazione del cappio.

  5. Rimodellamento: U1 e U4 escono dal complesso, le estremità si avvicinano all'adenosina reattiva e il cappio si stacca.

  6. L'estremità 3'-OH libera del primo esone attacca il sito 5' del secondo esone, unendo i due esoni.

  7. EJC (exon junction complex) si lega dove è avvenuta la ricongiunzione degli esoni, segnalando che lo splicing è avvenuto correttamente.

Splicing Alternativo
  • Un trascritto può subire splicing in modo differente ed avere una combinazione di introni ed esoni.

  • Il 90% dei geni subisce splicing alternativo.

  • In media, una proteina può dare origine a sette trascritti diversi.

  • Esempio: la tropomiosina ha isoforme diverse ottenute da splicing diversi in base al tessuto.

  • Lo splicing alternativo aumenta la complessità.

Complessità e Splicing Alternativo
  • L'incremento della complessità degli organismi deriva dallo splicing alternativo.

  • L'esoma (insieme degli RNA maturi) aumenta la possibilità di fare proteine in isoforme diverse.

  • Si pensa che ci siano 150000 trascritti diversi da circa 21000 geni, che danno origine a 80000 proteine diverse.

  • Nella drosophila è stato identificato un gene Dscam coinvolto nello sviluppo neuronale, che potrebbe avere fino a 38000 varianti di splicing diverse.

Tipi di Splicing Alternativo
  • Esone Saltato (Exon Skipping): Il macchinario di splicing non riconosce i siti di splicing e un esone viene considerato un introne e viene saltato.

  • Variazioni nella Posizione del Sito di Splicing: Le sequenze esoniche possono risultare accorciate o allungate.

  • Mantenimento di una Sequenza Intronica: Un introne non viene tagliato e staccato.

  • Esone Alternativo/Mutualmente Esclusivo: Alcuni siti di splicing impediscono ad altri siti di splicing di essere utilizzati.

Regolazione dello Splicing Alternativo
  • RNA-binding proteins (RBPs) regolano lo splicing.

    • Enhancers dello splicing: favoriscono lo splicing.

    • Silencers dello splicing: bloccano lo splicing.

  • Splicing esonici o intronici a seconda di dove si legano le proteine.

  • Le proteine più famose sono le SREs:

    • exonic splicing enhancers (ESEs)

    • intronic splicing enhancers (ISEs)

    • exonic splicing silencers (ESSs)

    • intronic splicing silencers (ISSs)

  • Le SR (serine rich protein) legano e marcano la presenza di un esone, favorendo lo splicing di quell'esone.

  • La modulazione della presenza di queste proteine SR nei vari tessuti determina lo splicing alternativo.

Errori e Mutazioni negli Introni
  • Le mutazioni degli introni non sono selezionate dalla pressione evolutiva.

  • Si pensa che il 10% delle malattie genetiche siano dovute a mutazioni degli introni.

  • Le mutazioni problematiche includono:

    • Distruzione di un sito di splicing importante.

    • Creazione di un nuovo sito di splicing.

  • Esempio: pazienti con beta talassemia hanno subito una mutazione in un sito di splicing.

  • Lo splicing è co-trascrizionale: l'RNA polimerasi capisce che è finito l'introne grazie al sito in 3' che indica che può staccare il cappio.

Polialdenilazione

Processo e Funzioni della Polialdenilazione
  • Avviene al 3'.

  • Le proteine CstF e CPSF si legano a sequenze specifiche.

    • AAUAAA si lega a CPSF.

    • Sequenza ricca di GU si lega a CstF.

  • Dopo il taglio, la poliA-polimerasi aggiunge circa 200 A all'estremità 3'.

  • La coda di poli-A protegge l'mRNA dalla degradazione da parte delle esonucleasi.

  • La lunghezza della coda di poli-A determina la sopravvivenza dell'mRNA nel citosol.

  • La coda di poli-A viene coperta da Poly A binding protein.

Siti di Polialdenilazione Alternativi
  • Circa il 50% dei geni ha siti di polialdenilazione alternativi.

  • Esempio: anticorpi.

    • In assenza di infezioni, i linfociti B hanno immunoglobuline sulla superficie con un C-terminale idrofobico.

    • Quando il linfocita B si attiva, induce la produzione di CstF, il sito debole viene riconosciuto e viene tradotto un anticorpo più corto che non riesce ad inserirsi nella membrana.

    • L'anticorpo viene secreto e va in circolo nell'organismo.

  • La poliadenilazione può portare alla formazione di proteine completamente diverse, in questo caso più corte e più lunghe.

RNA Editing

Definizione e Funzioni dell'RNA Editing
  • L'RNA editing è un meccanismo poco studiato che avviene nel nucleo.

  • Consiste nella sostituzione delle basi in base al tessuto.

  • È garantita da enzimi chiamati ADAR.

  • È necessario perché se si dovessero rimuovere questi enzimi in alcuni animali, come per esempio i topi in cui un canale per il calcio non viene editato correttamente e ciò provoca epilessia.

  • È molto pericoloso perché introdurre mutazioni nell'RNA potrebbe essere sfruttato dai virus a RNA per mutare e sfuggire ai vaccini.

  • Una volta che l'mRNA è stato modificato viene trasportato nel citoplasma, se non ci fossero i tre sigilli, l'mRNA verrebbe degradato da un complesso nucleare chiamato esosoma.

Export dal Nucleo

Meccanismo di Esportazione dell'mRNA Maturo
  • L'mRNA maturo viene riconosciuto dalle CAP (proteine che si legano gli esoni dopo lo splicing e il Poly A) e viene esportato dai pori nucleari.

Eccezione: mRNA degli Istoni
  • Gli mRNA degli istoni sono diversi dagli altri mRNA.

Istoni e Cromatina

Organizzazione del Genoma e Ruolo degli Istoni
  • Il genoma umano aploide contiene circa 3.2 illon di coppie di basi.

  • Ogni cellula ha 6.4 illon coppie di basi distribuite in 23 cromosomi (organismo diploide).

  • Il DNA riesce a stare dentro le cellule grazie ai superavvolgimenti che formano la cromatina (DNA e proteine, di cui il 95% sono istoni).

  • La prima struttura di compattamento si chiama nucleosoma (ottamero proteico su cui si avvolge la doppia elica di DNA).

  • Il nucleosoma è formato da due coppie ciascuno di quattro istoni (H2A, H2B, H3, H4).

  • Il DNA si avvolge intorno al nucleosoma facendo circa 1,7 giri (circa 146/147 basi).

Caratteristiche degli Istoni
  • Gli istoni sono proteine di piccole dimensioni formate da tre alpha eliche.

  • Sono molto abbondanti e sono caratterizzate da delle cariche positive (lisine e arginine) perché il DNA ha carica negativa.

  • Gli istoni H2A, H2B, H3 e H4 si impacchettano per formare il nucleosoma.

  • Hanno delle code N-terminali che sono molto modificate e regolano l'impaccamento della cromatina a seconda dell'accensione e spegnimento di determinati geni.

Istoni H1
  • Si trova fuori dal nucleosoma.

  • Ha una forma globulare centralmente e disordinata all'esterno.

  • Cambia l'angolo del DNA in uscita dal nucleosoma.

Differenze tra Istoni negli Eucarioti e negli Archea
  • Gli istoni non sono presenti nel genoma dei batteri ma sono presenti negli eucarioti e negli archea.

  • Negli archea sono simili come organizzazione ma la struttura quaternaria è molto diversa perché si dispongono uno sopra l'altro.

  • Non hanno le code quindi hanno un sistema di regolazione dell'attività dei geni e del compattamento della cromatina diverso.

mRNA degli istoni
  • Trascritto dalla pol2 come terminazione rispetto agli altri mRNA perché non presenta poliadenilazione e non ha gli stessi fattori di taglio: verso la fine c’è una sequenza ripetuta che fa una “forcina” che si chiama STEM-loop (legato dalla STEM-loop binding protein che sostituisce le poly A binding protein, questa proteina media l’export degli istoni), seguita dalla sequenza ACCCA che rappresenta il sito di taglio e circa dopo 15 nucleotidi dopo il sito di taglio c’è un HDE (histone downstream element).

  • Non hanno introni e per il loro ruolo fondamentale di impacchettamento del DNA sono conservatissimi tra le varie specie quindi non sono modificabili, es. il lievito ha gli istoni identici all’uomo.

Codice Genetico

Struttura e Funzionamento del Codice Genetico
  • La più grande scoperta della biologia è la codifica del codice genetico.

  • Ogni tre basi dell'mRNA codificano per un amminoacido (codone).

  • Il codice genetico è decodificato (sappiamo ogni codone a che amminoacido corrisponde) e degenerato (un codone codifica per un amminoacido, ma un amminoacido può essere codificato da più codoni).

  • Il codice genetico è uguale in tutte le specie, con alcune differenze.

Traduzione del Codice Genetico
  • Ci sono 64 codoni:

    • 61 codificano per 20 amminoacidi.

    • 3 sono codoni di STOP (UAA, UAG, UGA).

  • Alcuni amminoacidi sono codificati solo da un codone (es. metionina e triptofano).

  • Il ribosoma parte sempre a tradurre dal codone AUG (metionina).

  • Il tRNA (RNA transfer) ha un ruolo fondamentale.

tRNA
  • Sono RNA in grado di legare l'amminoacido e legano amminoacidi precisi secondo le tre basi presenti nell'anticodone.

  • Ha una struttura a trifoglio e viene sintetizzato dalla polimerasi 3, subiscono il taglio, splicing e modificazioni prima di essere trasportati nel citosol.

  • Le modificazioni più importanti sono quelle che riguardano le basi perché i tRNA sono costituiti da basi azotate diverse, es. pseudouridina e diidrouridina ottenute modificando l’uracile e l’inosina ottenuta dall’adenosina.

  • La parte più importante del tRNA è la parte dell'anticodone perché in base a questo verrà legato un amminoacido specifico.

  • L'amminoacido corretto viene montato grazie ad una serie di proteine (amminoacil-tRNA sintetasi) e sono 20 diverse ognuna specifica per ogni amminoacido, queste legano l'anticodone, l'ATP e la parte finale del tRNA dove si inserisce l'amminoacido, hanno tutte una struttura diversa in base alle caratteristiche chimico-fisiche dell'amminoacido.

Attacco dell'Amminoacido
  • Viene utilizzato l'ATP per produrre l'energia necessaria per legare un amminoacido ad una base.

  • Viene trasferito l'amminoacido.

  • Viene montato.

  • La correlazione perfetta è importante solo per le prime due basi dell'anticodone, la terza base è molto meno stringente, infatti, qualsiasi base ci sia le prime due basi codificano comunque per l'amminoacido corretto.

  • La posizione della terza base è chiamata posizione tentennante, infatti se dovessimo avere tutto il sistema perfetto dovremmo avere 61 tRNA diversi, invece nell'uomo sono presenti 48 tRNA.

  • Ogni tRNA lega un amminoacido ma un amminoacido si può legare a più tRNA.

Altri RNA All'Interno della Cellula

Abbondanza e Funzioni di Diversi Tipi di RNA
  • Gli mRNA sono molto importanti per le nostre cellule ma non sono i più abbondanti perché quelli più abbondanti sono gli rRNA o RNA ribosomiali e all'interno della nostra cellula sono presenti un sacco di geni che sono trascritti ma non diventano mai proteine; quindi, molti RNA possono far parte di complessi e non essere mai tradotti in proteine.

  • L'80% degli RNA presenti in una cellula sono gli rRNA.

  • È stato visto che alcuni RNA possono avere funzioni enzimatiche, nell'uomo fanno parte delle ribonucleoproteine.

  • In alcune specie sono stati trovati RNA che possono assumere conformazioni diverse, e ci sono RNA che possono avere attività enzimatica e in questo caso si chiama ribozima.

Definizione di Gene
  • Possiamo definire gene qualunque sequenza che dia origine ad un trascritto ben definito, ma siamo in grado di capirne la funzione solo per quelli che vengono tradotti in proteine.

Ipotesi del Mondo a RNA
  • È stata formulata un'ipotesi in cui si pensava che il mondo fosse formato solo da RNA, in cui questi erano i reagenti e i prodotti delle reazioni chimiche, poi l'evoluzione ha selezionato il DNA perché più stabile e infine sono state selezionate le proteine per la variabilità.

  • Diversi di questi RNA possono essere degli RNA che sono trascritti nelle nostre cellule che prendono il nome di long Non-coding RNAs, sono lunghi più di 200 nucleotidi, hanno il promotore definito, possono avere lo splicing, la poly A, e sono trascritte da varie polimerasi. Si pensa siano fino a 15mila.

  • Non sappiamo minimamente a cosa servono e cosa fanno ma siccome sappiamo che la cellula non spreca grandi quantità di energia per nulla gli scienziati stanno cercando di capire qual è la loro funzione nella cellula.

  • Per i pochi di cui sappiamo sono stati proposti alcuni meccanismi:

    • guida per gli altri RNA

    • possono funzionare da ponti molecolari tra due proteine

    • nel citosol possono legarsi ad una proteina e cambiarne la funzione e la conformazione