Proteine

Rappresentazione schematica della mioglobina. Quest'omologo proteico dell'emoglobina lega l'ossigeno nei muscoli. È la prima proteina la cui struttura è stata risolta con la cristallografia a diffrazione di raggi X da Max Perutz e John Kendrew.

In chimica, le proteine (o protidi) sono macromolecole biologiche costituite da catene di amminoacidi legati uno all'altro da un legame peptidico (ovvero un legame tra il gruppo amminico di un amminoacido e il gruppo carbossilico dell'altro amminoacido, creato attraverso una reazione di condensazione con perdita di una molecola d'acqua).

Le proteine svolgono una vasta gamma di funzioni all'interno degli organismi viventi, tra cui la catalisi delle reazioni metaboliche, funzione di sintesi come replicazione del DNA, la risposta agli stimoli e il trasporto di molecole da un luogo ad un altro. Le proteine differiscono l'una dall'altra soprattutto nella loro sequenza di amminoacidi, la quale è dettata dalla sequenza nucleotidica conservata nei geni e che di solito si traduce in un ripiegamento proteico in una struttura tridimensionale specifica che determina la sua attività.

Una catena lineare di residui amminoacidici è chiamata "polipeptide" (ovvero una catena di più amminoacidi legati da legami peptidici). Una proteina è generalmente costituita da uno o più polipeptidi lunghi eventualmente coordinati a gruppi non peptidici, chiamati gruppi prostetici o cofattori. Polipeptidi brevi, contenenti meno di circa 20-30 amminoacidi, vengono raramente considerati proteine e sono comunemente chiamati peptidi o talvolta oligopeptidi.

La sequenza degli aminoacidi in una proteina è definita dalla sequenza presente in un gene, la quale è codificata nel codice genetico. In generale, il codice genetico specifica 20 amminoacidi standard; tuttavia, in alcuni organismi il codice può includere la selenocisteina (SEC), e in alcuni archaea, la pirrolisina ed infine un 23° amminoacido, la N-formilmetionina, un derivato della metionina, che inizia la sintesi proteica di alcuni batteri. Poco dopo o anche durante la sintesi proteica, i residui di una proteina vengono spesso modificati chimicamente mediante la modificazione post traduzionale che altera le proprietà fisiche e chimiche, la piegatura, la stabilità, l'attività e, in ultima analisi, la funzione della proteina. Le proteine possono anche operare insieme per raggiungere una particolare funzione e spesso associarsi in complessi multiproteici stabili.

Una volta sintetizzate nell'organismo, le proteine esistono solo per un certo periodo di tempo per poi venire degradate e riciclate attraverso i meccanismi cellulari per il processo di turnover proteico. La durata di una proteina è misurata in termini di emivita e può essere molto varia. Alcune possono esistere per solo alcuni minuti, altre fino ad alcuni anni, tuttavia la durata media nelle cellule di un mammifero è tra 1 e 2 giorni. Proteine anomale e mal ripiegate o vengono degradate più rapidamente o possono causare instabilità.

Le proteine possono essere purificate da altri componenti cellulari utilizzando una varietà di tecniche come l'ultracentrifugazione, la precipitazione, l'elettroforesi e la cromatografia; l'avvento dell'ingegneria genetica ha reso possibile una serie di metodi per facilitare tale purificazione. I metodi comunemente usati per studiare la struttura e la funzione delle proteine includono immunoistochimica, la mutagenesi sito specifica, la cristallografia a raggi X, la risonanza magnetica nucleare In analogia con altre macromolecole biologiche come i polisaccaridi e gli acidi nucleici, le proteine costituiscono una parte essenziale degli organismi viventi e partecipano praticamente in ogni processo che avviene all'interno delle cellule. Molte fanno parte della categoria degli enzimi, la cui funzione è catalizzare le reazioni biochimiche vitali per il metabolismo degli organismi. Le proteine hanno anche funzioni strutturali o meccaniche, come l'actina e la miosina nei muscoli e le proteine che costituiscono il citoscheletro, che formano una struttura che permette di mantenere la forma della cellula. Altre sono fondamentali per la trasmissione di segnali inter ed intracellulari, nella risposta immunitaria, per l'adesione cellulare e per il ciclo cellulare. Le proteine sono elementi necessari anche nell'alimentazione degli animali, dal momento che essi non possono sintetizzare tutti gli amminoacidi di cui hanno bisogno e devono ottenere quelli essenziali attraverso il cibo. Grazie al processo della digestione, gli animali scindono le proteine ingerite nei singoli amminoacidi, che poi vengono utilizzati nel metabolismo.

Le proteine si differenziano principalmente per la sequenza degli amminoacidi che le compongono, la quale a sua volta dipende dalla sequenza nucleotidica dei geni che all'interno della cellula ne esprimono la sintesi. In generale il codice genetico specifica 20 amminoacidi standard, ma in alcuni organismi possono essere inclusi amminoacidi non-standard come la selenocisteina e - in alcuni archaea - la pirrolisina. La sequenza amminoacidica determina a sua volta il ripiegamento della proteina in una specifica struttura tridimensionale che ne conferisce la specifica attività. Spesso alcuni residui amminoacidici di una proteina vengono modificati, subito dopo o già durante la sintesi, con modifiche chimiche post traduzionali. Tali modifiche alterano le proprietà chimico-fisiche, di ripiegamento, stabilità e attività delle proteine, variandone la funzione. Talvolta le proteine legano dei gruppi non-peptidici detti gruppi prostetici o cofattori, in grado di modificarne ulteriormente le proprietà. Le proteine per svolgere particolari funzioni possono anche associarsi in complessi stabili con altre proteine.

Proteine che contengono lo stesso tipo e numero di amminoacidi possono differire dall'ordine in cui questi sono situati nella struttura della molecola. Tale aspetto è molto importante perché una minima variazione nella sequenza degli amminoacidi di una proteina (cioè nell'ordine con cui i vari tipi di amminoacidi si susseguono) può portare a variazioni nella struttura tridimensionale della macromolecola che possono rendere la proteina non funzionale. Un esempio ben noto è il caso della catena beta dell'emoglobina umana, che nella sua normale sequenza porta un tratto formato da: valina - istidina - leucina - treonina - prolina - acido glutammico - lisina.

Classificazione

La formazione di copie duplicate di geni e l'alterazione della funzione di una proteina nel corso dell'evoluzione hanno portato alla formazione delle circa 500 famiglie proteiche identificate. All'interno di una famiglia, sebbene ciascuna proteina svolga una funzione leggermente diversa dall'altra, la sequenza di amminoacidi, in particolare presso i siti catalitici e in regioni conservate, è quasi identica. Non è tuttavia una legge che vale per tutte le proteine di una famiglia; esistono infatti alcune proteine dalla sequenza amminoacidica molto diversa e, tuttavia, dalla conformazione tridimensionale molto simile.

Si può quindi affermare che nel corso dell'evoluzione all'interno di una famiglia proteica si è conservata più la conformazione tridimensionale che non la sequenza degli amminoacidi. Generalmente, quando almeno un quarto della sequenza amminoacidica di due proteine corrisponde, esse hanno la stessa struttura generale. Due proteine diverse appartenenti ad una stessa famiglia e dalla funzione simile sono dette "paraloghe", mentre la stessa proteina in due organismi diversi (per esempio uomo e topo) è detta "ortologa". La parentela tra due proteine è generalmente accettata quando almeno il 30% degli amminoacidi corrisponde, ma per verificarla è possibile ricorrere ai cosiddetti fingerprint, cioè brevi sequenze di amminoacidi comuni in quasi tutte le proteine di una data famiglia.

Frammento di fibronectina.

Alcune proteine si sono formate per rimescolamento dei domini proteici o per la loro duplicazione all'interno della stessa proteina a causa di unioni accidentali di DNA codificante; certi domini sono particolarmente diffusi e sono perciò chiamati moduli proteici. Questi domini hanno la caratteristica di avere gli N-terminali e C-terminali ai poli opposti della proteina, così che l'aggregazione ad altri domini e ad altre proteine per formare strutture più grandi è favorita rispetto a quanto accadrebbe se fossero entrambi verso lo stesso polo della proteina; un esempio è il modulo 1 della fibronectina. In tal caso i domini sono inseriti nelle anse proteiche di alcune proteine, per esempio il modulo kringle nell'urochinasi o il dominio SH2. Alcuni di questi domini non si ritrovano solo tra proteine paraloghe ma anche ortologhe, per esempio il dominio SH2 mostra una diffusione molto simile sia nel verme che nella mosca, eppure è ben poco frequente nei vegetali. Vi sono invece dei domini comuni a solo certe categorie di organismi come l'MHC, il complesso maggiore di istocompatibilità (major histocompatibility complex), presente nell'uomo ma assente negli insetti e nei vegetali, tuttavia questi costituiscono soltanto il 7% del totale. Si è osservato inoltre che, malgrado alcuni organismi viventi apparentemente semplici come la pianta Arabidopsis thaliana posseggano più geni di un essere umano, tendenzialmente le proteine umane sono formate da un numero maggiore di domini e quindi sono più complesse rispetto alle ortologhe in altri organismi.

La classificazione può essere dunque fatta in base alla composizione chimica, alla configurazione molecolare o alla solubilità. Si distinguono così proteine semplici (costituite da soli amminoacidi) e proteine coniugate (costituite da una proteina semplice e da un gruppo prostetico di natura non proteica).

Tra le proteine semplici vi sono le proteine fibrose, generalmente insolubili nei solventi acquosi ed a volte inattaccabili dagli enzimi proteolitici, come ad esempio: il collagene (costituente essenziale del tessuto connettivo), l'elastina (componente principale delle fibre elastiche e delle pareti vasali), la cheratina (componente essenziale dell'epidermide). Inoltre, sempre tra quelle semplici vi sono le proteine globulari, le albumine (assai diffuse nel mondo animale), le globuline (insolubili in acqua, si trovano nel sangue, nel muscolo, nei tessuti in genere e nei semi) e le prolamine (caratteristiche del mondo vegetale).

Tra le proteine coniugate (costituite almeno da apoproteina+gruppo prostetico): l'emoglobina, le clorofille e le opsine.

Un'ulteriore classificazione delle proteine è quella che le distingue in base alla loro funzione in cui possiamo distinguere le proteine strutturali che sono componenti delle strutture permanenti dell'organismo ed hanno principalmente una funzione meccanica, le proteine di trasporto che si legano a sostanze poco idrosolubili e ne consentono il trasporto nei liquidi corporei e gli enzimi che sono proteine catalitiche. Tra le altre funzioni delle proteine rientrano la regolazione dell'espressione dei geni, la duplicazione, trascrizione e traduzione del DNA, la regolazione delle reazioni metaboliche, la generazione e la ricezione degli impulsi nervosi. Molte tossine e molti allergeni sono anch'essi proteine.

Biochimica

Struttura chimica del legame peptidico (in basso) e la struttura tridimensionale di un legame peptidico tra una alanina e un aminoacido adiacente (riquadro in alto)
Strutture di risonanza del legame peptidico che lega singoli aminoacidi per formare un polimero proteico.

La maggior parte delle proteine sono costituite da polimeri lineari costruiti dalla serie di 20 diversi L-α-aminoacidi. Tutti gli aminoacidi proteinogenici possiedono caratteristiche strutturali comuni, tra cui un carbonio α con un gruppo amminico, un gruppo carbossilico e una catena laterale variabile. Solo la prolina differisce da questa struttura di base in quanto contiene un anello insolito al gruppo amminico.[1] Le catene laterali degli amminoacidi standard, dettagliate nella lista degli amminoacidi standard, hanno una grande varietà di strutture e proprietà chimiche; è l'effetto combinato di tutte le catene laterali di aminoacidi in una proteina che determina infine la sua struttura tridimensionale e la sua reattività chimica.[2] Gli amminoacidi di una catena polipeptidica sono legati da legami peptidici. Una volta collegata nella catena proteica, un aminoacido individuo è chiamato un residuo e la serie collegata di carbonio, azoto e atomi di ossigeno sono noti come "catena principale" o "proteine backbone".[3]

Il legame peptidico ha due forme di risonanza che contribuiscono al doppio legame e inibiscono la rotazione attorno al suo asse, in modo che i carbonio α siano approssimativamente complanari. Gli altri due angoli diedri nel legame peptidico determinano la forma locale assunta dalla "proteina backbone. [4] La fine della proteina con un gruppo carbossilico libero è nota come dominio C-terminale, mentre l'estremità con un gruppo libero ammino è noto come la dominio N-terminale. I termini proteina, polipeptide e peptide sono un po' ambigui e possono sovrapporsi in alcuni significati. Il termine "proteina" è generalmente usato per riferirsi alla molecola biologica completa in una conformazione stabile, mentre il "peptide" è generalmente riconosciuto per essere un breve oligomero di aminoacidi spesso mancante una struttura tridimensionale stabile. Tuttavia, il confine tra i due composti non è ben definito e di solito il numero di residui che li differenzia è vicino ai 20-30.[5] Con "polipeptide" ci si può riferire a qualsiasi singola catena lineare di amminoacidi, di solito indipendentemente dalla lunghezza, ma spesso il termine implica l'assenza di una conformazione definita.

Composizione

Le proteine hanno una struttura tridimensionale molto complessa a cui è associata sempre una funzione biologica. Da questa considerazione deriva uno dei dogmi fondamentali della biologia: "Struttura <--> Funzione", nel senso che ad ogni diversa organizzazione strutturale posseduta da una proteina (detta proteina nativa) è associata una specifica funzione biochimica. Da questo punto di vista le proteine possono essere classificate in due grandi famiglie: le proteine globulari e le proteine a struttura estesa o fibrosa. Queste due organizzazioni riflettono le due grosse separazioni funzionali che le contraddistinguono:

  • Le proteine estese o fibrose svolgono funzioni generalmente biomeccaniche, esse rientrano nella costituzione delle ossa, unghie, peli, dello strato corneo dell'epidermide, dei muscoli (actina e miosina), fornendo sostegno strutturale e opponendo una valida difesa contro il mondo esterno.
  • Al contrario, le proteine globulari sono coinvolte in specifiche e molteplici funzioni biologiche, spesso di fondamentale importanza per l'economia cellulare, sono proteine gli enzimi, i pigmenti respiratori, molti ormoni, le tossine, e gli anticorpi, responsabili della difesa immunitaria.

La loro composizione in amminoacidi è variabile e sotto il controllo genetico per cui il loro peso molecolare può essere molto variabile e dipende dal numero e dal tipo di amminoacidi (monomeri) di cui è costituita la molecola. Se la molecola è costituita da poche unità di amminoacidi (in genere non più di 10) viene definita un "oligopeptide". Molecole con più di 10 unità sono dette "polipeptidi"[6]. Una proteina è formata da uno o più polipeptidi eventualmente accompagnati da uno o più gruppi prostetici ed il suo peso molecolare è generalmente non inferiore a 10.000[7].

Una proteina nella sua organizzazione nativa, e quindi funzionalmente attiva, può esistere solo in soluzioni saline diluite (molto simili, per composizione, a quelle esistenti nei sistemi acquosi cellulari). La sua struttura dipende esclusivamente dalle caratteristiche chimico-fisiche della soluzione acquosa in cui si trova (pH, presenza di ioni salini, temperatura, pressione, presenza di composti organici come urea, alcoli, ecc.). Il variare di questi parametri può determinare delle modifiche strutturali che possono alterare le proprietà funzionali, fino ad annullarle (proteina denaturata).

La molecola proteica risulta costituita da atomi di carbonio, ossigeno, idrogeno e azoto; spesso contiene anche zolfo (presente negli amminoacidi metionina, cisteina e cistina) e, talvolta, fosforo e/o metalli come ferro, rame, zinco ed altri.

Proprietà chimico-fisiche

Le proprietà delle proteine si ricollegano a quelle dei loro costituenti, gli amminoacidi: sono elettroliti anfoteri, possono essere sottoposte ad elettroforesi, sono otticamente attive (levogire) e presentano il fenomeno di Tyndall.

Il punto isoelettrico (o PI) di una proteina è rappresentato da quella concentrazione di idrogenioni del mezzo, che si comporta in modo da far assumere al protide una forma di anfoione.

Per ottenere il peso molecolare (o PM) delle proteine si deve far ricorso a tecniche e metodologie di non sempre facile attuazione. Tra le tante, quella che fornisce i risultati più precisi è senza dubbio la spettrometria di massa.

Dal punto di vista meccanico, la catena amminoacidica si comporta come un polimero semi-flessibile la cui estensione è descritta dal modello Worm-like chain, con una lunghezza di persistenza di 0.4 nm.