Category Archives: Metabolomica

Metabolomics Data Analysis

Nel contesto della metabolomica, gli approcci di analisi statistica più comuni si suddividono in metodi univariati e multivariati. Ogni metodo offre approfondimenti unici sulla struttura dei dati. L’analisi multivariata opera su una matrice di variabili e mette in evidenza le caratteristiche basandosi sulle relazioni tra tutte le variabili. L’analisi univariata considera invece una sola variabile alla volta, producendo risultati ponderati in modo diverso.

L’obiettivo dell’analisi statistica è la categorizzazione e la previsione delle proprietà dei campioni attraverso la generazione di modelli che catturano le informazioni contenute nelle matrici di dati. Nella spettrometria di massa, il rapporto m/z e l’intensità del segnale sono le due variabili più importanti. Nell’NMR selezioniamo i segnali integrati di interesse per l’analisi dei dati.

Nell’ambito dell’analisi multivariata, distinguiamo metodi supervised e unsupervised come i due principali approcci di analisi statistica e machine learning utilizzati per analizzare i dati.

Metodi Unsupervised

I metodi unsupervised non richiedono etichette o variabili di output predefinite. L’obiettivo è esplorare la struttura intrinseca dei dati, trovando pattern, gruppi o caratteristiche rilevanti.

Caratteristiche principali:

  • No etichette: Non esistono etichette a priori; i metodi cercano di individuare somiglianze o differenze nei dati.
  • Scoperta di pattern: Sono utilizzati per esplorare i dati e identificare raggruppamenti naturali o ridurre la dimensionalità.
  • Esempi di metodi unsupervised:
    • Clustering: Algoritmi come Hierarchical Clustering dividono i dati in gruppi basati su similarità.
    • Riduzione della dimensionalità: Metodi come PCA (Principal Component Analysis) semplificano la rappresentazione dei dati preservandone le caratteristiche principali.

Metodi Supervised

I metodi supervised richiedono un set di dati etichettati, in cui ogni campione è associato a un’etichetta o a una variabile di output nota (ad esempio, classe, valore numerico, ecc.). L’obiettivo principale è costruire un modello che sia in grado di prevedere accuratamente l’etichetta per nuovi dati non etichettati.

Caratteristiche principali:

  • Training su dati etichettati: Si utilizza un insieme di dati noti (training set) per apprendere la relazione tra le variabili indipendenti (input) e le etichette (output).
  • Predizione: Una volta addestrato, il modello può essere utilizzato per prevedere le etichette di nuovi campioni.
  • Esempi di metodi supervised in metabolomica: PLS-DA (Partial Least Square – DIscriminant Analysis)

Analisi delle Componenti Principali (PCA)

L’Analisi delle Componenti Principali (PCA, Principal Component Analysis) è una tecnica di riduzione della dimensionalità utilizzata per semplificare set di dati complessi preservandone le caratteristiche più rilevanti. È ampiamente impiegata in numerosi campi, come la metabolomica, la genetica, l’analisi di immagini, e altre discipline che gestiscono dati ad alta dimensionalità.

Obiettivo della PCA

La PCA mira a trasformare un set di dati originale (caratterizzato da molte variabili correlate) in un nuovo sistema di coordinate, chiamato componenti principali. Queste componenti:

  1. Sono ortogonali (non correlate tra loro).
  2. Catturano la varianza massima: la prima componente principale (PC1) cattura la maggior parte della varianza nei dati, seguita dalla seconda (PC2), e così via.

Questo processo consente di rappresentare i dati con un numero inferiore di variabili, riducendo la complessità ma mantenendo la maggior parte dell’informazione.
Come vengono calcolate le componenti principali? Vedi il materiale presente al link “DATA ANALYSIS” sotto per io dettagli. Fondamentalmente, si scelgono le componenti principali che spiegano una frazione significativa della varianza totale (ad esempio, il 95%) e i dati originali vengono trasformati nel nuovo sistema di coordinate formato dalle componenti principali.

Grafici principali nella PCA

1. Score Plot

Lo score plot mostra la proiezione dei campioni nello spazio delle componenti principali selezionate (ad esempio, PC1 e PC2).

  • Cosa rappresenta:
    • Ogni punto nel grafico corrisponde a un campione nel dataset.
    • Le coordinate di un campione sul grafico rappresentano i suoi punteggi (scores), ovvero i valori proiettati sulle componenti principali.
  • Utilità:
    • Identifica pattern nei dati: ad esempio, raggruppamenti naturali, tendenze, o separazioni tra gruppi (es. malati vs sani).
    • Aiuta a rilevare outlier o campioni anomali.
  • Esempio:
    • Un gruppo di campioni che si aggregano in una regione dello score plot può indicare una similarità tra di essi (ad esempio, appartenenza a una stessa classe).

2. Loading Plot

Il loading plot rappresenta i carichi (loadings), ovvero i coefficienti che descrivono il contributo delle variabili originali (metaboliti, geni, ecc.) alle componenti principali.

In uno studio metabolomico, un loading plot potrebbe evidenziare quali metaboliti sono responsabili della separazione tra gruppi di campioni osservata nello score plot.

Cosa rappresenta:

Ogni punto nel grafico corrisponde a una variabile originale. La posizione di una variabile indica quanto questa contribuisce a ciascuna componente principale.

Un loading plot sotto forma di istogramma è una rappresentazione alternativa dei carichi (loadings) che descrivono il contributo delle variabili originali (ad esempio, metaboliti, geni, segnali) a una specifica componente principale (PC). Invece di visualizzare i carichi come punti o vettori su un piano cartesiano (come accade nel loading plot tradizionale), in un istogramma ogni barra rappresenta il peso di una variabile su una determinata componente principale.

Caratteristiche del Loading Plot a Istogramma

  • Asse X:
    • Rappresenta le variabili originali (es. nomi o numeri che identificano i metaboliti, geni, o segnali di interesse).
    • Ogni barra corrisponde a una variabile.
  • Asse Y:
    • Indica il valore del carico (loading), che può essere positivo o negativo.
    • I valori positivi mostrano una correlazione diretta con la componente principale, mentre i valori negativi indicano una correlazione inversa.
  • Altezza delle barre:
    • La lunghezza di ciascuna barra rappresenta il contributo della variabile alla specifica componente principale.
    • Variabili con barre più alte (in valore assoluto) hanno un’influenza maggiore sulla componente.

Utilità:

Identifica le variabili che influenzano maggiormente le componenti principali. Aiuta a interpretare la biologia o il fenomeno dietro ai pattern osservati nello score plot. Rileva correlazioni tra variabili: variabili vicine o nella stessa direzione possono essere correlate, mentre quelle opposte possono essere anti-correlate.

Qui potete scaricare il materiale utile allo studio dell’analisi dei dati di metabolomica: DATA ANALYSIS

Una volta ottenute le variabili significative, dovremo capire quali metaboliti si “nascondono” dietro queste variabili, ad esempio, analizzando i dati NMR.

NB: L’analisi metabolomica prevede vari step e ognuno di questi porta con se una certa variabilità.
La standardizzazione delle procedure analitiche, di analisi e presentazione dei dati è di fondamentale importanza per poter “parlare” un linguaggio comune che permetta di confrontare i risultati di esperimenti diversi. In questo contesto, vi consiglio lo studio di “Proposed minimum reporting standards for chemical analysis” e for data analysise l’articolo “Metabolite identification: are you sure? And how do your peers gauge your confidence?

Metabolomica-Planning Seminari e seconda esercitazione pratica

Di seguito troverete due link per indicare le vostre preferenze in relazione alla seconda esperienza di laboratorio: https://doodle.com/group-poll/participate/dJXmrE2a

e del seminario: https://doodle.com/group-poll/participate/azlGyBYd

Troverete date sia pre-vacanze natalizie, sia post-vacanze natalizie.

Se vanno bene più date, indicatele tutte.

Tecniche Analitiche in Metabolomica: NMR

La Spettroscopia di Risonanza Magnetica Nucleare (NMR) è una tecnica che non ha rivali nell’ambito della caratterizzazione strutturale. Questa tecnica spettroscopica, che sfrutta le proprietà magnetiche dei nuclei di alcuni atomi, ci permette di avere informazioni fondamentali sui composti organici. Non tutti i nuclei sono attivi all’NMR, ma tra quelli attivi si annoverano il protone e l’isotopo 13C del carbonio ed è proprio grazie all’applicazione a questi nuclei che otteniamo informazioni strutturali fondamentali per poter identificare la struttura dei composti.

Da uno spettro protonico possiamo dedurre numerose informazioni: il chemical shift ci dà informazioni su quello che è l’intorno chimico, la molteplicità ci dà informazioni sul numero di protoni legati ai carboni vicini (con le costanti di accoppiamento che ci forniscono altre importanti informazioni strutturali), infine l’integrazione ci permette di avere informazioni di tipo quantitativo.
L’utilizzo di techinche 2D-NMR, inoltre, ci dà la possibilità di ricostruire l’intero scheletro delle molecole.
Tutte queste potenzialità sono estremamente utili in metabolomica. Abbiamo visto (e vedremo) in che modo possiamo applicare questa tecnica all’analisi metabolomica.

Intanto, cerchiamo di capire meglio il principio di base su cui poggia questa potentissima tecnicha.
Di seguito, due video che possono aiutarci. Il primo, prodotto dalla Bruker, il secondo da Sciencesketch.

Curiosi anche di sapere come è fatto lo strumento all’interno? Date un’occhiata qui!

Al link seguente è possibile scaricare il materiale di supporto allo studio:

Testi utili per ulteriori approfondimenti:

-D’Ischia “La chimica organica in laboratorio” Ed. Piccin
-Hesse “Metodi Spettroscopici in Chimica Organica”

(entrambi disponibili in biblioteca; in caso di indisponibilità, rivolgersi alla docente)

NMR-based metabolomics

Dall’analisi NMR di un campione si possono dedurre tante informazioni diverse. Ma come si effettua un’analisi metabolomica mediante NMR?

A partire dal materiale liofilizzato, si ottengono gli estratti con una procedura molto semplice che prevede l’estrazione diretta in solventi deuterati (necessari per l’analisi NMR). Questi estratti vengono analizzati, ottenendo gli spettri, che saranno poi processati: questo processing prevede l’apodizzazione, la fasatura, la calibrazione rispetto allo standard intetno e la correzione della linea di base

A questo punto si procede con l’integrazione. Questa è effettuata attraverso il processo di bucketing o binnig: lo spettro si divide in tanti segmenti di lunghezza definita (in genere 0.02 o 0.04 ppm) e si procede ad integrare l’area sotto la curva di ogni bucket. Si ottiene in questo modo una matrice di dati in cui le osservazioni sono i singoli campioni analizzati e le variabili sono i vari bucket, che assumeranno quindi il valore dell’area per quella parte dello spettro in ciascun campione (NB: le aree sono in genere normalizzate rispetto allo standard interno a alla total intensity).

La matrice di dati così ottenuta è sottoposta ad analisi statistica multivariata. Questa sarà utile ad estrarre le informazioni significative dal nostro set di dati.

Una volta identificati i segnali NMR significativi per la nostra analisi, è necessario “tradurre” questi segnali in metaboliti. Si opera a questo punto per step successivi.
Il primo passaggio è quello del confronto con la letteratura e con i database. A questo proposito, è necessario sottolineare come l’NMR sia una metodica altamente riproducibile. In ogni caso, se questa ricerca non ci dà la risposta sperata, si può optare per l’analisi NMR bidimensionale (2D NMR).I metodi 2D NMR più utilizzati in metabolomica sono brevemente descritti di seguito.

COSY (COrrelation SpecroscopY)

Esperimento 2D omocorrelato. Permette di rilevare correlazioni omonucleari 1H-1H tra protoni vicinali e geminali

TOCSY (TOtal Correlation SpecroscopY)

Esperimento 2D omocorrelato. Permette di rilevare sistemi di spin (il trasferimento di magnetizzazione è interrotto da carboni quaternari).

HSQC (Heteronuclear Single Quantum Coherence)

Esperimento 2D eterocorrelato. Permette di rilevare le correlazioni dirette protone-carbonio. Permette quindi di attribuire il valore di chemical shift del carbonio per ciascun carbonio protonato presente nell’estratto (o nella molecola, quando lo spettro si riferisce ad un composto puro)

H2BC (Heteronuclear 2 bond correlation)

Esperimento 2D eterocorrelato. Permette di rilevare le correlazioni tra un protone e il carboni vicinale, a patto che quest’ultimo sia protonato.

Correlazioni selezionate indicate sullo spettro e sulla struttura con lo stesso colore

HMBC (Heteronuclear Multiple Bond Coherence)

Esperimento 2D eterocorrelato. Permette di rilevare le correlazioni tra un protone e carboni distanti due, tre o quattro legami. Un esperimento alternativo è noto come CIGAR-HMBC.

Sono evidenziate le correlazioni del composto mostrato in alto a sinistra. Le altre correlazioni appartengono ad altre componenti dell’estratto.

HSQC-TOCSY

Esperimento 2D eterocorrelato. Permette di rilevare sistemi di spin, che in questo caso includono sia i protoni sia i carboni.

Grazie alla combinazione delle informazioni che si ottengono dai diversi spettri 2D NMR, è possibile identificare i costituenti dell’estratto anche in miscela. Per metaboliti già noti, a questo punto sarà possibile confrontare i dati NMR con quelli riportati in letteratura o con quelli degli standard (a patto che siano acquisiti nello stesso solvente). Per i composti identificati per la prima volta, al fine di confermare la struttura, saranno necessari l’isolamento (che a questo punto sarà facilitato dalle informazioni preliminari in nostro possesso circa la struttura del composto) e la completa caratterizzazione strutturale mediante tecniche spettroscopiche.
Va infine ricordato che oltre ad identificare i componenti dell’estratto, è anche possibile quantificarli dato che l’ 1H NMR è una tecnica quantitativa (se gli spettri sono acquisiti con determinati parametri) e che è sufficiente in questo caso utilizzare uno standard interno a concentrazione nota.

Tecniche analitiche in Metabolomica: Spettrometria di Massa

Le due tecniche più utilizzate ad oggi per acquisire i dati in metabolomica sono senza dubbio la spettrometria di massa (MS) e la spettroscopia di risononanza magnetica nucleare (NMR).
La prima sfrutta la possibilità di generare e separare ioni in base al loro rapporto massa/carica. A lezione abbiamo visto che in realtà esistono tantissime applicazioni (ed “evoluzioni”) diverse di questa tecnica che la rendono particolarmente utile nell’analisi metabolomica. Il video seguente illustra, invece, il principio di base.

In una serie di video proposti dalla Waters, è possibile capire più a fondo il principio di funzionamente dell’ESI (Elettrospray ionization), che abbiamo visto essere insieme all’APCI e al MALDI (con tutte le variazioni sul tema viste a lezione) una delle tecniche di ionizzazione più diffuse quando la MS è utilizzata in metabolomica. Per quanto riguarda gli analizzatori, è possibile vedere come è fatto un quadrupolo.
Inoltre, è possibile approfondire la problematica della formazione di addotti, della formazione di specie con carica multipla, nonchè la questione dei picchi isotopici. Infine, viene affrontata la questione importantissima della risoluzione.

L’alta risoluzione è, in effetti, fondamentale nell’analisi metabolomica e, come abbiamo visto, anche l’applicazione della MS/MS aggiunge notevoli vantaggi in termini di determinazione dell’identità delle molecole. Nel seguente video è possibile seguire gli ioni nel loro cammino nel caso di un esperimento LC-MS/MS

Dal sito Bruker è possibile vedere come funziona un MALDI-TOF-TOF e da quello dell’Agilent come funziona un triplo quadrupolo associato ad un gas cromatografo o ad un HPLC/UPLC.

Le tecniche di HR-MS e MS/MS (o tandem MS) hanno notevolmente contribuito all’applicazione odierna di questa tecnica in campo metabolomico.
Inoltre, non va dimenticata la possibilità offerta dalle tecniche di imaging da un lato e dall’applicazione di tecnologie ancora più avanzate dall’altro.
Come non menzionare, allora, l’utilizzo della ion mobility mass spectrometry, che separa gli ioni non solo in base al rapporto massa/carica ma anche in funzione della loro grandezza e forma.

Le più recenti applicazioni della spettrometria di massa in metabolomica sono state trattate in una review recente “Advances in mass spectrometry-based metabolomics for investigation of metabolites” (Ren at al., RSC Advances, 2018).

Al link seguente è possibile scaricare il materiale di supporto allo studio:

Metabolomica e scienze omiche

Che cos’è la metabolomica? Come si colloca nell’ambito della biologia dei sistemi? Quali sono le possibili applicazioni? Qual è la tipica sequenza sperimentale di un approccio metabolomico? Questi sono alcuni dei punti trattati nel corso della prima lezione.

Metabolomica: un approccio all’interfaccia tra la chimica e la biologia

La METABOLOMICA è un approccio innovativo allo studio dei fenomeni e dei sistemi biologici.

Innanzitutto, dobbiamo considerare l’ampio range di applicazioni di questo approccio allo studio dei sistemi biologici. Applicazioni che riguardano la chimica delle sostanze naturali, la chimica degli alimenti, la chimica farmaceutica, il metabolismo, la fisiologia e lo studio della risposta a stress da parte degli organismi e delle interazioni che tra essi intercorrono, la chimica ambientale, la ricerca biomedica e tantissimi altri campi.

Del resto, la metabolomica si colloca all’interfaccia tra la chimica e la biologia, in quanto ciascun fenomeno biologico produrrà una risposta chimica misurabile e la determinazione delle variazioni osservate fornirà informazioni sullo stato del sistema biologico in analisi. Inoltre, andando a misurare quelli che sono i prodotti finali dell’espressione genica, ossia i metaboliti, fornisce informazioni essenziali su quello che è il fenotipo e la relazione di quest’ultimo col genotipo.

Uno step fondamentale nell’approccio metabolomico è la fase di disegno sperimentale. Al fine di ottenere dati che siano statisticamente e biologicamente significativi e che diano risposta alla nostra research question, è necessario definire a priori tutti i parametri sperimentali da considerare, le variabili da valutare e quelle da controllare. Sarà necessario inoltre prendere in considerazione l’utilizzo di un numero opportuno di replicati tecnici e biologici (tale numero varia sia in base al sistema biologico in analisi, sia in base alle tecniche analitiche utilizzate).

A questo punto, sarà necessario procedere all’esecuzione dell’esperimento e/o al campionamento. Le metodiche utilizzate variano a seconda del tipo di campione, ma un punto fondamentale e ineludibile, al fine di ottenere risultati che rispecchino il reale stato del sistema, è il quenching del metabolismo: sarà necessario bloccare tutte le reazioni, siano esse catalizzate da enzimi o meno. In genere, questo si ottiene con il metodo del deep freezing, congelando il campione immediatamente in azoto liquido (-196°C). I campioni sono poi conservati a -80°C fino al momento della liofilizzazione. Quest’ultimo processo, che allontana l’acqua dal campione, è necessario sia per una migliore conservazione (l’acqua è il mezzo per la maggior parte delle reazioni che avvengono nei campioni biologici) sia (in alcuni casi) per rendere compatibile il campione con le successive analisi.

La maggior parte delle tecniche analitiche usate in metabolomica richiede che il campione sia in soluzione, di conseguenza il passaggio successivo consisterà in una procedura di estrazione dei metaboliti. In questo caso le metodiche variano sia in base alla natura del campione, sia in base alla piattaforma analitica che si utilizzerà nella fase successiva. Fase successiva che consiste nell’analisi della composizione chimica degli estratti. Diverse tecniche sono disponibili, ma quelle più comunemente utilizzate in metabolomica sono la Spettroscopia di Risonanza Magnetica Nucleare (NMR) e la Spettrometria di Massa (MS). Quest’ultima richiede solitamente una separazione a monte dei metaboliti che compongono l’estratto ed è quindi in genere interfacciata con un sistema cromatografico (GC o HPLC/UPLC).

Una volta acquisiti i dati, il complesso dataset ottenuto è analizzato attraverso metodiche di analisi statistica multivariata (MVDA) al fine di estrarre le informazioni circa la classificazione dei campioni e circa i segnali e, in ultima analisi, i composti responsabili della classificazione osservata. A questo punto, si procede con la caratterizzazione strutturale dei composti che risultano essere significativi nell’analisi. Questa caratterizzazione si avvale, tra l’altro, di tecniche ad alta risoluzione e di spettrometria tandem, nel caso della MS. Nel caso dell’NMR una caratterizzazione dei metaboliti nell’estratto è possibile mediante l’utilizzo di tecniche NMR bidimensionali. Per entrambe le tecniche, un supporto notevole è fornito dai database.

Le informazioni estrapolate mediante MVDA vanno poi integrate con le conoscenze sul sistema biologico in analisi e forniranno la risposta alla domanda che sottende lo studio o forniranno nuove ipotesi da testare.


Al seguente link è possibile scaricare le slide del corso, insieme a del materiale utile per approfondimenti.


Inolre, è possibile ottenere informazioni anche al seguente link: Introduzione alla metabolomica (contenuti: definizione di metaboloma e metabolomica, note sull’importanza di questo tipo di approccio e campi di applicazione, panoramica di quello che è l’approccio dal punto di vista metodologico).

E alla fine potrai anche testare le tue conoscenze

Corso di Metabolomica: Prossima lezione e dettagli organizzativi

La prossima lezione di metabolomica si terrà il 20 Ottobre 2025 alle ore 15:00 in aula C1.

Seguiranno lezioni tutti i lunedì con lo stesso orario. Le lezioni teoriche si concluderanno (salvo imprevisti) il 1 dicembre.

Nel corso del mese di dicembre si svolgeranno le attività pratiche: le date e gli orari saranno concordati successivamente.

Approfitto per ricordarvi che in questa settimana si terrà un importante evento presso il nostro dipartimento, cui siete tutti invitati: https://chimicaorganicadistabif.com/2025/10/11/phdays-2025/

PhDays 2025

C’è fermento nel nostro Dipartimento!

Il 16 e 17 ottobre 2025 si terrà presso il Polo scientifico dell’Università degli Studi della Campania “Luigi Vanvitelli” il 1st Emerging Trends in Biomolecular Sciences, evento centrale dei PhD Days 2025. Di seguito la locandina e il link al sito web dell’evento: https://phdays25.wordpress.com/

Tutti gli studenti del DiSTABiF sono invitati a partecipare!

Nel corso del PhDays, i dottorandi illustreranno e discuteranno con i loro colleghi e con i docenti e ricercatori i progressi fatti nel corso della loro attività di ricerca. Si tratta di un momento cruciale per loro, ma che può essere interessante anche per tutti gli studenti, soprattutto coloro che sono iscritti ai Corsi di Laurea Magistrale o agli ultimi anni del Corso di Laurea in Farmacia.

Ascoltando le relazioni dei dottorandi, potrete avere un’idea di quella che è l’attività di ricerca svolta presso il nostro Dipartimento. Tra l’altro, presto vi troverete di fronte a scelte importanti e potrebbe essere interessante capire, grazie al confronto con i vostri colleghi più grandi, se ad esempio l’attività di ricerca possa essere per voi una via percorribile.
Inoltre, molto spesso non abbiamo ben chiaro neppure cosa sia il dottorato di ricerca: quale occasione migliore per confrontarsi con chi lo vive? Anche i docenti saranno presenti e sicuramente aperti a rispondere a qualsiasi vostra domanda (durante e dopo l’evento).

Infine, a breve probabilmente vi troverete nella condizione di scegliere in quale laboratorio svolgere la vostra attività di tesi. Questo punto è importante soprattutto per coloro che devono fare una tesi sperimentale o metodologica, per le quali è necessario frequentare un laboratorio. Molto spesso la scelta viene fatta con poca consapevolezza, magari puntando al “minimo sforzo, massima resa”, oppure si sceglie semplicemente seguendo il consiglio degli altri…o, ancora peggio, sentendosi obbligati dall’invito di un docente a fare la tesi nel proprio laboratorio. Perchè non fare una scelta più consapevole, basata su un reale interesse verso l’attività di ricerca?
Il PhDays è una finestra aperta sul dipartimento, che vi permette di avere almeno un’idea di cosa si fa in diversi laboratori del DiSTABiF.

Sul sito dell’evento è disponibile anche il programma dettagliato dell’evento: https://phdays25.wordpress.com/program/, che si concluderà con un momento conviviale.




« Older Entries