Differenze geniche tra individui sani e affetti da autismo
- INTRODUZIONE
- DISEGNO SPERIMENTALE
- TECNOLOGIA
- PREPROCESSING
Introduzione
INTRODUZIONE
- Disturbo dello spettro autistico (ASD)
- FOXG1 e deregolazione GABA
- Quali differenze tra malati di ASD e i loro familiari sani ?
- 4 ASD, 4 padri, 3 madri e un fratello
DISEGNO
SPERIMENTALE
- SummarizedExperiment da recount: 58037 geni e 48 campioni
- Genere, ID, Giorno e salute
- Filtraggio geni senza nome in formato "SYMBOL" (32541)
- Tolto il giorno 0
- Tolto unico fratello sano
- Accorpamento misurazioni per giorno relative allo stesso soggetto
- Filtraggio geni poco espressi (1837)
- Risultato: 23659 geni e 22 campioni
PREPROCESSING
Normalizzazione & Batch Effect
Normalizzazione
e
Batch Effect
1) Normalizzo per ridurre gli errori sistematici
2) PCA per valutare se la normalizzazione abbia eliminato le distorsioni tecniche presenti nei dati
3) Rimozione Batch Effect per limitare la variabilità tecnica e far emergere la variabilità biologica.
Normalizzazione
- L’obiettivo della normalizzazione è quello di rendere le distribuzioni dei dati tra i campioni il più simile possibile tra di loro.
- Sono state provate più normalizzazioni per vedere quale funzionasse meglio.
- Dalla visualizzazione dei boxplot otterremo una conferma del fatto che la normalizzazione ha effettivamente fatto ciò per cui è stata progettata.
RLE plot
Pre-normalizzazione
L'RLE plot dei conteggi non sembra mostrare differenze marcate tra i campioni
RLE plot
Post-normalizzazione
La normalizzazione TMM è quella che ha trasformato il meno possibile la struttura dei dati
Per le successive analisi si è scelto di utilizzare la normalizzazione TMM
PCA
- Utilizzata per vedere quali combinazioni di variabili spieghino la maggior parte della varianza.
- Confronto delle PCA pre e post normalizzazione
- Confronto tra sani e malati e tra giorno 11 e giorno 31
La PCA sui dati grezzi non discrimina i pazienti sani da quelli malati
Dispone i campioni in base al numero di reads sequenziate
PCA per salute
Dopo la normalizzazione TMM aumenta la varianza spiegata, ma non ho ancora una differenza marcata tra i due gruppi
PCA per giorno
L'effetto del giorno sembra incidere molto di più dello stato di salute nella variabilità dei dati, sia prima che dopo la normalizzazione
Batch Effect
- Il giorno è stato considerato una variabile confondente, in grado di influenzare i risultati dell’esperimento.
- Per rimuovere dai dati la variabilità dovuta al giorno è stato utilizzato il modello ComBat.
Effetto del giorno praticamente eliminato dopo averlo trattato come effetto di batch
PCA
Batch Effect
Primi passi
Inferenza
- Creazione dell'oggetto tramite la funzione DGEList
- Costruzione matrice del disegno
Modello lineare con i pesi
Il modello
Abbiamo utilizzato la funzione voom per:
- trasformare i dati in logCPM;
- stimare la relazione tra media e varianza;
- calcolare i pesi per ogni osservazione.
I pesi stimati sono incorporati nei modelli lineari, che vengono fittati per ogni gene.
Distribuzione p-value
Distribuzione dei p-value relativi ai coefficienti della variabile salute tra
i vari geni
Geni differenzialmente espressi
Il modello ha identificato 1987 geni differenzialmente espressi (ad un livello di significatività del 5%) su
un totale di 23659 geni.
Interpretazione dei risultati
- Il gene FOXG1 è il più significativo;
- FOXG1 è stato valutato gene attivatore della deregolazione dei neuroni GABA/glutammato.
Dotplots
Questi dotplots sono stati ottenuti tramite il test esatto di Fisher e tramite l’approccio GSEA, entrambi riferiti alla Gene Ontology.
GABAergic Synapse Pathway
La maggior parte dei comunicatori
cellulari presenti in questo pathway è
rossa, indice del fatto che la maggior parte dei geni coinvolti in questi comunicatori sono
significativamente sovraespressi ad un livello del 5%.
- Sovraespressione del gene FOXG1;
- Sovraespressione dei vari geni che possono codificare varie proteine coinvolte nello sviluppo cerebrale o che possono essere associate a disturbi neurali.
Conclusione
Differenza nello sviluppo telencefalico a livello embrionale tra sani e malati di ASD.