Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Teórica "Omicas"

No description
by

Hebe Dionisi

on 12 November 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Teórica "Omicas"

Dra. Hebe Dionisi
Laboratorio de Microbiología Ambiental
Centro Nacional Patagónico (CENPAT-CONICET)

GENÓMICA
METAGENÓMICA
Jerarquía de las Estrategias "Omicas"
"OMICAS"
Estudio en gran escala de genes (genómica), transcriptos (transcriptómica), proteínas (proteómica), metabolitos (metabolómica), lípidos (lipidómica) e interacciones (interactómica) en especies individuales
GENÓMICA
Primer genoma microbiano secuenciado
Haemophilus influenzae Rd
1995
Actualmente más de 4200 genomas completos
www.genomesonline.org
Hay 10 microorganismos en nuestro planeta
30
Número de especies desconocido
Menos del 1% cultivables
GEBA
PREDICCIÓN DE GENES

Identificar genes en la secuencia a partir de los ORFs encontrados
Propagación de errores
Asignaciones incorrectas de nombre y función
Codón de iniciación incorrecto
Sobran o faltan genes
INTRÍNSECOS
EXTRÍNSECOS
(basados en características de la estructura del gen)
(basados en homología con secuencias conocidas)
SEÑALES
CONTENIDOS
Codones de iniciación y terminación
Verificación experimental de las predicciones
Patrones de uso de codones
Características de regiones codificantes y no codificantes
Promotores
Sitos de unión al ribosoma
ENCUENTRAN LA MAYORÍA DE LOS GENES

ALTO NÚMERO DE FALSOS POSITIVOS
EL MÉTODO MÁS CONFIABLE PARA LA PREDICCIÓN DE GENES

CAPAZ DE ENCONTRAR GENES BIOLÓGICAMENTE RELEVANTES
Los genes son identificados por comparación con secuencias de proteínas
GENES SIN HOMOLOGÍA CON SECUENCIAS CONOCIDAS (50%)
LA PREDICCIÓN AUTOMÁTICA DE GENES AÚN NO ES CONFIABLE

USAR COMBINACIÓN DE HERRAMIENTAS Y
CURACIÓN MANUAL

REVISIÓN DE LA ANOTACIÓN CON EVIDENCIA EXPERIMENTAL
Grandes diferencias entre procariotas y eucariotas
PIPELINES PARA LA ANOTACIÓN AUTOMÁTICA
NCBI's Prokaryotic Genomes Annotation Pipeline (PGAAP)
Métodos intrínsecos y extrínsecos de predicción de genes
Revisión manual
Envío a GenBank
Integrated Microbial Genomes (IMG)
APLICAR PROGRAMAS DE PREDICCIÓN DE GENES
TRANSFERIR LA ANOTACIÓN DEL GENOMA MÁS CERCANO
PARA CADA GEN
Secuenciación
Ensamblado
Borrador
Secuencia finalizada
Borrador permanente
¡Ningún genoma está realmente finalizado!
Estructural
Funcional
Identificar ORFs
Estructura génica
Regiones codificantes
Motivos regulatorios
Función bioquímica
Función biológica
Expresión
Regulaciones e interacciones
ANOTACIÓN
Proceso de otorgar información biológica a una secuencia
Encontrar los genes
Caracterizar los genes
Comparar con otros genes


Encontrar componentes funcionales


Predecir características
Anotación
automática
(pipeline)
Anotación manual
(curación)
Debemos "traducir" la secuencia a un lenguaje que podamos entender
¿Cuántos genes hay?
¿Dónde están?
¿Qué hacen?
GENOMA: totalidad de la información genética presente en un organismo
del latín -oma que indica conjunto o masa
La anotación se integra al IMG/ER
Herramientas para el análisis comparativo con otros genomas depositados en IMG
PREDECIR DOMINIOS, ESTRUCTURA, PESO MOLECULAR, LOCALIZACIÓN
GENÓMICA: estudio del genoma de un organismo
Jerarquía de las Estrategias "Meta-omicas"
"META-OMICAS"
Estudio en gran escala de genes (metagenómica), transcriptos (metatranscriptómica), proteínas (metaproteómica), metabolitos (meta-metabolómica), etc. en comunidades microbianas
del latín -oma que indica conjunto o masa
METAGENÓMICA
COMPARACIONES ENTRE TECNOLOGÍAS
SECUENCIACIÓN AL AZAR DEL METAGENOMA
BIBLIOTECAS METAGENÓMICAS
¿Quiénes están allí?
¿Qué pueden hacer?
¿Qué están haciendo?
¿Cómo lo están haciendo?
SI
SI
NO
NO
CONSTRUCCIÓN DE BIBLIOTECAS METAGENÓMICAS
Reservorio del potencial genético de la comunidad
Método de gran utilidad en bioprospección
La cobertura de la biblioteca dependerá del número de clones y de la diversidad de la comunidad
Análisis directo de los genomas contenidos en una comunidad microbiana
ANÁLISIS DE BIBLIOTECAS METAGENÓMICAS
ANÁLISIS MOLECULAR
ANÁLISIS FUNCIONAL: METAGENÓMICA FUNCIONAL
CopyControl Fosmid Library Production Kit (Epicentre)
DOS ESTRATEGIAS POSIBLES
CLONADO DE FRAGMENTOS DEL METAGENOMA
SECUENCIACIÓN AL AZAR DE FRAGMENTOS DEL METAGENOMA
MUESTRA AMBIENTAL
ADN METAGENÓMICO
SELECCIÓN DE CLONES DE INTERÉS
ANÁLISIS DE CLONES DE INTERÉS
ANÁLISIS BIOINFORMÁTICO
TIPOS DE MUESTRAS
Vector
Muestras ambientales
Enriquecimientos
TIPOS DE VECTORES
PLÁSMIDOS
CÓSMIDOS
BACs
FÓSMIDOS
INSERTOS
30-45 Kb
<10 Kb
100-200 Kb
30-45 Kb
Nro COPIAS
ALTO
ALTO
BAJO
(INDUCIBLE)
BAJO
(INDUCIBLE)
UTILIDAD
Clusters
Clusters
Clusters
Gen
DEBILIDAD
Insuficiente información
Inestable
-
Poco eficiente
CARACT.
lambda cos
ORI
lambda cos
F-factor + ORIi
ORI
F-factor + ORIi
Metodología
Calidad y cantidad de ADN
Longitud de inserto deseada
Método de análisis
Hospedador
Tamaño de la biblioteca
- Molecular
* PCR
* Hibridización


- Funcional
* Actividad enzimática
* Selección
Análisis clon por clon vs. análisis por grupos de clones
Importancia en la selección de primers o probes
FALSOS POSITIVOS
FALSOS NEGATIVOS
LABORIOSO
RIESGO DE FALSOS NEGATIVOS
Células enteras vs.
ADN fósmidos
MENOS LABORIOSO, INHIBICIÓN
LABORIOSO, MENOS INHIBICIÓN
VENTAJAS
DESVENTAJAS
Expresión funcional de los genes de interés
No requiere equipamiento sofisticado
Pocos ensayos disponibles
Laborioso
Falsos negativos por baja expresión
Muchos genes no expresan en forma funcional
Análisis de un fenotipo en los clones de la biblioteca
Colonias
Extractos celulares
Complementación heteróloga
Resistencia a antibióticos o metales
TECNOLOGÍAS DE SECUENCIACIÓN
PRIMERA GENERACIÓN
SEGUNDA GENERACIÓN
TERCERA GENERACIÓN
Pacific Biosciences
Life Technologies
Oxford nanopore
Ion Torrent
ANÁLISIS BIOINFORMÁTICO: ENSAMBLADO
ANÁLISIS DE LOS CLONES SELECCIONADOS
ANÁLISIS BIOINFORMÁTICO: ASIGNACIÓN TAXONÓMICA
ANÁLISIS BIOINFORMÁTICO: ASIGNACIÓN FUNCIONAL
FÓSMIDOS IDENTIFICADOS
Secuenciación parcial
Inducción
Secuenciación completa
Expresión de los genes
Análisis comparativos de la organización génica
Posible identificación filogenética, fisiología
Fragmento del análisis molecular
Extremos del inserto
Secuencias más largas facilitan el análisis posterior
Programas de ensamblado desarrollados para genomas
LECTURAS
Genes o clusters de genes completos
Genomas de microorganismos no cultivados
Representan poblaciones no clonales
IDEALMENTE
Ensamblado
de novo
basado en secuencias de referencia
Rápido
Lento
Newbler
Velvet
Para poder ensamblar
Debemos tener una profundidad de análisis adecuada
IDEALMENTE
ENSAMBLADO
¿Qué tan diversa es mi comunidad?
Incrementa la calidad de la información
¿Cuál es la longitud de mis lecturas?
¿Cuál es el objetivo de mi estudio?
ECOLÓGICO
BIOTECNOLÓGICO
¿Qué longitud de contings necesito para la anotación?
EJEMPLO DE ENSAMBLADO
Illumina HiSeq platform 2 x 151 bp cycles
(Joint Genome Institute, DOE, USA)

6.7 x 10 lecturas (23 calles)

1.2 x 10 lecturas en contigs de más de 0.8 Kb
(4.5 - 34.5 %)
9
9
SÓLO SE UTILIZÓ PARA LA ANOTACIÓN LOS CONTIGS DE MÁS DE 0,8 Kb
Scaffolds ≥ 800 bp
(≥ 99.95% cobertura, 20-100x)

ANT 342,118
ARG 103,436
NOR 419,883
SWE 257,816
TOTAL 1,123,253
Genomas individuales o genomas de organismos cercanamente relacionados
BASADOS EN COMPOSICIÓN
BASADOS EN SIMILARIDAD
%GC
frecuencia de k-mers
BINNING
Proceso de ordenar las secuencias en grupos
S-GSOM
PCAHIER
TACAO
Diseño experimental
Extracción de ADN
Fraccionamiento
Secuenciación al azar del ADN
Anotación
Ensamblado
Muestreo
Binning
Análisis
Taxonómico
Funcional
Comparativo
Diferencias entre muestras
y
correlaciones con metadatos
Bases de datos
2D y 3D
Metadatos
Metadatos
Metadatos
¿Quién está allí?
¿Qué pueden hacer?
1D
1D
Pyrotags
ANÁLISIS BIOINFORMÁTICO: COMPARACIONES
MEGAN (MEtaGenome ANalyser)

Herramienta para estudiar el contenido taxonómico de un grupo de secuencias (ADN, ARN, proteínas)
ANÁLISIS DE GENOMAS MICROBIANOS
IMG
Integrated Microbial Genomes (IMG): http://img.jgi.doe.gov
Secuencias de NCBI RefSeq, integrada a metadatos (GOLD) y reanalizadas
Permite el análisis comparativo de genomas microbianos
Contiene genomas microbianos de 3 dominios, plásmidos y virus
Anotaciones basadas en COG, Pfam, TIGR, InterPro, GO y KEGG
Herramientas del IMG:
ENCONTRAR GENOMAS
GENERALIDADES
DATOS ESTADÍSTICOS
METADATOS
HERRAMIENTAS
MAPA DEL CROMOSOMA
REGIÓN DEL CROMOSOMA
GEN DE INTERÉS
Funciones Browse y Search
BUSCAR GENES
BUSCAMOS GEN DE INTERÉS
INFORMACIÓN DEL GEN
ALINEAMIENTOS
COG
Pfam
InterPro SCAN
ENCONTRAR FUNCIÓN
LISTA DE PARTES
SELECCIONO UNO DE ESTOS ELEMENTOS
ENCONTRAR FUNCIÓN
COMPARAR GENOMAS
ARBOL DE DISTANCIA
SELECCONAR GENOMAS PARA COMPARAR
AYUDA DEL IMG
GENES VECINOS
Tamaño promedio gen (1 Kb)
Sanger (96 lecturas)
GS FLX Titanium XLR70 (1.000.000 lecturas)
GS FLX Titanium XL+ (1.000.000 lecturas)
HiSeq2500 (3.000.000.000 lecturas)
1. Comparación de las secuencias
2. Análisis
BLAST
Pone una "etiqueta" a cada secuencia

Basado en NCBI taxonomy

LIMITACIONES

Una especie puede tener distitnos fenotipos

El mismo fenotipo puede observarse en distintos grupos taxonómicos
Algoritmo LCA
¿Existen secuencias relacionadas en la base de datos?
3 blastx matches para 1 lectura
Busca el ancestro taxonómico común para los tres resultados del blast
FILOGRAMA DEL METAGENOMA DE SEDIMENTOS COSTEROS DE BAHÍA USHUAIA
El tamaño del nodo representa el número de secuencias asignadas (escala logarítmica)
DATOS EXPRESADOS A LA MAYOR RESOLUCIÓN
El nivel de confianza de predicciones funcionales incrementa con el largo de la secuencia
ORFans
ENSAMBLADO
PREDICCIÓN DE GENES
InterPro
PROSITE
PRINTS
ANÁLISIS FUNCIONAL
FragGeneScan
MetaGeneMark
MetaGeneAnnotator
Orphelia
Organización génica
Fusión de genes
Perfiles filogenéticos
Coexpresión de genes
Lecturas NGS
Contigs y Scaffolds
Genes predichos
Homología
Contexto
Motivos
InterProScan
BLAST
HMMER
SECUENCIAS DE GENES ANOTADOS/NOVEDOSOS
NR, UniProt
COGs, NOGs
Pfam, TGRfam
GO
KEGG, SEED
STRINGS
Predicción de genes que no codifican proteínas
(RNAr, RNAt, etc)
Caracterización Bioquímica
Caracterización estructural
Pipelines:MG-RAST
IMG-M
CAMERA
Distintas muestras entre sí dentro de mi set de datos
Con muestras de otros sets de datos
Debe comenzar con un correcto diseño experimental
RÉPLICAS BIOLÓGICAS

METADATOS
Anotación de los metagenomas
Los datos se reducen a tablas
Presencia/ausencia
Abundancia
Muestras
Función/Taxón
Similar a matrices utilizadas en otras disciplinas

HERRAMIENTAS ESTADÍSTICAS:
Identificar correlaciones y patrones estadísticamente significativos, análisis estadísticos multivariados

Primer-E, Metastats, Shotgun-FunctionalizeR
heatmap/dendrograma
Muestras
Categorías
nMDS
Full transcript