Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

2015 - Blast, Bancos de Dados e Busca em Bancos de Dados

Aula da Disciplina NG110 - Métodos Computacionais em Bioinformática. 2015.3.23 e 2014.3.30
by

Felipe Rodrigues da Silva

on 22 April 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of 2015 - Blast, Bancos de Dados e Busca em Bancos de Dados

Felipe Rodrigues da Silva
Lab. de Bioinformática Aplicada - LBA
Lab. Multiusuário de Bioinformática - LMB
Embrapa Informática Agropecuária
felipe.silva@embrapa.br
Adhemar Zerlotini Neto
felipe.silva@embrapa.br
www.cnptia.embrapa.br/~felipes/BBB.htm
Bancos de Dados
Busca
BLAST
em Bancos de Dados:
Margaret Oakley Dayhoff
Biológicos
NCBI
282 sequências...
Alexander Oparin
Acúmulo de dados
http://www.ncbi.nlm.nih.gov/genbank/statistics
última edição em 1979
http://www.ic.unicamp.br/~zanoni/mo640/2012/
Entrez
Nucl. Acids Res. (2012) 40 (D1): D571-D579. doi: 10.1093/nar/gkr1100
http://www.genomesonline.org
www.ncbi.nlm.nih.gov/
Fundada em 1836...
~2006
GenBank
termo1 [campo]
OPERADOR
termo2 [campo]...
OPERADOR
termoN [campo]
OR

AND

NOT
OR

AND

NOT
Bittencourt[AUTH]
AND
spidroin[ALL]
OR
Nephilengys[ORGN]
Accession [ACCN]
All Fields [ALL]
Author Name [AUTH]
EC/RN Number [ECNO]
Feature Key [FKEY]
Filter [FILT]
Gene Name [GENE]
Issue [ISS]
Journal Name [JOUR]
Keyword [KYWD]
Modification Date [MDAT]
Molecular Weight [MOLWT]
Organism [ORGN]
Page Number [PAGE]
Primary Accession [PACC]
Properties [PROP]
Protein Name [PROT]
Publication Date [PDAT]
SeqID String [SQID]
Sequence Length [SLEN]
Substance Name [SUBS]
Text Word [WORD]
Title Word [TITL]
Uid [UID]
Volume [VOL]
txid6893[Organism:exp] AND bdiv_est[PROP]
http://bio.cs.washington.edu/blast.pdf
http://www.cmu.edu/bio/education/courses/03510/LectureNotes/Altschul1990.pdf
MSP = maximal segment pair
PAM100
S = score limite para o acaso...
w = palavra
T = score da palavra
3 passos do Blast:
Gerar lista de palavras com score acima de T
Encontrar hits no banco de dados
Tentar estender os hits
(4 aa/12pb)
1990
Criação da lista de palavras:
remover regiões de baixa complexidade da query
criar lista com todas as palavras w que possuam pontuação T quando alinhadas à query
escolha da Matriz é fundamental nesta fase
Sequência para o exercício de BLAST:
http://www.cnptia.embrapa.br/~felipes/Exemplo_para_BLAST.htm
BLAST,
Bancos de Dados e
Buscas em Bancos de Dados

Total Genomes 11.472 (9/2011)
Total Genomes 41.448 (3/2014)
Complete Genomes 2.907 (9/2011)
Complete Genomes 18.850 (3/2014)
36!
www.cnptia.embrapa.br/~felipes/NCBI.htm
Full transcript