Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Big Data - Extraindo valor do caos informacional

null
by

Janete Estevao

on 27 February 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Big Data - Extraindo valor do caos informacional

Aplicações
Big Data
A base da pesquisa científica é a análise de dados e evidências para responder perguntas
Mas a quantidade de dados gerada pela humanidade se tornou exponencial;

O volume de informações produzido desde o ínicio dos tempos até 2003 foi de 5 Exabytes;

A mesma quantidade foi reproduzida só em 2004.
Sistemas de Informações Gerenciais (SGIs)

Complexos sistemas de gestão empresarial -ERPs (Enterprise Resource Planning)

Sistemas de Data Wharehouse

MultiAcervo
Big
Data
Processamento dados
TOOLS
1 Exabyte pode ser representado pela quantidade de dados de um bilhão de
DVDs enchendo um estádio
Porém estamos falando de 5 estádios...
2003
2004
2011
2013
2015
1 ano
5 EB
2 dias
5 EB
10 min
5 EB
2 seg
5 EB
Todos os tempos
5 EB
Este mesmo volume de dados foi gerado a cada ano em:
1.V - Volume
2. V - Variedade
3. V - Velocidade
Tempo real
4. V - Veracidade


5. V - Valor
Processamento de dados convencional x big data
A estrutura convencional não permite a manipulação e extração de valor desse volume de dados
Volume gerenciável
Volume maior
Processamento paralelo
2. V - Variedade
Ciência
+ Smartphones que PCs
Saúde
2 bilhões de usuários na internet
Varejo
On the clouds...
Bancos

E- commerce

Educação

Governo

GPS

Marketing

Rastros digitais

Transporte

Segurança
Donald Feinberg, analista da Gartner Intelligence
Mapear e entender os consumidores
Aumentar as vendas no e-commerce
Entender e otimizar os processos
Auxilia empresas na busca por novos funcionários
Melhorar a saúde pública - IBM usa Big Data para prever surtos de dengue e malária
Melhorar o desempenho de atletas
Melhorar o desempenho de máquinas e dispositivos
Melhorias na segurança
Melhorias na infraestrutura de cidades e países
Decisões no mercado financeiro
Fonte: http://goo.gl/xQn5S
A prefeitura fez um acordo com a IBM para entender o problema do congestionamento e da lotação de seu serviço de transporte público.

Dublin
A Biblioteca do Congresso armazena todos os tweets desde 2006, amplamanete utilizado em pesquisas
Fonte: http://goo.gl/EHmZ7d
Dados estruturados
Dados não estruturados
Algumas aplicaçoes de big data
?
http://goo.gl/73y5IW
Noções básicas sobre Big Data
Library of Congress
Fonte: http://goo.gl/KDSiaK
http://goo.gl/2h3IC
H1N1
?
Fonte: http://goo.gl/5e3saq
Escalabilidade de Processamento
O conjunto de dados dividido em diversos processadores onde se executa o processamento paralelamente
Processamento paralelo
Os dados estão sendo registrados por um determinado motivo, porém, após analisá-los pode ser percebido um uso completamente diferente e não esperado
Análise dos dados busca por padrões ou anomalias que revelem uma necessidade, um problema, uma demanda não explorada ou não percebida ainda
Fonte: http://goo.gl/EYMGg3
Fonte: http://goo.gl/pi6eSY
FONTE: http://goo.gl/lS1lSO
<=>
Processamento e análise desses dados que
gerem respostas confiáveis e de valor
Bibliotecário (Cientista) de Dados
Cientista de dados: o profissional do futuro (1 / 100 vagas)
5 bilhões de câmeras
Uma pesquisa em artigos em revistas e blogs internacionais (2012-2013), indentificou duas áreas de atuação para Bibliotecários:
"evolução dos nossos serviços, podendo ajudar na previsão de comportamento e na total flexibilidade para o usuário";
"especialistas em informação e documentação devem ser intrinsecamente relacionados para lidar com os novos desafios apontados pelo Big data".
Postos de trabalho em empresas com soluções Big Data
Coleções digitais
Também temos Big Data e precisamos repensar a infraestrutura de TI
Fonte: http://goo.gl/bC0DGc
Fonte: http://goo.gl/bC0DGc
Os usuários estão cada vez mais centrado em informações disponíveis na web e buscam ambientes digitais
Precisamos atualizar nossas competências profissionais por meio da Educação continuada, com foco em gestão de dados e curadoria digital*; bibliotecários com formação dupla, agregando TI ao currículo
problemas em extrair o valor dos dados
as questões de direitos autorais e de propriedade intelectual
Valor e Veracidade
Problemas como oportunidades
*curadoria digital? Espia lá: http://goo.gl/FkGKRI , http://goo.gl/UFTt2B, http://goo.gl/4bZtoF, http://goo.gl/apKOoL
O bibliotecário de referência é apontado como o profissional mais indicado para humanizar o Big Data, pois ele está na categoria de profissionais que pensam as questões de privacidade, autoridade, qualidade, autenticidade, racionalidade e ética. É ele quem centraliza os processos em um esforço de aprimorar a condição humana e as vidas de todos os indivíduos, criando ferramentas para a circulação e a sustentabilidade de dados na imensidão do Big Data e encontrar a informação exata que seu usuário precisa.

Joseph Janes, professor da Universidade de Washington
Fonte: http://goo.gl/dzq6Mq
http://goo.gl/mZVN2F
Escalabilidade de Processamento
Fonte: http://goo.gl/Rs8zvd
Fonte: http://goo.gl/Rs8zvd
Divisão dos conjuntos de dados em múltiplos processadores
Cada servidor cria um resumo dos dados alocados
A informação é agregada sob uma etapa chamada redução
Fonte: http://goo.gl/fdVQZ6
A atualidade impulsiona a constante transformação das profissões.
Extraindo valor do caos informacional
Obrigada
Janete Estevão
janete@addocs.com.br

Janete Estevão
Gestão de Documentos, Msc., ECMp, CDIA+
janete@addocs.com.br
É uma questão de sobrevivência!
Fonte: http://goo.gl/Vk6fsQ
Fonte: http://goo.gl/Vk6fsQ
Fonte: http://goo.gl/Vk6fsQ
Fonte: http://goo.gl/Vk6fsQ
<=>
Obrigada :)
Janete Estevão
janete@addocs.com.br
Full transcript