Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

BIG DATA

No description
by

Caroline Berezuschy

on 19 February 2016

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of BIG DATA


BIG DATA
2002
História da Criação do Hadoop e Spark
2003
2004
2005
2006
2007
2008
2009
Doug Cutting e Michael Cafarella começaram a trabalhar no projeto Nutch
Google publica GFS e MapReduce
Doug Cutting cria o NDFS e adiciona o componente MapReduce ao Nutch
Yahoo! contrata Cutting. Hadoop torna-se um projeto independente do Nutch.
Facebook lança o Hive:
Suporte SQL para Hadoop
FUNDAÇÃO
NY Times converte 4 TB de arquivos de imagens em mais de 100 EC2s
A mais rápida ordenação de 1 TB foi em
3,5 minutos executando em 910 nodes.
Doug Cutting se
junta a Cloudera
A mais rápida ordenação de 1TB em
62 segundos executando em mais de 1460 nodes.
Ordenação de 1 PB em 16,25 horas em
mais de 3658 nodes
2010
2011
2012
2013
2014
AGENDA
História do Hadoop
Principais
players
Arquitetura Hadoop
HADOOP

Yahoo descontinua a sua versão Hadoop e inicia colaboração com o Projeto Apache Hadoop
FUNDAÇÃO
Evento Hadoop Summit com mais de 2.200 participantes
Intel investe $740M na Cloudera
Centenas de empresa da Top Fortune 500 utilizam hadoop
Hadoop com missão crítica:
- Yahoo 32.000 nodes
- Facebook 300 PBs (Hive)
- Twitter 3.500 nodes e 30K jobs/dia
Investimento

Parceria
Aquisição
$740M (14)
$50M (14)
$263M ('11)
$9M (11)
$20M (11)
$30M (13)
$5M (09)
$25M (10)
$44M (11)
$23M (11)
$50M (13)
'14
'11
$160M (14)
'14
'14
'14
'14
'14
$100M (14)
'14
'14
'14
'14
$110M ('14)
'13
'12
'11
'12
'14
'13
'13
$33M ('14)
'14
'15
'15
OPEN DATA
PLATFORM
(ODP)
$15M ('15)
'15
'15
'15
'15
'15
'14
'13
'14
'14
'14
'14
Começa o Projeto Spark na Universidade de Berkeley pelo Matei Zaharia.
Projeto Spark é doado para Apache.
Torna-se um projeto Top Level na Apache.
Equipe da DataBricks realizada a mais rápida odenação de 100 TBs em 23 minutos utilizando 207 EC2 na Amazon.
Equipe do Yahoo realizada a mais rápida odenação de 102 TBs em 72 minutos utilizando 2100 nós em Data Center.
'15
'15
'15
$67B (15)
'15
Full transcript