Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

BIG DATA

No description
by

Noelia Jiménez Barjas

on 9 June 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of BIG DATA

PRINCIPALES UTILIDADES DEL BIG DATA
Big Data
Ventajas del Big Data
Inconvenientes del Big Data
BIG DATA
FIN
En conclusión....
Trata con grandes volúmenes de información, analizando tanto datos estructurados como no estructurados.
Es una tecnología en vía de evolución, comercialmente está disponible desde hace 6 años y por ello es muy difícil estimar su recorrido en el futuro próximo.
- Alto coste
- Problemas de privacidad
- Falta de expertos
-Problemas de relevancia
- Mejora la gestión empresarial
- Recurso de información
- Mejora la eficiencia y costes
- Facilita a las empresas evaluar sus
productos
-Mejora la accesibilidad y fluidez de
la información
- Análisis del cliente
Utilidad en el ámbito empresarial
- Redes sociales
- Consumo
- Marketing
Utilidad en los
deportes
- Fundamental para entrenamientos
y toma de decisiones en entrenadores

- Gran cantidad de datos que
permiten a marcas personalizar
sus productos
Utilidad en investigación
-Salud y medicina

-Seguridad

-Gobierno

-Educación
En definitiva, permite:

-Explotación de datos
-Visión sobre el cliente
-Almacén de datos
Debido al avance de la tecnología se han
utilizado enormes cantidades de datos. De tal manera que, el concepto de Big Data aplica para toda aquella información que no puede ser procesada o analizada utilizando herramientas tradicionales.
Big Data no se refiere a alguna cantidad en específico, ya que es usualmente utilizado cuando se habla en términos de petabytes y exabytes
de datos. Entonces ¿Cuánto es demasiada información de manera que sea elegible
para ser procesada y analizada utilizando
Big Data?
¿Qué es el Big Data?
¿Cuándo surgió?
¿Para qué sirve el Big Data?
¿ Cómo funciona?
INTRODUCCIÓN

Gigabyte = 109 = 1,000,000,000
Terabyte = 1012 = 1,000,000,000,000
Petabyte = 1015 = 1,000,000,000,000,000
Exabyte = 1018 = 1,000,000,000,000,000,000

INTRODUCCIÓN

Hoy, se generan, según la Unión Europea, 1.700 nuevos billones de bytes por minuto. Equivale:
• A unos 360.000 DVD, lo que de media vienen a ser seis megabytes por persona.
• Más de un billón de consultas en Google,
• Más de 250 millones de tuits en Twitter,
• 800 millones de actualizaciones en Facebook,
• 60 horas de vídeos subidos por minuto en YouTube,
• 10.000 transacciones mediante tarjeta de crédito por segundo…

Denominamos Big Data a la gestión y análisis de
enormes volúmenes de datos que no pueden ser
tratados de manera convencional, ya que superan los límites y capacidades de las herramientas de software habitualmente utilizadas para la captura, gestión y procesamiento de datos.




Big Data parte en la década de 1930, trata la explosión de la información y la forma en la que el Big Data ha creado la necesidad de organizar y guardar la información.
• El objetivo de Big Data, al igual que los sistemas analíticos convencionales, es convertir los datos en información que facilita la toma de decisiones, incluso en tiempo real.

• Big Data es la posibilidad de explotar comercialmente una gran cantidad de datos para crear nuevos servicios comerciales

¿De donde vienen esos datos?

Son principalmente fruto de la revolución digital en curso:
• Finanzas y economía: Balances, cotizaciones, precios, hipotecas, datos de consumo, ...
• Mundo máquina (M2M): Sensores conectados a la red que transmiten datos industriales (coches, contadores, ...)
• Datos socio-ambientales: clima, astronomía, historiales médicos, natalidad, estadísticas gubernamentales, ...
• Redes sociales y movilidad: fotos, datos de geolocalización, ...


• Variedad: cuanto más amplias sean las fuentes de información, más factible se presenta la posibilidad de expandir el mercado hacia nuevos usuarios y localizar nuevos segmentos de público potencial.

• Volumen: la gran dimensión de información generada requiere una correcta orientación de las estrategias para filtrar la información necesaria y proporcionar así, también, un ahorro de tiempo.

• Velocidad: la capacidad de Big Data de proporcionar información en tiempo real alberga uno del os grandes beneficios de usar esta tecnología. La mayoría de los datos no son útiles para conservarlos almacenados y utilizarlos a largo plazo. La misión de los profesionales de marketing es desarrollar la capacidad de trabajar al momento y ser competentes para reconducir las estrategias en función del comportamiento de los clientes.

TECNOLOGÍA DEL BIG DATA
TIPOS DE BIG DATA
-
Datos estructurados
: Datos que tienen bien definidos su longitud y su formato, como las fechas, los números o las cadenas de caracteres.

-
Datos no estructurados
: Datos en el formato tal y como fueron recolectados, carecen de un formato específico.

-
Datos semiestructurados
: Datos que no se limitan a campos determinados, pero que contiene marcadores para separar los diferentes elementos. Es una información poco regular como para ser gestionada de una forma estándar.
CAPTURA
Se puede catalogar la procedencia de los datos según las siguientes categorías:

-Transacciones de datos.

-Transacciones de datos.

-E-marketing y web.

-Machine to Machine (M2M).

-Biométrica.
Almacenamiento Not Only SQL (NoSQL)
Existen varias 4 formas de NoSQL, que atacan los problemas del escalamiento, performance y modelado de los datos de formas distintas:

1.Almacenamiento Clave-Valor (Key-Value)
:Los datos se almacenan de forma similar a los maps o diccionarios de datos, donde se accede al dato a partir de una clave única. Cassandra es la tecnología de almacenamiento clave-valor más reconocida por los usuarios

2.Almacenamiento Documental
: Las bases de datos documentales guardan un gran parecido con las bases de datos Clave-Valor, diferenciándose en el dato que guardan. Con respecto a este almacenamiento habría que hacer especial mención a MapReduce y Hadoop como principales herramientas.


3.Almacenamiento en Grafo
: Las bases de datos en grafo rompen con la idea de tablas y se basan en la teoría de grafos, donde se establece que la información son los nodos y las relaciones entre la información son las aristas, algo similar en el modelo relacional.


4.Almacenamiento Orientado a Columnas
:Se orienta a almacenar datos con tendencia a escalar horizontalmente, por lo que permite guardar diferentes atributos y objetos bajo una misma Clave.
Hadoop
Es un framework (marco de trabajo) de software que
soporta aplicaciones distribuidas bajo una licencia
libre. Permite a las aplicaciones trabajar con miles de
nodos y petabytes de datos. Los dos conceptos en los que
se apoya Hadoop, es por un lado en la técnica de
MapReduce y por otro lado en el sistema distribuido de
archivos HDFS.


¿Por qué es bueno Hadoop?

La ventaja de Hadoop es que es capaz de almacenar toda clase de datos: estructurados, no estructurados, semiestructurados; archivos de registro, imágenes, video, audio, comunicación, etc. Por otra parte
Hadoop también destaca por tener una
arquitectura con capacidad de asegurar una alta disponibilidad y recuperación de los datos que
ingesta.
-MapReduce


-HDFS
Análisis de datos
Hay diferentes técnicas de análisis de datos como las siguientes:
-Asociación: Permite encontrar relaciones entre diferentes variables. Bajo la premisa de causalidad, se pretende encontrar una predicción en el comportamiento de otras variables.

-Minería de datos : Tiene como objetivo encontrar comportamientos predictivos. Engloba el conjunto de técnicas que combina métodos estadísticos y de machine learning con almacenamiento en bases de datos.

-Agrupación (Clustering): El análisis de cúlsteres es un tipo de minería de datos que divide grandes grupos de individuos en grupos más pequeños de los cuales no conocíamos su parecido antes del análisis.



-Análisis de texto (Text Analytics):Gran parte de los datos generados por las personas son textos, como e-mails, búsquedas web o contenidos. Ésta metodología permite extraer información de estos datos y así modelar temas y asuntos o predecir palabras.
Visualización de datos
Nuestra mente agradecerá mucho más la visualización amigable de unos resultados estadísticos en gráficos o mapas que no en tablas con números y conclusiones.

Tenemos las infografías como ejemplo de esto, que se han vuelto un fenómeno viral, donde se recogen los resultados de los diferentes análisis sobre nuestros datos, y son un material atractivo, entretenido y simplificado para audiencias masivas.
ÍNDICE
1. Introducción
2. Qué es el Big Data y cuándo surgió
3. Para qué sirve
4. Cómo funciona
5. Tecnologías del Big Data
6. Utilidades
7. Ventajas e inconvenientes
8. Conclusión
Full transcript