Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

NoSQL

Diapositivas
by

Alfredo Zavala

on 12 June 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of NoSQL

UNIVERSIDAD NACIONAL DE SAN ANTONIO ABAD DEL CUSCO CAPITULO I Aspectos Generales Identificación del Problema Sistemas de Almacenamiento Distribuido NoSQL orientado a Columnas CAPITULO IV Implementación del
Caso de Estudios Descripción del problema Intercambio 1WWW=3min x8 horas Perdida de Tiempo Paginas Web Visitadas
Registro de Web Visitadas
Consultas a la BD
Redundancia Metodología de Desarrollo de Software Gestión del Proyecto Planificación del Proyecto IMPLEMENTACIÓN Diseño de base de datos relacional FACULTAD DE CIENCIAS QUÍMICAS, FÍSICAS Y MATEMÁTICAS Carrera Profesional de Ingeniería Informática y de Sistemas IMPLEMENTACIÓN PRESENTADO POR: Br. HANS HARLEY CCACYAHUILLCA BEJAR Br. ALFREDO ZAVALA SULCA Diagrama de datos en Apache Cassandra IMPLEMENTACIÓN Prototipo del sistema Plu-Link IMPLEMENTACIÓN Especificación de la Arquitectura del Sistema Servicio Malo Limite de
Escalabilidad Modelo de
datos
Rígido Desarrollo
Lento Mayores
Recursos EGRESOS Las bases de datos Tradicionales
no gestionan eficientemente
grandes cantidades de datos Objetivos Específicos Estudiar y analizar la tecnología NoSQL.
Diseñar e Implementar un sistema de información utilizando la tecnología NoSQL Orientado a Columnas.
Realizar pruebas de rendimiento a un sistema de almacenamiento distribuido NoSQL Orientado a Columnas. Objetivos Objetivo General Investigar y analizar la tecnología de sistema almacenamiento distribuido NoSQL orientado a columnas para procesar grandes volúmenes de datos Objetivos CAPITULO II Marco Teórico Bases de datos Relacionales CAPITULO III Sistema de Almacenamiento
Distribuido NoSQL Conceptos Generales Lista de Usuarios Bases de datos Distribuidas Cluster de Computadoras Posicionamiento Web IMPLEMENTACIÓN Prototipos de la Interface de Gestión Registrar Campaña Lista de Campañas Asignar Campañas Registrar Equipo de Trabajo Lista de Equipos Registrar
Usuario Contactos por Fecha Estadística General de la Empresa Estadísticas por Usuario ¿NoSQL? Not Only SQL Navegador Web Carlo Strozzi (1998) Sistemas de Almacenamiento SQL Tablas Joins ¿Que es BIG DATA? VOLUMEN VELOCIDAD VARIEDAD Grandes cantidades de Información necesita ser analizada rápidamente Diferentes tipos de datos estructurados y no estructurados 2009
0.8 ZB* IMPLEMENTACIÓN Esquema General del Sistema Interface de Usuario Plugin-Linkbuilding Cluster Cassandra IMPLEMENTACIÓN DEMOSTRACIÓN DEL CASO DE ESTUDIO CAPITULO V Evaluación y Pruebas de Rendimiento CONCLUSIONES
Y
RECOMENDACIONES Pruebas de rendimiento con Apache Cassandra con 3, 6, 9, 12, 15, 18 nodos Pruebas de Rendimiento con JMeter MySQL Apache Cassandra Login
1000 Pruebas de Rendimiento con JMeter MySQL Login
5000 Apache Cassandra Pruebas de Rendimiento con JMeter MySQL Apache Cassandra Login
10000 *Zettabyte = 1 Trillon gigabytes Universo Digital según IDC 2020
35 ZB* Dispositivos de
Almacenamiento Software como
Servicio Teorema CAP Availability Partition Consistency AP CP AC SOLO
2 Eric Brewer (International Data Corporation) Escalabilidad Vertical Horizontal Ventajas Alto
Rendimiento Fácil
Escalabilidad Buen
Servicio Big Data Recursos
Baratos INGRESOS Tipos de Almacenamiento NoSQL Llave Valor Clave - Valor Documentales Grafos Familia de Columnas Pruebas de Rendimiento con JMeter Registrar URL
1000 MySQL Apache Cassandra Pruebas de Rendimiento con JMeter MySQL Apache Cassandra Registrar URL
5000 Pruebas de rendimiento con JMeter MySQL Apache Cassandra Registrar URL
10000 Pruebas de Rendimiento para Apache Cassandra con YCSB Actualización de un gran volumen de trabajo Lectura de gran parte de la carga de trabajo Solo lectura Lectura de las últimas cargas de trabajo rangos cortos Leer modificar escribir Pruebas de Rendimiento para Apache Cassandra con YCSB CPU: 6% RAM: 50% Uso de Recursos del Nodo Coordinador Pruebas de Rendimiento para Apache Cassandra con YCSB Uso de recursos en un nodo común CPU: mínimo RAM: 50% CONCLUSIONES 1.Los sistemas de almacenamiento distribuido NoSQL son una buena solución para el procesamiento de grandes volúmenes de datos, sin embargo estas no sustituyen a las demás formas de almacenamiento; por el contrario las complementan y pueden trabajar en conjunto.

2.Los sistemas de almacenamiento distribuido NoSQL tienen muchas características importantes como la escalabilidad horizontal, flexibilidad en su modelo de datos, alta disponibilidad en el servicio, tolerancia a fallos. Las base de datos NoSQL no reemplazan a las RDBMS pero es evidente que la senda de los servicios de datos cada vez se orienta mas a una arquitectura de cluster.

3.Se construyó un complemento para el navegador Mozilla Firefox que interactua con el navegador web y que fue implementado con XUL, Java y almacena la información en un sistema de almacenamiento distribuido NoSQL orientado a columnas, también un subsistema de administración de usuarios y estadísticas, con lo que se demuestra la pluralidad de lenguajes de programación que podemos usar en conjunto con este sistema de almacenamiento.

4.De las pruebas de rendimiento realizadas con Apache Cassandra se puede observar el buen desempeño con grandes cantidades de datos aprovechando las ventajas de un cluster de computadoras.

5.Los sistemas de almacenamiento distribuido NoSQL específicamente son una alternativa para seguir la informática verde; relacionada con el Hardware, ya que podemos reutilizar los servidores antiguos como un nodo más del cluster de almacenamiento y aprovechar sus recursos. RECOMENDACIONES 1.Implementar un sistema gestor de sistemas de almacenamiento distribuido genérico para administrar las diferentes bases de datos NoSQL.

2.Plantear una metodología parar el diseño y construcción de sistemas de almacenamiento distribuido NoSQL orientado a columnas.

3.Investigar el desarrollo de aplicaciones móviles utilizando las distintas bases de datos NoSQL.

4.Investigar el uso de bases de datos NoSQL en el procesamiento de transacciones en línea.

5.Investigar el uso de bases de datos NoSQL para Data Warehouse y Data Mining.

6.Implementar una plataforma de servicio que pueda brindar hosting y administración para Cassandra.

7.Determinar los sectores de aplicación de las bases de datos NoSQL dentro de la región del Cusco, para encontrar nuevos modelos de negocio.

8.Investigar la implementación de bases de datos hibridas utilizando bases de datos NoSQL y bases de datos relacionales. Comparación utilizando YCSB entre Apache Cassandra MySQL

duración=318.772 s, desempeño=3.137 ope/s

duración=150.467 s, desempeño=6.645 ope/s

duración=87.291 s, desempeño=11.455 ope/s

duración=103.071 s, desempeño=9.702 ope/s

duración=697.641 s, desempaño=1.433 ope/s

duración=369.120 s, desempeño=2.709 ope/s Apache Cassandra

duración=0.606 s, desempeño=1650.165 ope/s

duración=12.359 s, desempeño=80.912 ope/s

duración=17.474 s, desempeño=57.228 ope/s

duración=4.987 s, desempeño=200.521 ope/s

duración=25.860 s, desempeño=38.670 ope/s

duración=4.537 s, desempeño=220.410 ope/s Para 1000 operaciones Conclusiones de las pruebas de rendimiento MySQL Apache Cassandra N° de Operaciones N° de Nodos Situaciones - Operaciones
+ Tiempo BD1, BD2, BD3 + Tiempo
+ Dinero 100000 op. - Tiempo
- Dinero Llave C1 C2 C3 Apache Cassandra facebook Modelo de Datos Estándar 50/50 95/5 100%L 96/4 95Esc/5 50E/50LAE
100L Historial de visitas GRACIAS
Full transcript