Arquitectura y Gobierno
de Big Data
Presentan:
Ramírez Velázque Mariela
Reyes Estrada María Fernanda
La Arquitectura de Big Data
Se compone de dos categorías:
- Arquitectura de Big Data
- Gobierno de Big Data
Arquitectura de Big Data, según Sunil Soares
Metadatos
Es la información que describe las características de cualquier dato y sus relaciones con otros datos críticos que la gente gestiona.
Tales como su nombre, posición, importancia del cliente, calidad o valor para la empresa.
Analítica de Big Data
Herramientas de analítica deben contemplar:
Seguridad y Privacidad de Big Data
Ánalisis de grandes de grandes volúmenes de datos en organizaciones
Luis Joyanes Aguilara, 2013
Protege y bloquea el acceso no autorizado a los datos sensibles.
Herramientas que IBM ofrece:
- Enmascaramiento de datos sensibles con información real y precisa
- Monitorización de actividades de bases de datos se realiza en datos sensibles o usuarios determinados
Responden a las preguntas clave:
De cada transacción.
Administración de los datos Maestros
Cloud Computing
- Se refieren a los datos de una empresa con un valor estratégico en la organización, pueden ser datos de clientes, productos, pacientes, partes, cuentas, proveedores, posiciones y sitios web, activos…..
- Ayudan al análisis de sentimientos de los clientes y de los grupos de interés de la empresa (stakeholders).
Fuentes de Big Data
- Amazon Web Services proveedor líder en Cloud Computing, ofrece un marco de trabajo Hadoop integrado en su servicio Amazon Elastic MapReduce.
- Google Cloud Plataform permite construir aplicaciones y almacenar grandes volúmenes de datos.
- GreenPlum facilita la integración de big data y cloud.
Gracias!!!
Se producen de numerosas fuentes de datos.
- Datos tradicionales de empresas
- Datos generados por máquinas (M2M) y de internet de las cosas
- Datos sociales
- Datos de biometría y genética
- Datos personales
Plataformas de Analítica de Big Data
Ciclo de vida de los Big Data
La gestión de ciclo de vida es un proceso y metodología para administrar la información.
- Comienza desde su creación hasta su disposición para el usuario
- Debe incluir normas legales regulatorias y de privacidad
- Controla el crecimiento y el coste de los datos
Almacenamiento de datos
- Data warehouse (almacenes de datos de las empresas)
- Data Marts (almacenes de datos especiales)
Organizaciones:
Gobierno de los Big Data
Bases de Datos
7 Disciplinas básicas de Big Data:
Se clasifican en diferentes categorías
El Gobierno de TI
“Sistema a través del cual se dirige y controla la utilización de las TI actuales y futuras”.
Principios según ISO 38.500 son:
- Responsabilidad
- Estrategia
- Adquisición
- Rendimiento
- Conformidad
- Factor Humano
Modelos de Bases de Datos en la nube
Principales tareas de gobernar las TIC
- Evaluar
- Dirigir
- Monitorizar
Es una biblioteca que soporta el procesamiento distribuido de grandes conjuntos de datos a través de miles de computadoras.
- Open Source
- Plataforma en Apache
Componentes en el gobierno de Big Data
- Calidad de Big Data
- Administración de datos maestros
- Ciclo de vida de Big Data
- Seguridad y privacidad
- Metadatos de Big Data
Calidad de Los Big Data
Es una disciplina que incluye los métodos para medir y mejorar la calidad e integración de los datos de una organización.
La calidad de los datos utiliza servicios como:
Integración de Big Data
Soares divide en la siguientes categorías:
- Movimiento de Datos: Extrae datos de una o mas fuentes de datos
- Recopilación de Datos: Copia bases de datos de un entorno a otro
- Virtualización de Datos: Enlazar datos de dos o mas posiciones separadas.