Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Cubos OLAP

No description
by

Beatriz Lugo

on 14 September 2012

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Cubos OLAP

Codd proponia: Conclusión cubos OLAP Cubos OLAP cubos Place your own picture
behind this frame! Double click to crop it if necessary San Francisco Budapest detalles
importantes (cc) photo by Metro Centric on Flickr (cc) photo by Franco Folini on Flickr (cc) photo by jimmyharris on Flickr Stockholm (cc) photo by Metro Centric on Flickr La propuesta de Codd consistía en realizar una disposición de los datos en vectores para permitir un análisis rápido. Estos vectores son llamados cubos. Disponer los datos en cubos evita una limitación de las bases de datos relacionales, que no son muy adecuadas para el análisis instantáneo de grandes cantidades de datos. ¿Qué son los cubos olap? Cubos Olap ¿Comó se consideran los cubos? Los cubos proveen un mecanismo para buscar datos con rapidez y tiempo de respuesta uniforme independientemente de la cantidad de datos en el cubo o la complejidad del procedimiento de búsqueda. Assets map Detalles doodles notes outlook photo frame OnLine Analytical Processing o Procesamiento Analítico en Línea, término acuñado por Edgar Frank Codd de EF Codd & Associates, encargado por Arbor Software (en la actualidad Hyperion Solutions) Es una base de datos multidimensional, en la cual el almacenamiento físico de los datos se realiza en un vector multidimensional.
Los cubos son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo a factores de negocio seleccionados, proveiendo el mecanismo para la rápida y uniforme tiempo de respuesta de las complejas consultas. Los cubos OLAP se pueden considerar como una ampliación de las dos dimensiones de una hoja de cálculo. Cubo OLAP (también llamado cubo multidimensional o hipercubo).
Se compone de hechos numéricos llamados medidas que se clasifican por dimensiones.
El cubo de metadatos es típicamente creado a partir de un esquema en estrella o copo de nieve, esquema de las tablas en una base de datos relacional. Las medidas se obtienen de los registros de una tabla de hechos y las dimensiones se derivan de la dimensión de los cuadros. La principal característica que potencia a OLAP, es que es lo más rápido a la hora de ejecutar sentencias SQL de tipo SELECT, en contraposición con OLTP que es la mejor opción para operaciones de tipo INSERT, UPDATE Y DELETE olap La razón de usar OLAP para las consultas es la rapidez de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas.
Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para búsquedas (aunque peor desde el punto de vista operativo) es una base de datos multidimensional. ¿Por que usar OLAP? OLTP :Procesamiento de Transacciones En Línea (OnLine Transaction Processing).
Es un tipo de sistemas que facilitan y administran aplicaciones transaccionales, usualmente para entrada de datos y recuperación y procesamiento de transacciones (gestor transaccional).
Los paquetes de software para OLTP se basan en la arquitectura cliente-servidor ya que suelen ser utilizados por empresas con una red informática distribuida. INICIO (cc) image by nuonsolarteam on Flickr Gracias por su atención!!! Por ejemplo, una empresa podría analizar algunos datos financieros por producto, por período, por ciudad, por tipo de ingresos y de gastos, y mediante la comparación de los datos reales con un presupuesto. Estos parámetros en función de los cuales se analizan los datos se conocen como dimensiones. Para acceder a los datos sólo es necesario indexarlos a partir de los valores de las dimensiones o ejes. Cada una de las dimensiones de un cubo OLAP puede resumirse mediante una jerarquía.
Una dimensión puede ser creada para usarse en un cubo individual o en múltiples cubos. Una dimensión creada para un cubo individual, es llamada dimensión privada. Por el contrario si esta puede ser usada por múltiples cubos, se le llama dimensión compartida.

Por ejemplo: si se considera una escala (o dimensión) temporal "Mayo de 2005" se puede incluir en "Segundo Trimestre de 2005", que a su vez se incluye en "Año 2005". De igual manera, otra dimensión de un cubo que refleje una situación geográfica, las ciudades se pueden incluir en regiones, países o regiones mundiales; los productos podrían clasificarse por categorías, y las partidas de gastos podrían agruparse en tipos de gastos. Vincular o enlazar cubos es un mecanismo para superar la dispersión. Ésta se produce cuando no todas las celdas del cubo se rellenan con datos (escasez de datos o valores nulos). El tiempo de procesamiento es tan valioso que se debe adoptar la manera más efectiva de sumar ceros (los valores nulos o no existentes). Dispersión en cubos OLAP Por ejemplo:
Los ingresos pueden estar disponibles para cada cliente y producto, pero los datos de los costos pueden no estar disponibles con esta cantidad de análisis. En lugar de crear un cubo disperso, a veces es mejor crear otro cubo distinto, pero vinculado, en el que un subconjunto de los datos se pueden analizar con gran detalle. Los datos de los cubos pueden ser actualizados de vez en cuando, tal vez por personas diferentes de forma concurrente.
Para solventar este problema a menudo es necesario bloquear partes de un cubo mientras otro usuario está escribiendo, para volver a calcular los totales en el cubo.

Otras implementaciones añaden la posibilidad de mostrar una alerta que indique que los totales calculados previamente ya no son válidos tras los nuevos datos. También hay algunos productos que calculan los totales cuando se les necesita con los últimos datos producidos en el sistema. Acceso y cálculo Un cubo OLAP
es una representación abstracta
de la proyección de una
relación de un RDBMS. Dada una relación de orden N,
se considera la posibilidad de
una proyección que dispone de
los campos X, Y, Z como clave de
la relación y de W como atributo
residual. Categorizando esto como
una función se tiene que: W : (X,Y,Z) W Los atributos X, Y, Z se corresponden con
los ejes del cubo, mientras que el valor
de W devuelto por cada tripleta (X, Y, Z)
se corresponde con el dato o elemento
que se rellena en cada celda del cubo. Debido a que los dispositivos de salida (monitores, impresoras, ...) sólo cuentan con dos dimensiones,
no pueden caracterizar fácilmente cuatro dimensiones, es más práctico proyectar "rebanadas"
o secciones de los datos del cubo La motivación que hay tras OLAP vuelve a mostrar de nuevo el
paradigma de los informes de tablas cruzadas de los sistema
de gestión de base de datos de los 80. Se puede desear una
visualización al estilo de una hoja de cálculo, donde los
valores de X se encuentran en la fila $1, los valores de Y
aparecen en la columna $A, y los valores de W: (X,Y) →
W se encuentran en las celdas individuales a partir de
la celda $B2 y desde ahí, hacia abajo y hacia la derecha. Se ha desarrollado el lenguaje MDX (MultiDimensional eXpressions o expresiones multidimensionales) para poder expresar problemas OLAP de forma fácil. Aunque es posible traducir algunas sus sentencias a SQL tradicional, con frecuencia se requieren expresiones SQL poco claras incluso para las sentencias más simples del MDX. Este lenguaje ha sido acogido por la gran mayoría de los proveedores de OLAP y se ha convertido en norma de hecho para estos sistemas. Lenguaje En Teoria de Base de Datos cubos virtuales Seguridad y agregaciones Se puede juntar cubos, dentro de cubos virtuales, muy parecido al proceso de juntar tablas con vistas en las bases de datos relacionales. Un cubo virtual, provee acceso a los datos en los cubos combinados, si la necesidad de construir un nuevo cubo, mientras permite que se mantenga en mejor diseño en cada cubo individual. Un cubo podrá ser actualizado, procesando solo los datos que han sido añadidos, en vez de hacerlo con el cubo entero, se puede usar la actualización incremental para actualizar un cubo mientras se este usando. cubos OLAP Medidas Las Medidas, son datos numéricos de interés primario para los usuarios del cubo. Se puede crear una medida calculada
y calcular mienbros de dimensiones,
combinando expresiones multidimensionales
( MDX ), fórmulas matemáticas y funciones
definidas por el usuario (UDFs). Algunas medidas comunes son Ventas en unidades, ventas en pesos, costo de ventas, gastos, conteo de la producción, presupuesto, etc. Estas son usadas por el procedimiento de agregación de los servicios de OLAP y almacenadas para su rápida respuesta a las peticiones de los usuarios. Así se le llama al proceso de precalcular sumas de datos, para ayudar a disminuir los tiempos de respuestas, en los procesos de búsquedas de información. Usando las facilidades de seguridad manejadas por Microsoft SQL Server OLAP services, usted puede controlar quien accesa los datos y los tipos de operaciones que los usuarios pueden ejecutar con los datos. OLAP services soporta el sistema de seguridad integrado que ofrece el sistema operativo Windows NT y permite que usted asigne permisos de acceso, a la base de datos y al cubo incluyendo a los cubos virtuales. La seguridad es manejada via los derechos de control de acceso que son manejados por los Roles, estos determinan el tipo de acceso a los datos. Los Roles definen, categorías de usuarios con los mismos controles de acceso.
Modos de Almacenaje Holap Rolap Molap Esta implementación OLAP almacena los datos en una base de datos multidimensional. Para optimizar los tiempos de respuesta, el resumen de la información es usualmente calculado por adelantado. Implementación OLAP que almacena los datos en un motor relacional. Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional. Existe software especializado para crear Cubos OLAP como:
Pentaho
Mondrian
Full transcript