Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

TECNOLOGIAS DATA WAREHOUSE

No description
by

Mario Mamani

on 26 September 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of TECNOLOGIAS DATA WAREHOUSE

Herramientas de tecnologìas de datos
KNIME
KNIME está desarrollado sobre la plataforma Eclipse y programado, esencialmente, en java. Está concebido como una herramienta gráfica y dispone de una serie de nodos (que encapsulan distintos tipos de algoritmos) y flechas (que representan flujos de datos) que se despliegan y combinan de manera gráfica e interactiva..
Escrito en Java, Weka es una conocida suite de software para el aprendizaje que soporta varias tareas de minería de datos típicos, especialmente los datos del proceso previo, el agrupamiento, clasificación, regresión, visualización y selección de características. Sus técnicas se basan en la hipótesis de que los datos están disponibles en un único archivo plano o una relación, donde se etiqueta cada punto de datos por un número fijo de atributos.
WEKA
RapidMiner
RapidMiner es un programa informático para el análisis y minería de datos. Permite el desarrollo de procesos de análisis de datos mediante el encadenamiento de operadores a través de un entorno gráfico. Se usa en investigación educación, capacitación, creación rápida de prototipos y en aplicaciones empresariales.
Herramientas Data Mining
JPivot
JPivot es una biblioteca de etiquetas JSP personalizada.
Los usuarios pueden realizar navegaciones típicas OLAP como drill down, slice and dice. Utiliza Mondrian y XMLA como sus motores OLAP.
Microsoft SQL Server Analysis Services (SSAS)
Proporciona tecnologías de servidor que ayudan a acelerar el procesamiento de consultas e informes.

Implementa OLAP con tecnologías que simplifican y aceleran el proceso de diseño, la creación, el mantenimiento y la consulta de tablas agregadas y, al mismo tiempo, evitan problemas de explosión de datos.
Jaspersoft OLAP
Es un potente motor de análisis de datos dotado de una interfaz de usuario interactiva y unificada, diseñada para usuarios que necesitan analizar grandes volúmenes de datos o realizar consultas complejas.
Herramientas Olap
Mondrian
Mondrian es un sistema de visualización de datos estadísticos de propósito general. Cuenta con técnicas de visualización para los datos pendientes de casi cualquier tipo, y tiene su punto fuerte en comparación con otras herramientas cuando se trabaja con datos categóricos, datos geográficos y datos de gran tamaño.
Los principales productos de Business Intelligence que existen hoy en día son:
Cuadros de Mando Integrales (CMI)
Sistemas de Soporte a la Decisión (DSS)
Sistemas de Información Ejecutiva (EIS)

Oracle Database 11g es una plataforma integral de base de datos para data warehousing e inteligencia de negocios que combina escalabilidad y desempeño líderes del sector, análisis bien integrado y calidad de datos e integridad—todo en una sola plataforma que se ejecuta en una infraestructura grid de bajo costo y confiable
Microsoft SQL Server 2012 Data Warehousing ofrece una plataforma de datos empresariales cierto con la capacidad de procesar los datos, de cualquier tamaño, en cualquier lugar, que ofrece perspectivas inmersivas, y proporciona el tiempo más rápido a la solución con el menor coste de adquisición y propiedad.
IBM InfoSphere Warehouse Departmental Edition es una plataforma de analítica de negocio y almacén de datos diseñado para organizaciones con requisitos de menor escala. Esta edición cuenta con muchas de las características de la edición empresarial completa y se basa en el servidor de datos IBM DB2 líder del sector. InfoSphere Warehouse Departmental Edition resulta ideal para empresas que necesitan consolidar y analizar datos para obtener conocimientos de negocio, al tiempo que reducen los costes totales de propiedad.
Cada plataforma Teradata viene lista para correr para una necesidad distinta, desde informes básicos y análisis para el almacenamiento de datos activa con capacidad de inteligencia empresarial activo total. Así que no importa dónde se encuentra hoy en día, su inversión en Teradata ofrecerá un valor inmediato, junto con la flexibilidad que la protege para el futuro.
HERRAMIENTAS DATA WAREHOUSE
Sybase IQ es un servidor analítico sumamente optimizado, diseñado específicamente para ofrecer resultados más rápidos en soluciones de inteligencia empresarial indispensable, almacén de datos y formulación de informes, capaz de utilizar cualquier hardware y sistema operativo estándar.
El proceso de extracción de patrones a partir de datos se llama minería de datos. Es reconocida como una herramienta esencial de los negocios modernos, ya que es capaz de convertir los datos en inteligencia de negocios dando así una ventaja de información. En la actualidad, es ampliamente utilizado en las prácticas de perfil, como la vigilancia, la comercialización, los descubrimientos científicos, y la detección de fraudes.
Caracteristicas
-Programacion en Java
-Sistema operativo multiplataforma
-Idioma en Inglés
-Version
Características
-Sistema operativo multiplataforma
-Licencia GPL
-Última versión 3.6.6

Ventajas
• Está disponible libremente bajo la licencia pública general de GNU.

• Es muy portable porque está completamente implementado en Java y puede correr en cualquier plataforma.

• Contiene una extensa colección de técnicas para pre procesamiento de datos y modelado.

• Es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario.

Características
-Sistema operativo multiplataforma
-Plataforma Java
-Idioma en español
-Version 1.51

IBM SPSS Modeler
Permite evaluar las tendencias y sus posibles resultados. No requiere conocimientos de programación o de estadística avanzada, y es ampliamente utilizada en las áreas de negocio, retención de clientes, gestión de riesgo, detección de fraude y campaña de fidelización. Esta solución cuenta con un completo conjunto de programas de minería de datos que incluyen potentes funciones de preparación de datos y visualización y modelado predictivo, que le ayudarán a solucionar cualquier reto empresarial más rápidamente y con resultados más precisos.
REPORTER
REPORTER es un software cuyo diseño se basa en tecnología web, desarrollado con la finalidad de que seguir el rastro de sus documentos y costes sea más fácil, además, el sistema le proporcionará la información necesaria para ayudarle a tomar la desición adecuada.
Capacidades tecnicas
• Creación instantánea de gráficos, diagramas o tablas, referidos a tiempo, recursos o cualquier otro parámetro de tu elección.
• Muestra cualquier nivel de detalle requerido.
• Cubre todos los aspectos del proceso de gestión de facturas, desde su recepción a su integración en el sistema contable.
• Indica si el sistema funciona al máximo de su capacidad.
• Ofrece acceso instantáneo a información detallada sobre los equipos o personas trabajando con el sistema.

KXEN Analytic Framework
Es un software centrado en la automatización de los procesos analíticos en beneficio y mejora de las iniciativas de marketing directo y gestión de riesgos. KXEN Analytic Framework es un programa que también tiene en cuanta la ayuda a sus clientes para poder aportar valor a su negocio mediante la consecución de mejoras significativas en sus aplicaciones de captación y retención de clientes y venta cruzada.
Ventajas
• Capacidad única de creación y gestión de conjuntos analíticos de datos.

• Tiempo extremadamente reducido de creación de modelos, de ejecución y despliegue y entrega de resultados.

• Fácil integración en entornos existentes.

• Codificación de datos totalmente automatizada.

• Conjunto completo de funciones de minería de datos.

• Facilidad de uso y facilidad de comprensión de los resultados.

Swag Business Intelligence
La solución de Swag Business Intelligence es un conjunto
de herramientas que permite visualizar y analizar automáticamente grandes cantidades de datos que sería muy costoso procesar de
forma manual. Este programa ayuda a identificar pautas,
tendencias, reglas y normas en el funcionamiento de cualquier
negocio para una mejor toma de decisiones.
Funcionalidad
• Análisis de datos
• Visualización de los datos
• Información cooperativa

Oracle Business Intelligence Suite
Oracle Business Intelligence Suite es una solución integrada
de productos de inteligencia empresarial (BI) con cuadros
de mando, un completo sistema de consultas ad hoc, alertas
e información proactiva, informes financieros y corporativos,
datos predictivos en tiempo real y análisis desconectado
entre otras funciones.
Otras herramientas
-
Presea business intelligence
-Clementine / SPSS
-Microsoft SQL Server 2005 / Microsoft
- dVelox 2.5/ Apara:
-MicroStrategy Data Mining Services /Microstrategy
-SAS Analytics / SAS
-SAS Enterprise Miner / SAS

Es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Se trata, sobre todo, de un expediente completo de una organización, más allá de la información transaccional y operacional, almacenado en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos (especialmente OLAP, procesamiento analítico en línea).
Un Sistema de Soporte a la Decisión (DSS) es una
herramienta de Business Intelligence enfocada al
análisis de los datos de una organización.
Un Sistema de Información para Ejecutivos o Sistema de Información Ejecutiva es una herramienta software, basada en un DSS, que provee a los gerentes de un acceso sencillo a información interna y externa de su compañía, y que es relevante para sus factores clave de éxito.
El Cuadro de Mando Integral (CMI), también conocido como Balanced Scorecard (BSC) o dashboard, es una herramienta de control empresarial que permite establecer y monitorizar los objetivos de una empresa y de sus diferentes áreas o unidades.
Sybase IQ es un modo inteligente de obtener análisis
de alto rendimiento para empresas sin superar su
presupuesto ni dejar de lado las inversiones realizadas
en recursos tecnológicos y de conocimientos.
InfoSphere Warehouse Departmental Edition
• Una plataforma escalable, fiable y de alto rendimiento permite diseñar y hacer crecer su data warehouse para lograr la máxima eficiencia.
• Las características autónomas mejoran el rendimiento, reducen los gastos de mantenimiento y administración y optimizan el almacenamiento de datos para obtener un ahorro añadido.
• Las herramientas analíticas incorporadas le permiten transformar los datos estructurados y no estructurados en información de negocio valiosa para mejorar la toma de decisiones.
• El despliegue simplificado ayuda a reducir los costes. Utilice una imagen virtual de cualquier plataforma basada en Intel o AMD para obtener despliegues rápidos.
Novedades de SQL Server 2012

• Memoria xVelocity índice de almacén de columnas optimizado mejora el rendimiento de las consultas de almacén de datos 10x-100x sobre el rendimiento tradicional consulta rowstore.
• Hasta la compresión de datos de 15x en tablas con un índice de almacén de columnas reduce el almacenamiento de datos y mejora el rendimiento en memoria.
• Soporte para hasta 15K particiones por tabla proporciona un montón de particiones para simplificar la carga de datos y las operaciones de mantenimiento.
• Admite hasta 256 núcleos lógicos permite alto rendimiento para cargas de trabajo mixtas con varias consultas se ejecutan simultáneamente.

• Producto Base: El producto base está diseñado para permitir que cualquier
cliente Oracle cree un data mart o data warehouse con eficiencia, de cualquier tamaño o complejidad. Incluye un repositorio de metadatos de múltiples usuarios y listo para empresas, capacidades para el modelado de
datos y una amplia variedad de técnicas de transformación y extracción, y el desempeño y la escalabilidad de una arquitectura ‘ELT’.

2. Opción Enterprise ETL: Esta opción está específicamente diseñada
para aumentar el desempeño y la productividad, e incluye las siguientes características:
• Opciones avanzadas para la carga de datos
• Productividad del desarrollador mediante componentes reutilizables
• Administración de dimensiones lentamente cambiantes
• Análisis de impacto y linaje completo de datos
• Soporte de administración avanzada de configuración

3. Opción de Calidad de Datos: Como parte totalmente integrada del producto, una ventaja muy distinta de las demás herramientas en el mercado, la opción de calidad de datos ofrece soporte para la proliferación de datos, reglas de datos (esencialmente, reglas de negocio) y características del cumplimiento de la información.
4. Conectores: Los conectores ofrecen acceso optimizado para aplicaciones operacionales líderes. Oracle brinda conectores para Oracle e-Business Suite, Peoplesoft Enterprise, Siebel (CRM) y SAP R/3.
Panorama General
A partir de 1997, Mondrian fue desarrollado con especial atención
a las técnicas de visualización para los datos categóricos y
técnicas de selección mejoradas.
Los pasos para tener JPivot corriendo:
• Primero, descargar algún servidor web como Tomcat e instalar él ".war".
• Segundo, armar el archivo de mapeo para el Mondrian. El paso cero habría
sido tener una base de datos ya armada.
• Tercero, armar los archivos con las consultas MDX y la cadena de conexión (en lugar de utilizar una cadena de conexión, también es posible especificar un "datasource")
Luego JPivot se puede modificar según nuestras necesidades. Es fácil cambiar el aspecto de la interfaz del navegador.

Funciones avanzadas de análisis
• Permite analizar los datos a través de distintos
atributos y periodos de tiempo
• Soporta el lenguaje de consulta MDX
(expresiones multidimensionales), permitiendo
consultas analíticas de alta complejidad
• Agregación de cálculos en el tiempo de ejecución
o en el modelo OLAP relacional

Interfaz de usuario interactivo y unificado
• La interfaz intuitiva ad hoc ofrece funciones de desglose, navegación horizontal, resumen, filtrado, rotación, ordenación y creación de diagramas a partir de motores OLAP y en memoria

• Permite utilizar MS Excel como cliente front-end para el entorno OLAP

• Permite realizar funciones de BI adicionales como el diseño de informes ad hoc y de dashboards
SAS OLAP Server
Es un almacén de datos multidimensional diseñado desde el principio para proporcionar un acceso rápido a datos pre-resumidos generados a partir de grandes cantidades de datos detallados.
Beneficios
Características
• Proporciona un proceso ETL transparente e integrado para la creación
de cubos OLAP consistentes.
• Proporciona datos resumidos rápidos y estables para aplicaciones de inteligencia de negocios.
• Libera al personal de TI de la creación constante de reportes y resúmenes de datos específicos.


• Base de datos multidimensional con capacidad industrial.
• Rápido procesamiento de búsquedas.
• Interfaz gráfica de usuario fácil de usar para la creación y mantenimiento de cubos OLAP.
• Optimización de datos resumidos para ahorrar recursos del sistema.
• Metadatos centralizados.
• Eficaces interfaces para monitoreo de servidores OLAP.

Integrantes:

-Rudy Gonzales Zaa
-Rodrigo Cano Zereceda
-Mario Mamani Cayo

GRACIAS
Full transcript