Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Pentaho - Business Intelligence

Exposición: Open Source Tools BI
by

Edgar David Padierna Bedoya

on 9 November 2012

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Pentaho - Business Intelligence

1. HISTORIA DE PENTAHO

Pentaho nació de la voluntad de lograr un cambio positivo y negativo en el mercado de análisis de negocios, dominado por mega proveedores que ofrecen sistemas de BI costosos y pesados productos basados en plataformas tecnológicas obsoletas.

Cinco veteranos de la industria buscaron una solución a este problema (de ahí la raíz del nombre: “Penta”), Pentaho ha sido pionera en el futuro de la inteligencia empresarial y análisis con un conjunto completo de capacidades para el acceso e integración de datos, descubrimiento, análisis y visualización.

Pentaho es ahora el principal proveedor independiente de análisis de negocio para miles de empresas globales y proveedores de software con un costo hasta un 90% menor que las ofertas de los proveedores tradicionales. La compañía tiene su sede en Orlando, Florida, con oficinas en San Francisco, California y en toda Europa. 2. ¿QUÉ ES PENTAHO?

Es una plataforma de BI “orientada a la solución” y “centrada en procesos”.
Pentaho consiste en una Suite Completa de Inteligencia de negocio que
incluye todos los principales componentes requeridos para implementar
soluciones de BI, tales como:

• Informes
• Dashboards
• Cubos OLAP
• Procesos ETL
• Data integration
• Subscripciones
• Data Mining
• Alertas 3. LENGUAJE DE DESARROLLO Y FUNCIONALIDAD

La plataforma Open Source Pentaho Business Intelligence cubre muy amplias necesidades de Análisis de los Datos y de los Informes empresariales. Las soluciones de Pentaho está escrito en Java y tienen un ambiente de implementación también basado en Java. Eso hace que Pentaho es una solución muy flexible para cubrir una amplia gama de necesidades empresariales – tanto las típicas como las sofisticadas y especificas al negocio.

Los módulos de la plataforma Pentaho BI son: Pentaho Reporting – un módulo de los informes ofrece la solución adecuada a las necesidades de los usuarios. PentahoReporting es una solución basada en el proyecto JFreeReport y permite generar informes ágil y de gran capacidad. PentahoReporting permite la distribución de los resultados del análisis en múltiples formatos – todos los informes incluyen la opción de imprimir o exportar a formato PDF, XLS, HTML y texto. Los reportes Pentaho permiten también programación de tareas y ejecución automática de informes con una determinada periodicidad. Pentaho Análisis – Pentaho Análisis suministra a los usuarios un sistema avanzado de análisis de información. Con uso de las tablas dinámicas (pivottables, crosstabs), generadas por Mondrian y JPivot, el usuario puede navegar por los datos, ajustando la visión de los datos, los filtros de visualización, añadiendo o quitando los campos de agregación. Los datos pueden ser representados en una forma de SVG o Flash, los dashboardswidgets, o también integrados con los sistemas de mineria de datos y los portales web (portlets). Además, con el Microsoft Excel AnalysisServices, se puede analizar los datos dinámicos en Microsoft Excel (usando la conexión a OLAP server Mondrian).

Pentaho Dashboards – Todos los componentes del móduloPentahoReporting y Pentaho Análisis pueden formar parte de un Dashboard. En PentahoDashboards es muy fácil incorporar una gran variedad en tipos de gráficos, tablas y velocímetros (dashboardwidgets) e integrarlos con los Portlets JSP, en donde podrá visualizar informes, gráficos y análisis OLAP.

Pentaho Data Mining – análisis en Pentaho se realiza con una herramienta WeKa. Pentaho Integración de Datos – se realiza con una herramienta Kettle ETL (Pentaho Data Integration) que permite implementar los procesos ETL. Últimamente Pentaho lanzó una nueva versión – PDI 3.0 – que marcó un gran paso adelante en OSBI ETL y que hizo Pentaho Data Integration una alternativa interesante para las herramientas comerciales. 4. COMPONENTES

Características básicas de la aplicación Pentaho:

• Plataforma 100% J2EE, asegurando la escalabilidad, integración y portabilidad.
• Servidor: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS.
• Base de datos: vía JDBC, IBM DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, NCR Teradata, Firebird.
• Sistema operativo: no hay dependencia. Lenguaje interpretado.
• Lenguaje de programación: Java, Javascript, JSP, XSL (XSLT/XPath/XSL-FO).
• Interfaz de desarrollo: Java SWT, Eclipse, Web-based.
• Repositorio de datos basado en XML.
• Todos los componentes están expuestos vía Web Services para facilitar la integración con Arquitecturas Orientadas a Servicios (SOA). 5.INTEGRACIÓN CON OTRAS HERRAMIENTAS

Conexiones a Bases de Datos
Una conexión de base de datos describe el método mediante el cual Pentaho Data Integration (Anteriormente Kettle) se conectará a una base de datos. Se pueden crear conexiones específicas para un Trabajo o Transformación o guardarlas en el catálogo de Pentaho Data Integration (Kettle) para reutilizarlas en múltiples Transformaciones o Trabajos.

Bases de datos compatibles
Se sabe que Pentaho corre sobre las siguientes bases de datos:
•Apache Derby , Firebird, •hsqldb, •IBM DB2, •Microsoft Access, •Microsoft SQL Server, •MySQL, •Oracle, •PostgreSQL, •Sybase

Además de los siguientes orígenes de datos:
•Archivos de texto, •Archivos XML, •Archivos XLS, •Foxpro, •Archivos de Access 6. VENTAJAS Y DESVENTAJAS DE PENTAHO

6.1 VENTAJAS
 Entorno gráfico de desarrollo
 Uso de tecnologías estándar: Java, XML, JavaScript
 Fácil de instalar y configurar
 Multiplataforma: windows, macintosh, linux
 Basado en dos tipos de objetos: Transformaciones (colección de pasos en un proceso ETL) y trabajos (colección de transformaciones)
 Incluye cuatro herramientas:
 Spoon: para diseñar transformaciones ETTL usando el entorno gráfico
 PAN: para ejecutar transformaciones diseñadas con spoon
 CHEF: para crear trabajos
 Kitchen: para ejecutar trabajos
 Descubrir patrones ocultos y correlaciónales en los datos
 Prevenir eventos futuros basados en patrones históricos
 Contar con la tecnología de:
 Poderoso motor de Data Mining
 Herramientas de Diseño Grafico
 Seguridad y conformidad
 Servicios Web, Repositorios y definiciones basadas en XML
 Rendimiento y escalabilidad
6.2 DESVENTAJAS

• Falta de documentación fiable:Pentaho pone a disposición un manual de usuario de la herramienta en el cual se olvidan de importantes conceptos que dificultan el desarrollo y despliegue de una solución BI. La comunidad de Pentaho, al ser tan amplia y trabajar de forma colaborativa acaba creando una documentación hecha por usuarios anónimos que explican y detallan posibles soluciones a problemas, tutoriales, explicaciones, etcs. Esto acaba perjudicando muchas veces a la documentación disponible para los usuarios. Es muy frecuente encontrar en la documentación enlaces a páginas externas con tutoriales o documentación adicional totalmente errónea u obsoleta, perjudicando al usuario nuevo que no tiene experiencia y que acaba perdiendo mucho tiempo buscando conceptos básicos.
• Herramientas derivadas:Las herramientas que forman la suite BI de Pentaho han sido creadas por separado. Además, las propias herramientas surgen de otros proyectos anteriores, como por ejemplo la herramienta PentahoReportDesign que surgió de JfreeReport. Al final, esto acaba perjudicando a la estandarización de conceptos ya que no se trabaja de la misma forma en las herramientas. Es decir, los desarrolladores se ven con la obligación de usar diferentes metodologías para poder hacer las mismas acciones pero en diferentes herramientas, perjudicando el aprendizaje y desarrollo de posibles soluciones. 7. TRANSFORMACIONES “ETL” SOPORTADAS

Pentaho Data Integration (previously Kettle) es una de las soluciones ETL más extendidas y mejor valoradas del mercado. Cuenta con una larga historia y una solidez y robustez que le hace una herramienta altamente recomendable. Permite realizar transformaciones y trabajos de una forma muy sencilla e intuitiva. Igualmente los proyectos realizados con Data Integration son muy fáciles de mantener.

Versión actual: 3.2.0-stable

Pros:
•Gran facilidad de uso.
•Gran facilidad de mantenimiento.
•Gran flexibilidad a la hora de realizar nuestras transformaciones.

Contras:
•Es una solución completa java por lo que:
•El aspecto visual no es su mejor virtud
•El rendimiento, a pesar de ser muy bueno, siempre perderá si lo comparamos contra scripts SQL. Tipos de transformaciones:
 Input
 Output
 Transform
 Utility
 Flow
 Scripting
 Lookup
 Joins
 Data Warehouse
 Validation
 Statistics
 Job
 Mapping
 Experimental
 Deprecated
 Bulk loading 8. DASHBOARDS EN PENTAHO

Los cuadros de mando, comúnmente llamado BSC, Balanced Score Card en las compañías son una serie de informes de nivel gerencial con los que los directivos toman decisiones, se caracterizan por se simples, amenos y muy específicos.

La construcción se estos cuadros de mando o DashBoards se hace a base de KPI’s (Sigla: Key Performace Indicators // Indicadores Claves de Desarrollo), los cuales son definidos en cada compañía, según su actividad y sector económico.

¿Cómo hacer Cuadros de Mando con Dashboard Editor de Pentaho?
Una de las mejores cosas que tiene trabajar con soluciones Open Source es que continuamente la comunidad va aportando mejoras. Tras muchas consideraciones teóricas por fin vamos a hacer nuestro primer cuadro de mandos con Pentaho y CDE. Comunity Dashboard Editor es un editor de cuadros de mando desarrollado por la comunidad de Pentaho. 1. Primer paso: Saber qué es lo que quiero
Seguramente nuestro Cuadro de mandos dará muchas vueltas y tendrá muchas modificaciones a lo largo de su vida útil, pero necesitamos un punto de partida y ese punto de partida suele ser 2 cosas:

•Listado de los KPI a incluir
•Boceto de visualización

Ejemplos de KPI:
Estado de las cuentas: Presupuesto Vs Gastos

•Estado del presupuesto (Por departamento, Por cargos)
oQuien se desvía más del presupuesto ( Por arriba “Se pasa”, Por abajo “Gasta menos de lo presupuestado... a estos hay que felicitarlos”)

Y finalmente, decidir que interacción le vamos a dar a nuestro cuadro de mandos... en este primer cuadro de mandos vamos a hacerlo simple y tan sólo vamos a permitir ver las diferentes posiciones en cada departamento. 2. Paso:
Implementemos nuestro diseño

CDE está diseñado en 3 capas: Presentación, Componentes y Datos.

Presentación
Empecemos diseñando la presentación, cómo se va a ver nuestro cuadro de mandos.
Tenemos 2 opciones:
*** Aplicar una plantilla

3. Paso:
Definir nosotros el contenido

Líneas = Rows
Cajas = Columns EJEMPLOS DE DASHBOARDS
CONSTRUIDOS EN PENTAHO PENTAHO
OPEN SOURCE BUSINESS INTELLIGENCE

ALUMNOS:
VIVIANA CANO
EDGAR PADIERNA
CARLOS ZAPATA
DARWIN VALENCIA

DOCENTE:
ANGELA RESTREPO

INTELIGENCIA DE NEGOCIOS - ITM 2012 6.1 VENTAJAS
.......
• Facilidad de uso.
• Arquitectura flexible y de calidad.
• Madurez de la tecnología.
• Integración rápida con la infraestructura existente.
• Bajo costo.
• Alto desempeño, estabilidad y escalabilidad.
• Facilita el camino para conseguir una completa solución de IN.
• Características OpenSource: libertad, comunidad.
• Pentahoes un software libre bajo varias licencias.
• Últimas tecnologías: Pentaho ha sido creado bajo las plataformas libres de Java y MySQL. Ambas plataformas están en auge y cada vez más gente hace uso de ellas. Son fáciles de usar, compilar y programar, lo que posibilita un fácil desarrollo e integración en otros sistemas ya creados o a desarrollar.
• Comunidad:La comunidad de Pentaho es muy amplia. Todo software antes de ser liberado oficialmente, cuando aún está en la fase beta, pasa por una serie de pruebas realizadas por la comunidad de Pentaho de forma altruista. Usuarios de la aplicación que reportan fallos y ponen aprueba todo tipo de opciones disponibles del software.
• Software por piezas: Pentaho no es una sola aplicación, sino es una recopilación de programas específicos según las funciones ofertadas.
• Todos los programas desarrollados por Pentaho son creados y diseñados con independencia del resto y en esquema modular. Con ello se logra descargar, instalar o hacer uso de algunas de las aplicaciones con independencia del resto.
Full transcript