Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

PhD Pre-Defense

No description
by

Alejandro Vera-Baquero

on 18 September 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of PhD Pre-Defense

Muchas Gracias por Vuestra Atención
Agenda
Introducción
La mejora continua de los procesos de negocio puede influir notablemente en la productividad de las organizaciones, sobre todo en aquellas que dependen de otras corporaciones, y en donde la colaboración entre ellas es fundamental para optimizar procesos interdependientes, complejos y altamente distribuidos.
Publicaciones
Universidad Carlos III de Madrid
Director:
Ricardo Colomo-Palacios

PhD Pre-Defense
A Cloud-Based Infrastructure and Implementation Methodology to Support Advanced Business Process Intelligence
Alejandro Vera-Baquero
Introducción
Introducción
Introducción
Introducción
Tecnología para el análisis de los procesos de negocio
Estado del Arte
Contribución
Evaluación y Verificación
Conclusiones y Líneas Futuras
Hemos presentado una solución tecnológica junto a una metodología de implantación que permite a las corporaciones llevar a cabo un programa integral de mejora continua de procesos cumpliendo los objetivos de investigación.
Conclusiones y Líneas Futuras
Existen muchas vertientes y posibilidades en las que extender el trabajo.
Conclusiones y Líneas Futuras
Integración con herramientas y soluciones complementarias de process mining.
Descubrimiento automático del modelo de procesos a partir de los eventos de logs.
Inclusión de técnicas de análisis predictivo.
Reconocimiento de patrones en rutas conflictivas que se repiten con frecuencia.
Aplicar técnicas de optimización.
Integración con motores de simulación.
Recrear la ejecución de procesos en modo de simulación para diagnosis y análisis de causa raíz.
Aumentar el repositorio de eventos con casos hipotéticos para realizar análisis "what-if".
Análisis colaborativo para facilitar la cooperación y optimización de procesos entre organizaciones dependientes.
Planteamiento de la Hipótesis
Metodología de Investigación
Planteamiento de la Hipótesis
Estado del Arte
Estado del Arte
Introducción
Planteamiento de la Hipótesis
Estado del arte
Contribución
Evaluación y Verificación
Conclusiones y Lineas Futuras
Declaración de Tesis
Datawarehouse Department
Management Department
Sales Department
Inter-departmental processes
Cross-organizational process
Subprocess
Activity
Subactivity
Task
Subtask
Root-cause analysis
Diagnosis
Re-engineering
Rendimiento de los procesos de negocio
Recursos Infrautilizados
Cuellos de Botella
Si los ciclos de ejecución son elevados, estos pueden causar efectos devastadores en el rendimiento del proceso global.
Asignacion de Recursos
Re-Ingeniería de Procesos
Planteamiento del Problema
Las actividades que presentan tasas de errores elevadas perjudican considerablemente la calidad del proceso global.
Análisis Causa-Raiz
Re-Ingeniería de Procesos
Planteamiento del Problema
Objetivo y Relevancia del Estudio
Objetivo
:

Lograr que los usuarios de negocio puedan analizar y mejorar el desempeño de los procesos para ayudar a las organizaciones a incrementar su productividad y ganar competitividad.
Mejora continua de los procesos de negocio (BPI)
¿Qué problemas comunes presentan las organizaciones en cuanto a sus procesos?
Los modelos de procesos normalmente están diseñados de manera inadecuada.
Son ejecutados de forma deficiente.
Tienden a tener tiempos de respuesta elevados.
Mal reparto de recursos.
Bajos niveles de servicio.
Altos costes.
Perdidas de beneficio.

¿Por qué es necesario un programa de mejora continua de los procesos?
¿Qué implica la optimización de los procesos de negocio?
Detectar a tiempo situaciones de disconformidad.
Eliminar, o reducir, inconsistencias y reaccionar con rapidez, sobre todo en aquellas rutas que son críticas para el buen desempeño del negocio.
Analizar la causa raíz que esta causando la disconformidad.
Lograr una buena asignación de recursos para evitar cuellos de botella o retrasos.
Reaccionar con rapidez ante las disconformidades.
(van der Aalst, Nakatumba, Rozinat, & Russell, 2010)
Ayudar a las corporaciones a seguir siendo viables frente a la intensa competencia global.
Mejorar la gestión interna de una empresa para hacerla mas competitiva.
Reaccionar con rapidez en respuesta a los competidores.
Incrementar las oportunidades de éxito.
Mejorar la eficiencia y a la colaboración entre organizaciones dependientes.

Proceso Colaborativo
Planteamiento del Problema
Propósito
Poner tecnología en manos de los usuarios de negocio para que éstos puedan llevar a cabo un programa integral de análisis y mejora de sus procesos.
Objetivos del Estudio
Alinear sistemas de Business Intelligence con sistemas orientados a procesos
Business Process Intelligence
Business Intelligence
Business Process Management
Sistemas BI actuales deben ser rediseñados para poder llevar a cabo actividades BPA (Business Process Analytics), e incluso la implantación de estos sistemas tienden a ser de un dominio de negocio especifico.
Los procesos y sus eventos están intrínsecamente relacionados, pero necesitan ser correlacionados entre sí para que la ejecución de sus procesos puedan ser analizados. Sin embargo, esto es complicado de conseguir, especialmente en entornos distribuidos, en donde los procesos son ejecutados sobre plataformas heterogéneas.
La continua ejecución de los procesos de negocio produce un gran cantidad de datos de eventos que no pueden ser procesados de forma eficiente por medio de sistemas tradicionales, los cuales no son adecuados para procesar volúmenes elevados de datos.
Resumen
Las plataformas Business Intelligence (BI) y los sistemas orientados a procesos (BPM) no están alineados.
Wil van der Aalst (2011)
"
Sólo unas pocas herramientas BI ofrecen capacidades de data mining lo suficientemente maduras, y éstas no están orientadas a procesos: se centran exclusivamente en la toma de decisión basados en datos locales, y no en procesos de extremo a extremo.
"
Esta tarea no es sencilla
Si
existe una solución tecnológica que permita a la corporaciones analizar el rendimiento de sus procesos de negocio en cualquier dominio, con un tiempo de respuesta adecuado e independientemente de la tecnología subyacente de los sistemas operacionales,
entonces
dicha tecnología podría ser adoptada por la industria para asistir a las corporaciones en la gestión y optimización de su rendimiento empresarial con un programa integral de mejora de procesos.
La mayor perdida de valor ocurre por la latencia generada desde que hay conocimiento de un evento hasta que los datos analíticos están disponibles
La infraestructura tecnológica es crítica para minimizar la perdida de valor de negocio.
Metodología para la mejora continua de los procesos de negocio
Lean Six Sigma
Total Quality Management (TQM)
Otras Iniciativas BPI (Business Process Improvement)
Los sistemas BI son normalmente dependientes del dominio y no están lo suficientemente orientados al concepto de proceso como para llevar a cabo las actividades de mejora.
Esto supone reunir, integrar, supervisar y analizar un gran volumen de logs eventos dispersos, sin estructura, y producidos por una variedad de sistemas heterogéneos. Es más, se espera que estos procesos se realicen sobre una base de tiempo de respuesta aceptable.
Objetivo 1
Reunir información e investigar sobre la existencia de modelos, técnicas y aproximaciones similares, tanto dentro del ámbito de la industria como de la comunidad investigadora, relacionados con los objetivos de esta tesis.
Objetivo 2
Recoger, unificar y mejorar aproximaciones existentes, si las hay, y proponer nuevas técnicas y estándares para resolver el problema.
Objetivo 3
Idear y diseñar una solución arquitectónica basada en el estudio llevado a cabo previamente. Este diseño debe cumplir con los retos de investigación establecidos en la tesis.
Objetivo 4
Desarrollar y evaluar la solución arquitectónica propuesta. La evaluación debe demostrar que el prototipo desarrollado es factible y soluciona el problema planteado.
Objetivo 5
Estudiar diferentes metodologias BPI. Adpotar y extender métodos, tecnicas e ideas para integrar la plataforma propuesta con iniciativas BPI. La contribución debe ser una metdología BPI que permita sostener un programa integral de mejora de procesos.
Objetivo 6
Validar la metodología y la solución tecnológica en un entorno productivo.
Objetivos de la Investigación
Information Systems Research Framework
Information Systems Research Framework
Directriz 2
Relevancia del problema
Directriz 3
Evaluación del diseño
Directriz 4
Contribución de la investigación
Directriz 5
Rigor de investigación
Directriz 6
Diseño como un proceso de búsqueda
Directriz 7
Comunicación de la investigación
Directriz 1
Diseño como un artefacto
Design Research in Information System
Henver & Chatterjee (2010)
“El conocimiento y la comprensión de un problema de diseño y su solución, son adquiridos en la construcción y aplicación de un artefacto"
“La investigación de la ciencia del diseño (design-science research) es un paradigma de investigación en el cual un diseñador responde preguntas relevantes de problemas humanos mediante la creación de artefactos innovadores, contribuyendo así con un nuevo conocimiento al cuerpo de la evidencia científica. Los artefactos diseñados son útiles y fundamentales para comprender el problema“
La investigación de la ciencia del diseño (design-science research) debe producir un artefacto viable en la forma de un sistema, un modelo, un método o una instancia.
El objetivo de la investigación de la ciencia del diseño (design-science research) es desarrollar soluciones basadas en tecnología y aplicarlas a problemas de negocio relevantes.
La utilidad, calidad y eficacia de un artefacto de dise
ñ
o debe ser rigorosamente demostrado a través de métodos de evaluación bien ejecutados.
Una investigaci
ó
n efectiva debe aportar contribuciones que sean claras y verificables en el área del artefacto de diseño.
La investigación de la ciencia del diseño se basa en la aplicación de métodos rigurosos, tanto en la construcción como en la evaluación del artefacto de diseño.
La b
ú
squeda de una artefacto efectivo requiere utilizar métodos disponibles para lograr los fines deseados, y a la vez que cumplir con las normas en el entorno del problema.
La investigación de la ciencia del diseño debe ser presentada de manera efectiva a una audiencia tanto de perfil tecnologico como gestor.
Es necesario recopilar información de los procesos.
Programa integral de mejora continua de procesos
Latency Types in Process Monitoring (zur Muhelen & Shapiro, 2010)

"Medir es clave. Si no lo puedes medir no lo puedes controlar, si no lo puedes controlar no puedes gestionarlo, y si no puedes gestionarlo no lo puedes mejorar" (Harrington, 1991)

Método
Arquitectura
Instancia
Metodología
La representación de la información es necesario para saber que pretendemos monitorizar, medir y analizar.
Modelo
Correlación de eventos
Business Process Analytics Format (BPAF)
Modelo estructural
Modelo de comportamiento
Métricas
El estándar no es suficiente para conseguir los propósitos de la tesis.
exBPAF
La búsqueda se realiza sobre el dominio de E (eventos). Como se puede saber ni estimar la duración de cualquier proceso o actividad, la búsqueda debe realizarse sobre el repositorio completo de eventos, y éste tiende a ser muy grande.
El algoritmo trata de buscar la instancia del proceso para cada evento atendiendo a los datos de correlación, el modelo proceso y el origen en donde éste se produjo.
Business Process Execution Query Language
SELECT [AGGREGATE] ((*) | (id | name | source | start_time | end_time | successful | failed
| aborted | turn_around | wait | change_over | processing | suspend))
FROM (ACTIVITY | PROCESS | MODEL)
[WHERE condition]
SELECT id, start_time, end_time
FROM PROCESS
WHERE NAME = ‘ProcesTripOrder’
SELECT i.id, start_time, end_time
FROM event_fact f
JOIN process_instance i on (f.process = i.id)
JOIN process_model m on (m.id = i.id)
WHERE f.activity is null AND name = ‘ProcessTripOrder’
HiveQL
Definición
1) Identificación de los límites y ámbito del proceso.
Configuración
1) Establecimiento de los nodos de negocio (unidades BASU) e identificación de los límites del software.
Ejecución
Esta fase implica la ejecución de los sistemas operacionales de origen. En este punto los
listeners
y el sistema DSS entran en modo operacional.
Control
En esta fase se realiza el seguimiento y análisis de los resultados del DSS en tres dimensiones distintas:

1) Análisis histórico.
2) Seguimiento de la actividad empresarial.
3) Análisis predictivo.

Diagnosis
Esta última fase pretende identificar las deficiencias y debilidades del proceso y proponer mejoras tales como redistribución de recursos o incluso realizar re-ingeniería de procesos.
Metodología para la mejora continua de los procesos de negocio
mejora
3) Determinación del nivel de detalle.
4) Desarrollo de las tablas de modelo.
2) Definición de los subprocesos, actividades y subactividades.
2) Selección del formato de los datos de eventos. MXML, XES, exBPAF
3) Determinar los datos de correlación de eventos.
4) Implementación de los listeners.
5) Selección de la metricas y KPIs
Los listeners capturan correctamente los eventos operacionales.
Los eventos cumplen con el modelo de proceso definido en la fase 1.
Las métricas generan valores esperados.
En una etapa temprana de esta fase es importante comprobar que:
Una vez que la mejora es identificada y llevada a cabo, el ciclo comienza de nuevo de forma continua.
Red de carreteras del Reino Unido
No orientado a procesos (caso real)
Call-Centre
Orientado a procesos (caso ficticio)
Casos de Estudio
Este caso de estudio consiste en analizar y mejorar la eficiencia y seguridad de la red de carreteras del Reino Unido.
Modelando el flujo de tráfico a través de la red como procesos de negocio.
Metodología
Simulación
Definición
Configuración
Ejecución
Control
Comprobamos que las siguientes métricas no presentaban diferencias significativas con respecto a los valores reales publicados por la Highways Agency en términos de congestión (eficiencia) y seguridad (número de accidentes).
Diagnosis
No es aplicable en este caso de estudio.
No podemos aplicar ninguna mejora ya que estamos trabajando sobre un data set.
Cada conexión origen-destino en la red de carreteras es un proceso.
Cada vehículo que viaja a través una conexión es una instancia del proceso.
Desplegamos 6 nodos para dividir el análisis localizado por regiones.
BASU-EA (East)
BASU-SW (South West)
BASU-SE (South East)
BASU-ML(Midlands)
BASU-NW (North West)
BASU-NE (North East)
Los sistemas de la Highways Agency, dispone de sistemas ANPR (Auto­matic Num­ber Plate Recog­ni­tion) que identifica la matricula de los vehículos en la red de carreteras.
Matrícula.
Fecha de viaje.
Datos de correlación
Implementamos los listeners recreando los flujos de trafico contenido en el dataset público entre los meses Ene-Jun de 2013.
Generamos un volumen de eventos en torno a los 5 millones para unas rutas específicas.
En un entorno de prueba local con un clúster de 4 nodos, probamos el algoritmo de correlación con 3 aproximaciones big-data distintas:
Map-Reduce: Tiempo de correlación, aprox. 1-2 min.
Cloudera Impala: Tiempo de correlación. aprox. 45-100 seg.
Índices Secundarios: Tiempo de correlación. aprox. 0.2-0.5 milisegundos.
Duplicación de almacenamiento y problemas de sincronización.
en detrimento
Datos Estructurales
Datos de comportamiento
Casos en ejecución
: Número de vehículos que iniciaron un viaje.
Casos de éxito
: Número de vehículos que llegaron a su destino.
Casos de fracaso
: Número de vehículos que no llegaron por accidente.
Casos abortados
: Número de vehículos que no llegaron por averías,
Métricas
Throughput Time
: Tiempo total que toma un vehículo en recorrer una conexión (proceso).
KPI
Congestión
: Tiempo medio que se espera que un vehículo tarde en recorrer una conexión.
Fiablidad
: Mide el numero de casos de éxito entre todos los casos de ejecución
Este caso de estudio consiste en analizar y mejorar la eficiencia de gestión de llamadas en un call-centre.
Simulación
Metodología
Definición
Configuración
Ejecución
Control
Modelamos el flujo de llamadas entrantes como procesos de negocio.
Modelamos el proceso de gestión de llamadas.
Desplegamos los 18 nodos correspondientes a cada uno de los call centres que gestionan las peticiones de los clientes en todo el mundo.
Los sistemas internos de los call-centre tienen la capacidad de reconocer unívocamente cada llamada mediante un identificador.
Identificador de llamada
Datos de correlación
Implementamos los listeners mediante una herramienta de simulación la cual recrea flujos de llamadas y conmutaciones entre distintos call-centres.
Generamos un volumen de eventos en torno a los 10 millones basados en distintos casos hipotéticos: tasas de abandonos, tiempos de espera y número de agentes.
El experimento se realizó sobre un entorno de prueba local con un clúster de 4 nodos usando índices secundarios sobre HBase.
Comprobamos que las siguientes métricas correspondían con los valores establecidos en la herramienta de simulación en términos de número de abandonos, tiempos de espera (congestión) y productividad (número de agentes).
Datos Estructurales
Datos de comportamiento
Casos en ejecución
: Número de llamadas procesadas.
Casos de éxito
: Número de llamadas procesadas satisfactoriamente.
Casos de fracaso
: Número de llamadas procesadas pero que no cumplieron con las expectativas del cliente.
Casos abortados
: Número de llamadas que abandonaron la cola de espera.
Productividad
: Mide el número de llamadas atendidas por número de llamadas entrantes.
Congestión
: Mide el tiempo medio de espera.
Tasa de abandono
: Mide el número de llamas que abandonan la cola por el total de las llamadas entrantes.
Diagnosis
No es aplicable en este caso de estudio.
No podemos aplicar ninguna mejora ya que estamos trabajando sobre una herramienta de simulación en un caso ficticio.
Trabajo Futuro
Evaluar la infraestructura tecnológica en términos de rendimiento (performance) y escalabilidad.
Medir el tiempo de respuesta del sistema en base al volumen de datos y a los recursos computacionales (capacidad computacional del cluster).
Naturaleza del negocio
Tiempo de Respuesta
Inversión en Hardware
Buscar el equilibrio
Trabajo Futuro
Conclusiones
Dos casos de estudio (orientado y no orientado a procesos)
Cualquier dominio.
Tiempo de respuesta aceptable.
Tecnología Big Data. Disposición de datos analíticos en el orden de milisegundos.
Entornos Heterogéneos.
Modelo y método basado en el estándar (exBPAF)
Una de las mayores limitaciones que presenta el sistema, es que es sumamente dependiente de la infraestructura tecnológica.
Los recursos computacionales necesarios aumentan considerablemente conforme al número de nodos establecidos (corporaciones) y acorde a la complejidad de los procesos (nivel de detalle).
Número de eventos
Volumen de datos
Capacidad computacional
Indexed Journals

Vera-Baquero, A., Colomo-Palacios, R, Molloy, O. (2013). Business Process Analytics Using a Big-Data Approach. IEEE IT Profesional, 15(6), 29-35 (Impact Factor 2013: 0.495; COMPUTER SCIENCE, SOFTWARE ENGINEERING, 90/105, Q4)

Colomo-Palacios, R, Vera-Baquero, A., Alvarez-Rodriguez, J.M. (2014). Using Big-Data to Detect Rivalry and Hostility in on-line Social Communities. Knowledge-Based Systems (Impact Factor 2013: 3.058; COMPUTER SCIENCE, ARTIFICIAL INTELLIGENCE, 15/121, Q1) (under review)

International Journals

Vera-Baquero, A., Colomo-Palacios, R. & Molloy, O. (2014). Decision Support Systems for Business Process Improvement: A Methodology for Big-Data Environments. International Journal of Information Systems and Project Management (In press).

Vera-Baquero, A., Colomo-Palacios, R., Stantchev, V. & Molloy, O. (2014). Leveraging Big-Data for Business Process Analytics. The Learning Organization, 21(5). Emerald (submitted)

Book Chapters

Vera-Baquero, A., & Molloy, O. (2013). Integration of Event Data from Heterogeneous Systems to Support Business Process Analysis. In Knowledge Discovery, Knowledge Engineering and Knowledge Management (pp. 440-454). Springer Berlin Heidelberg.

International Conferences

Vera-Baquero, A., Colomo-Palacios, R. & Molloy, O. (2014). Towards a process to guide Big Data based Decision Support Systems for Business Processes. Proceedings of the 6th International Conference of ENTERprise Information Systems (CENTERIS 2014): Aligning Technology, Organizations and People. Troia, Portugal, October 2014.

Vera-Baquero, A., & Molloy, O. (2012). A Framework to Support Business Process Analytics. Proceedings of the International Conference on Knowledge Management and Information Sharing, (pp. 321-332). Barcelona.

National Conferences

Molloy, O., Vera-Baquero, A., Lyons, G., Colomo-Palacios, R. (2014). Business Activity Monitoring for Process Improvement. Proceedings of the Irish Ergonomics Society Annual Conference 2014, Galway, Ireland.
Full transcript