Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

EL PROCESO DE KDD

No description
by

on 20 January 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of EL PROCESO DE KDD

El proceso del KDD
El proceso de KDD (Knwoledge Discovery in Databases) consiste en usar métodos de minería de datos (algoritmos) para extraer (identificar) lo que se considera como conocimiento usando una base de datos junto con pre-procesamientos y post-procesamientos.

Data Warehouse-Data Mining
Al implementar el almacén de datos, es donde entra la Minería de Datos ya que permite una navegación y visualización previa de la información, para filtrar los aspectos que pueden interesar para que sean estudiados. Esta es la etapa que puede llegar a consumir el mayor tiempo.
Selección y Limpieza de Datos
Selección, limpieza y transformación de los datos que se van a analizar: la selección incluye tanto una criba o fusión horizontal (filas) como vertical (atributos).La limpieza y prepocesamiento de datos se logra diseñando una estrategia adecuada para manejar ruido, valores incompletos, secuencias de tiempo, casos extremos (si es necesario), etc.
Objetividad
Podemos encontrar diferentes áreas del conocimiento donde se aplica y utiliza la minería de datos y el proceso KDD entre las cuales tenemos:
El primero paso en el proceso para llegar al Conocimiento es diseñar el esquema de un almacén de datos (Data Warehouse): que consiga unificar de manera operativa toda la información recogida.
Limpieza de Datos (Para remover el ruido y las inconsistencias)
Integración de Datos (Donde múltiples fuentes se combinan)
Selección de Datos (Se toma lo mas relevante)
Transformación de Datos (Los datos se consolidan en formas apropiadas para la Minería)
Minería de Datos (Proceso esencial donde se extraen patrones con diferentes métodos)
Evaluación de Patrones
Representación del Conocimiento
Evaluación de Patrones
Se buscan patrones que puedan expresarse como un modelo o simplemente que expresen dependencias de los datos, el modelo encontrado depende de su función (clasificación) y de su forma de representarlo (árboles de decisión, reglas, etc.)
Interpretación y Transformación de los Patrones
Interpretar los resultados y posiblemente regresar a los pasos anteriores. Esto puede involucrar repetir el proceso, quizás con otros datos, otros algoritmos, otras metas y otras estrategias. Este es un paso crucial en donde se requiere tener conocimiento del dominio. La interpretación puede beneficiarse de procesos de visualización, y sirve también para borrar patrones redundantes o irrelevantes.
Difusión y Uso del nuevo Conocimiento
Incorporar el conocimiento descubierto al sistema (normalmente para mejorarlo) lo cual puede incluir resolver conflictos potenciales con el conocimiento existente.

El conocimiento se obtiene para realizar acciones, ya sea incorporándolo dentro de un sistema de desempeño o simplemente para almacenarlo y reportarlo a las personas interesadas.

Seleccionar y aplicar el método de minería de datos apropiado: esto incluye la selección de la tarea de descubrimiento a realizar, por ejemplo, clasificación, agrupamiento o clustering, regresión, etc. La selección de él o de los algoritmos a utilizar. La transformación de los datos al formato requerido por el algoritmo específico de minería de datos.
Se tiene que especificar la estrategia de búsqueda a utilizar la cual normalmente está predeterminada en el algoritmo de minería (en el paso anterior)
Administración de negocios: Podemos aplicar minería para apoyar los procesos de Investigación de mercados, detección de Fraudes, Telecomunicaciones, etc.
Gobierno: En los entes gubernamentales permite apoyar los procesos de detección de evasores de impuestos, terrorismo entre otros.
Full transcript