Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Técnicas y algoritmos utilizados en Minería de Datos

No description
by

jessenia cortés vigorena

on 22 July 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Técnicas y algoritmos utilizados en Minería de Datos

Técnicas y algoritmos utilizados en Minería de Datos
¿Qué es la Minería de Datos?
Objetivo General
• Conocer la minería de datos y estudiar técnicas y algoritmos utilizados en ella.
Objetivos Específicos
• Conocer las fases del Descubrimiento de Conocimiento de Bases de Datos (KDD).

• Comparar modelos descriptivos y predictivos en minería de datos.

• Describir tareas de minería de datos y relacionarlas con los modelos descriptivos y predictivos.

• Indicar algoritmos y técnicas utilizadas en los modelos de minería de datos.
Proceso del KDD
El KDD incluyele el pre-procesamiento, Minería y post-procesamiento de los datos.
Modelos y Tareas de Minería de Datos
Tareas de Minería de Datos
Series Temporales
Conclusiones
Técnicas de Minería de Datos
Técnicas y algoritmos de Minería de Datos según Tarea
Jessenia Cortés Vigorena
PONTIFICIA UNIVERSIDAD CATÓLICA DE VALPARAÍSO
FACULTAD DE CIENCIAS
INSTITUTO DE ESTADÍSTICA

MEMORIA PARA OPTAR AL GRADO DE LICENCIADO EN CIENCIA ESTADÍSTICA Y AL TITULO DE ESTADÍSTICO
PROFESOR GUÍA
Jorge Galbiati Riesco
Técnicas Bayesianas
Técnicas basadas en redes neuronales artificiales
Técnicas basadas en árboles de decisión y sistema de reglas
Técnicas basadas en distancia o densidad
Técnicas basadas en núcleo y máquinas de soporte vectorial
Técnicas estocásticas y difusas
Técnicas de Series Temporales

La Minería de Datos utiliza los métodos de:
Computación
Inteligencia artificial
Aprendizaje automático
Estadística
Sistema de bases de datos

El producto final involucra la toma de decisiones.
Siguen un tipo de aprendizaje no supervisado.

Mediante este modelo se pretende emanar patrones, que resuman las características esenciales del conjunto de datos.
Modelo Descriptivo
Siguen un tipo de aprendizaje supervisado.

Este modelo se emplea para estimar valores futuros de variables de interés.
Modelo Predictivo
La minería de datos surge como una tecnología emergente.
El tipo de modelo adecuado a aplicar sobre la base de datos, está relacionado con el objetivo del estudio.
Aplicaciones de Minería de Datos
La minería de datos es muy útil y es utilizada en diversas áreas.
Software que trabajan con Minería de Datos
De uso Libre:
• Orange
• RapidMiner
• Weka
• JHepWork
• Knime
• R-Project

De uso comercial:
• dVelox
• Powerhouse
• Quiterian
• SPSS Clementine
• SAS Enterprise Miner
• STATISTICA Data Miner

Referencias
Descubrimiento de conocimiento en bases de datos (s.f.). Recuperado el día 03 de mayo de 2013, (pp.25). [En línea]. Disponible en: http://www.bdigital.unal.edu.co/2037/2/germanaugustoosoriozuluaga_Parte2.pdf

J. Hernández, J. Ramírez y C. Ferri (2004). Introducción a la minería de datos. Pearson Educación. Madrid.

Larose, D. (2005). Discovering Knowledge In Data: An Introduction To Data Mining. Publicado por John Wiley & Sons, Inc. Hoboken, New Jersey.

Allende, Héctor. (2002). El aprendizaje Automático en Sistemas Inteligentes. (pp 6-7).

Ramírez O. Lógica Difusa (cap.3). Recuperado el día 10 de noviembre de 2013. [En línea]. Disponible en: http://catarina.udlap.mx/u_dl_a/tales/documentos/lmt/ramirez_r_o/capitulo3.pdf

Garzón S. (2004). Herramienta software para implementar minería de datos: clusterización utilizando lógica difusa. Revista: Orinoquia, Vol. 8 (1). Recuperado el día 05 de diciembre de 2013, de http://www.redalyc.org/pdf/896/89680103.pdf


Datos de clasificador Naïve Bayes aplicado al robo de autos.
Se presenta un vehículo que es de color Rojo, Familiar y Nacional, entonces hay que decidir si detenemos al conductor y le pedimos sus papeles o lo dejamos pasar directamente.
Neurona Artificial
Árbol de decisión para determinar si se juega o no a un cierto deporte
K-vecinos más próximos
una nueva muestra será clasificada a la clase a la cual pertenezca la mayor cantidad de vecinos más cercanos del conjunto de entrenamiento más cercano a ésta.
Clasificador basado en vectores soporte
Para ello se han etiquetado previamente en las dos clases existentes de narajas, según su diámetro y peso.
Series de Tiempo
Un modelo clásico de series de tiempo, supone que la serie
tres componentes: tendencia, componente estacional y un término de error aleatorio.
puede ser expresada como suma o producto de
Algoritmo de k-medias
El algoritmo de k-medias requiere de las 4 etapas siguientes:
1) Seleccionar K grupos.
2) Calcular las distancias de cada elemento a los centros de los G grupos.
3) Definir un criterio de optimalidad.
4) Terminar el proceso.

Ejemplo: existen diferentes precios de vinos en el comercio, de distintas viñas, se desea clasificar en 3 grupos estos precios.
Precios de vinos, clasificados en 3 grupos, K-medias.
Descubrimiento de conocimiento en Bases de Datos
El valor real de los datos recide en la información que se puede extraer de ellos.
Agrupamiento (Clustering)
Reglas de asociación
Correlaciones
Clasificación
Regresión
Lógica difusa
Se define un conjunto difuso A como el conjunto de parejas:
Full transcript