Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Data Mining

Base de Datos II
by

ariana cerdas quesada

on 7 March 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Data Mining

Ariana Cerdas Quesada
Melvin Jiménez Araya Data Mining Qué es el data mining? "Un proceso no trivial de identificación válida, novedosa, potencialmente útil y entendible de patrones comprensibles
que se encuentran ocultos en los datos". Fayyad-1996

Es el proceso de detectar la información procesable de
los conjuntos grandes de datos.

La minería de datos lo que intenta es descubrir patrones
en grandes volúmenes de conjuntos de datos. Modelo de Data Mining Un modelo de data mining es el conjunto de patrones
y tendencias que se recopilan gracias a la minería de
datos.

Estos modelos los podemos aplicar en escenarios como: Pasos para hacer
Data Mining Un proceso típico de minería de datos consta de 6
pasos generales. Definir el problema En este paso se debe analizar los requisitos,
definir el ámbito del problema, definir las métricas
por las que se evaluará el modelo y definir los
objetivos del proyecto de la minería de datos. Preparar los datos Este proceso consiste en consolidar y limpiar los
datos que ya fueron identificados en el paso anterior.

Es importante enriquecer, reducir y transformar la
base de datos, para de esta manera obtener datos
más convenientes para el proyecto. Explorar los datos Para este proceso se deben ya conocer los
datos para poder tomar las decisiones adecuadas
al crear los modelos de minería de datos.

Es importante destacar que para este punto
se debe conocer el problema empresarial. Pronóstico Cálculo de las ventas y predicción de las cargas del servidor o del tiempo de inactividad del servidor. Riesgo y Probabilidad Elección de los mejores clientes para la distribucción de correo directo, determinación del punto de equilibrio probable para los escenarios de riesgo, y asignación de probabilidades a diagnósticos y otros resultados. Recomendaciones Determinación de los productos que se pueden vender juntos y generación de recomendaciones. Búsqueda de secuencias Análisis de los artículos que los clientes han introducido en el carrito de la compra y predicción de posibles eventos. Agrupación Distribución de clientes o eventos en grupos de elementos relacionados, y análisis y predicción de afinidades. Qué se está buscando?
Que tipos de relaciones se buscan?
Qué resultados o atributos se desean predecir?
Cómo se distribuyen los datos?
Los datos representan con precisión los procesos de la empresa? Técnicas para la exploración de datos. Calcular los valores mínimos y máximos.
Calcular la media y las desviaciones estándar.
Examinar la distribución de los datos. Generar Modelos Acá se generará el modelo de la minería de datos,
se deberá usar los conocimientos adquiridos en el
paso anterior.
También se debe definir qué columnas de datos
desea que se usen, para esto se creará una
estructura de minería de datos. Explorar y validar
los modelos En este paso se explora los modelos de minería
de datos que se han generado y se comprueba
su eficiencia.
Este paso es vital, ya que comprobamos si el
modelo funciona antes de pasarlo al proceso
de implementación del entorno de producción. Implementar y actualizar
los modelos. Este paso consiste en implementar los modelos
que funcionan mejor en un entorno de producción.

Cuando ya los modelos de minería de datos están en
el entorno de producción, se pueden realizar
algunas tareas, esto dependiendo de las
necesidades. Tareas que se pueden realizar: Usar los modelos para crear predicciones que luego ayudarán a tomar decisiones.

Crear consultas para recuperar estadísticas, reglas o fórmulas del modelo.

Incrustar la funcionalidad de la minería de datos directamente en la aplicación. Crear un informe que permita a los usuarios realizar consultas directamente en un modelo de minería de datos.

Actualizar los modelos después de la revisión y análisis.

Actualizar dinámicamente los modelos cuando entren más datos a la organización. Aplicaciones de
Data Mining Aspectos climatológicos.
Medicina.
Mercadotecnia.
Inversión en casas de bolsa y banca.
Detección de fraudes o comportamientos inusuales.
Determinación de niveles de audiencia. Gracias!!!
Full transcript