IMPORTANCIA DE DATA MANING DATA MART DATA HOUSE
Determinación de los objetivos. Trata de la delimitación de los objetivos que el cliente desea bajo la orientación del especialista en data mining.
* Preprocesamiento de los datos. Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining.
* Determinación del modelo. Se comienza realizando unos análisis estadísticos de los datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial.
* Análisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.
procesos para data mining
el datamining o significa do nos dice en español mineria de datos conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto
básicamente la minería de datos esta enfocado o es utilizado para recolectar información principal sobre sus clientes dirección que tipo de clientes es si es bueno con sus pagos a demás para prácticamente su importacia esta al servicio al cliente identificar el perfil de los clientes del producto uno de los ejemplo cuando el cliente solicita una tarjeta bancaria o cuando las encuestas para conocer la mercadotecnia
es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento
Datamart OLTP
Pueden basarse en un simple extracto del datawarehouse, no obstante, lo común es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones más usuales) aprovechando las características particulares de cada área de la empresa. Las estructuras más comunes en este sentido son las tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de explotar la reescritura de queries (aunque sólo es posibles en algunos SGBD avanzados, como Oracle).
- Analizar los factores que conducen el negocio
- Analizar los objetivos del negocio
- Analizar las necesidades de información de alto nivel
- Identificar información de procesamiento
- Identificar roles de persona
- Revisar infraestructura informática
- Revisar planes tácticos y estratégicos
- Identificar limitaciones y restricciones
- Recortar y revisar documentación de la empresa
- Identificar procesos de alto nivel e indica dores calves de rendimiento
- Analizar las fuentes de datos
data mart
Datamart OLAP
Se basan en los populares cubos OLAP, que se construyen agregando, según los requisitos de cada área o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El modo de creación, explotación y mantenimiento de los cubos OLAP es muy heterogéneo, en función de la herramienta final que se utilice
datawarehouse
es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de pespectivas y con grandes velocidades de respuesta.
copia de transaccionales de datos especifica mente de una estructura para consulta y el análisis
la unión de todos lo data marts en una entidad
Elementos
- Medidas
- Dimensiones
- Hechos
- Granularidad
PROCESOS
Extracción: Debe establecer de qué fuentes se obtendrá los datos
Transformación: No siempre los datos están correctos; muchos campos están nulos o necesitan ser concatenados o calculados
Carga: cuando las datos están preparados para ser llevados a la bodega de datos se llama las tablas dimensiónales y luego las tablas de hecho
características
- Permite fácil acceso a la información
- Presenta información contante
- Es flexible al cambio
- Segura
- Base para toma de decisiones
- Activo de la organización
- Grande en volumen de datos
especializada en el almacenamiento de los datos de un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departament0
data mart