Loading…
Transcript

FACULTAD DE ENERGÍA, LAS INDUSTRIAS Y LOS RECURSOS NATURALES NO RENOVABLES

Ingeniería en Telecomunicaciones

APLICACIONES DEL TRATAMIENTO DE SEÑALES

TEMA:

TEMA

Implementación de Métodos de Reducción Dimensional Utilizando Análisis de Componentes Principales (PCA)

RESUMEN

RESUMEN

La técnica de PCA es un método de extracción de características no supervisado ampliamente usado en la actualidad. ES una de las herramientas más ampliamente aplicadas para resumir patrones comunes de variación entre variables, es decir se pueden procesar un extenso conjunto de datos y reducir su dimensionalidad con una pérdida mínima de información.

A lo largo de este proyecto se presentará su funcionamiento en dos bases de datos, las uales estan formadas de datos numéricos y categóricos.

INTRODUCCIÓN

INTRODUCCIÓN

El presente trabajo tiene como objetivo utilizar la metodología de Análisis de Componentes Principales se hace mediante un algoritmo que reduce la dimensionalidad dentro de un conjunto de datos sin perder la mayor cantidad de información posible. Reduce la dimensionalidad al encontrar un nuevo conjunto de características llamadas componentes, que son compuestos de las características originales, pero que no están correlacionadas entre sí.

revisión

literaria

revisión literaria

PYTHON

python

Según (Alvarez Miguel, 2003) define Python como “Un lenguaje de scripting independiente de plataforma y orientado a objetos, preparado para realizar cualquier tipo de programa. Es un lenguaje interpretado, además ofrece ventajas como la rapidez de desarrollo e inconvenientes como una menor velocidad.”

PCA

pca

Según (Sabtiago Fernandez, 2011) “El método de componentes principales tiene por objeto transformar un conjunto de variables, en un nuevo conjunto de variables denominadas componentes principales, se caracterizan por estar incorrelacionadas entre sí y, además, pueden ordenarse de acuerdo con la información incorporada”

alogoritmo PCA

algoritmo

1. Estandarización de los datos.

2. Calcular la matriz de covarianza.

3. Calcular los vectores propios y los valores propios.

4. Calcular los componentes principales.

5. Reducir las dimensiones del conjunto de datos

metodología

metodología

La metodología utilizada para llevar a cabo este proyecto de investigación denominado “Implementación de Métodos de Reducción Dimensional utilizando Análisis de Componentes Principales (PCA)”, es una metodología de tipo experimental debido a que se utilizó varias bases de datos con la finalidad de apreciar cual es la más óptima para aplicar PCA y que se pueda notar la diferencia en cuanto a reducción de dimensión de la muestra de datos.

conclusiones

conclusiones

  • Se estandarizo las bases de datos.
  • Se obtuvo la matriz de covarianza y varianza de las bases de datos.
  • Se obtuvo los auto vectores y valores propios.
  • Se redujo la dimensionalidad de las bases de datos.
  • Se obtuvo 7 componentes principales de las bases de datos LEAF con alrededor del 96,95% de información.
  • Se obtuvo 13 componentes principales de la base de datos de MARKETING BANCARIO con el 92,94% de información.
  • Se obtuvo 2 componentes principales de la base de datos IRIS con el 95.8% de la información.

recomendaciones

recomendciones

  • Se debe usar un lenguaje de programación apropiado.
  • El conjunto de datos debe tener una dimension mayor de tal forma que se pueda visualizar la reducción de dimensión.
  • Implementar un código encargado de realizar la transformación categorio - númerico.
  • Determinaión de los componentes principales.