Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Introducción a Redes Neuronales Artificiales

Breve presentación sobre los fundamentos e historia de algunas de las RNA
by

ricardo alberto cavieses nuñez

on 28 January 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Introducción a Redes Neuronales Artificiales

Introducción a las Redes Neuronales Artificiales
Redes neuronales Biológicas
Las neuronas reciben información a través de sus dendritas. Esta información se procesa en el soma y se conduce a lo largo del axón hasta la siguiente sinapsis con otra neurona.
El sistema nervioso es mucho más que una red de comunicación. Sus principales Funciones son:
coordina e integra todas las funciones, de manera que permite que el organismo funcione como una unidad estructural y funcional;
sus receptores sensoriales seleccionan información entre la gran cantidad de estímulos que llegan a la superficie corporal y que se generan en el propio cuerpo;
transmite información procedente desde el ambiente externo e interno;
integra la información procedente desde los receptores sensoriales que es procesada en los circuitos nerviosos;
Permite toma de decisiones, mediante las cuales puede canalizarse la información por vías seleccionadas hacia órganos o tejidos específicos en los cuales se ejecuta una respuesta o impedir el alcance los efectores;
Almacena información acoplada con la posibilidad de recuperar información específica cuando es requerida;
tiene la posibilidad de modificarse estructural y funcionalmente frente a los cambios y estímulos del ambiente, o cual contribuye al aprendizaje;
ciertos componentes o circuitos de células nerviosas pueden generar patrones de actividad que contribuyen al comportamiento global del animal.
En la actualidad , el sistema se conoce con mucho mas detalle y aún son innumerables las preguntas sin respuesta.
Aristoteles
Creía que el cerebro era un órgano para enfriar la sangre
Hipocrates
Consideraba que el cerebro era la sede de las facultades mentales
Neurona Artificial
Función de activación
La función de activación, digamos f(Ac)j instruye a la neurona si debe disparar o no. La expresión tradicional más usada es la de umbral (como T). Si la suma ponderada

x1w1+x2w2+x3w3+…>T, entonces la neurona se activa.

· La función de transferencia es variable, y más compleja en la mayoría de los casos. Por ejemplo,

· Puede ser lineal (proporcional al valor del producto ponderado de entradas y pesos).

· Puede ser condicional, en el sentido de dar lugar a dos opciones dependiendo del valor del producto ponderado citado. También se le llama una variable nominal de dos estados.

· Puede ser de tipo sigmoideo, también llamada función logística, que da lugar a un gráfico en forma de S con extremos que generalmente varían entre 0 y 1 o -1 y 1. Es una función de fácil diferenciación y de un amplio uso en redes neurales.
Aparte de la función escalar lineal pueden usarse otras funciones escalares. Por ejemplo, una función exponencial.

· También puede haber una salida por clasificación, lo cual implica asumir un conjunto de clases de salida para cada tipo de entrada. Es propio del manejo de patrones.

· Puede utilizarse una salida por regresión estadística, digamos por un ajuste de mínimos cuadrados, lo cual tendría un sentido más bien de predicción.
Se pueden usar distintos tipos de funciones de activación: una función escalón, una función lineal o semi-lineal, o una función sigmoidal. En la figura se muestran algunas de estas funciones.
http://www.ingenieria.peru-v.com/redes_neurales/activacion_y_transferencia.htm
http://www.um.es/LEQ/Atmosferas/Ch-VI-3/C63s6p2.htm
Estructura de una Red Neuronal Artificial
La distribución de neuronas dentro de la red se realiza formando niveles o capas de números determinado de neuronas cada una, y que existen capas de entrada, de salida y ocultas.

Cuando ninguna salida de las neuronas es entrada de neuronas del mismo nivel o de niveles precedentes, la red se describe como de propagación hacia adelante.

Cuando las salidas pueden ser conectadas como entradas de neuronas de niveles previos o del mismo nivel, incluyendose ellas mismas, la red es de propagación hacia atrás.
Características de las RNA
Hay cuatro aspectos que caracterizan una RNA:
Topología, Mecanismo de Aprendizaje, Tipo de asociación Entrada / salida de información, y la forma de representación de la información.
1.- Topología.- consiste en la organización y disposición de las neuronas formando capas. Sus parámetros fundamentales son: el número de capas, el número de neuronas por capa, el grado de conectividad y el tipo de conexiones entre neuronas.
http://www.slideshare.net/ARMANDO1022/red-neuronal-artificial
2.- Mecanismo de aprendizaje. El aprendizaje es el proceso por el cual una red neuronal modifica sus pesos en respuesta a una información de entrada. Los cambios que se producen durante el proceso de aprendizaje se reducen a la destrucción, modificación y creación de conexiones entre las neuronas, la creación de conexiones entre las neuronas, la creación de una nueva conexión implica que el peso de la misma pasa a tener un valor distinto de cero, una conexión se destruye cuandosu peso pasa a ser cero. Se puede afirmar que el proceso de aprendizaje ha finalizado cuando los valores de los pesos permanecen estables
Redes
Monocapa:
Se establecen conexiones laterales. cruzadas o autorrecurrentes entre las neuronas que pertenecen a la única capa que constituye la red. Se utilizan en tareas relacionadas con lo que se conoce como autoasociación; por ejemplo, para generar informaciones de entrada que se presentan a la red incompletas o distorsionadas.
Redes
Multicapa:
Son aquellas que disponen de conjuntos de neuronas agrupadas en varios niveles o capas. Una forma de distinguir la capa a la que pertenece la neurona, consiste en fijarse en el origen de las señales que recibe a la entrada y el destino de la señal de salida, según el tipo de conexión.
Estas se pueden clasificar si el Aprendizaje es supervisado o las redes neuronales son con aprendizaje no supervisado. La diferencia fundamental entre ambos tipos estriba en la existencia o no de un agente externo que controle el aprendizaje de la red.
El proceso de aprendizaje se realiza mediante un entrenamiento controlado por una agente externo que determina la respuesta que debería generar la red a partir de una entrada determinada. El supervisor corrigirá lo pesos hasta qeue se consiga que la salida se aproxime al valor deseado
Se consideran tres formas de llevar a cabo éste tipo de entrenamiento
Aprendizaje por corrección: consiste en ajustar los pesos en función de la diferencia entre los valores deseados y los obtenidos en la salida de la red; es decir en función del error.
Aprendizaje por refuerzo: se basa en la idea de no indicar durante el entrenamiento exactamente la salida que se desea que proporcione la red ante una determinada entrada. La función del supervisor se reduce a indicar mediante una señal de refuerzo si la salida obtenida en la red se ajusta a la deseada , y en función de ello se ajusta los pesos basándose en un mecanismo de probabilidades.
Aprendizaje estocástico: este tipo de aprendizaje consiste básicamente en realizar cambios aleatorios en los valores de los pesos de las conexiones de la red y evaluar su efecto a partir del objetivo deseado y de distribuciones de probabilidad
Redes con aprendizaje supervisado
Redes con aprendizaje no supervisado
Estas redes no requieren influencia externa para ajustar los pesos de las conexiones entre neuronas. La red no recibe ninguna información por parte del entorno que le indique si la salida generada es o no correcta, así que existen varias posibilidades en cuanto a la interpretación de la salida de estas redes. En algunos casos, la salida representa el grado de familiaridad o similitud entre la información que se le está presentando en la entrada y las informaciones que se le han mostrado en el pasado.
Aprendizaje Hebbiano:
Consiste en el ajuste de los pesos de las coexiones de acuerdo con la correlación, así si las dos unidades son activas, se produce un reforzamiento de la conexión. Por el contrario cuando una es activa y la otra pasiva, se produce un debilitamiento de la conexión.
Aprendizaje competitivo y cooperativo
Las neuronas compiten y cooperan unas con otras con el fin de llevar a cabo una tarea dada. Con este tipo de aprendizaje se pretende que cuando se presente a la red cierta información de entrada, solo una de las neuronas de salida se active. Por otro tanto las neuronas compiten por activarse, quedando finalmente una, o una por grupo, como neurona vencedora.
Tipos de asociación entre las informaciones de entrada y salida.
Las RNA son sistemas que almacenan cierta información aprendida; está información se registra de forma distribuida en los pesos asociados a las conexiones entre neuronas de entrada y salida. existen dos formas primarias de realizar esa asociación de entrada /salida.
Una sería la denominada
heteroasociación
, que se refiere al caso en el que la red aprende parejas ed datos, de tal forma que cuando se presente cierta información de entrada, deberá responder generando la correspondiente salida
Heteroasociación
Autoasociativa
Es una red cuya principal misión es reconstruir una determinada información de entrada que se presenta incompleta o distorsionada, le asocia el dato almacenado más parecido.
Representación de la información de entrada y salida.
Las RNA , también pueden clasificarse según la forma en que se representa la información de entrada/salida. Así un gran número de redes, tanto los datos de entrada como de salida son de naturaleza analógica, cuando esto ocurre, las funciones de activación de las neuronas serán también continuas, del tipo lineal o sigmoidal. Otras redes sólo admiten valores discretos o binarios a su entrada, generando también unas respuestas en la salida de tipo binario. En esta caso, las funciones de activación son del tipo escalón. Existen también redes híbridas en las que las informaciones de entrada pueden ser valores continuos, aunque las salidas de la red son discretas.
Diferentes redes neuronales
SANRC
M. Minsky & D. Edmons. 1951
http://escuela.med.puc.cl/paginas/cursos/segundo/histologia/histologiaweb/paginas/ne35518.html
Stochastic Neural Analog Reinforcement Calculator
Es una red conectada de forma aleatoria con sinapsis del tipo Hebb. Esta fue implementada por Minsky durante sus estudios en hardware, usando tubos de vacuum, y posiblemente fue la primer maquina que "auto-aprendía".
Perceptrón
F.Rosemblatt 1957
Consisten en un conjunto de unidades de entrada, conectadas con varias capas de neuronas y una capa de salida.
La señal de entrada se propaga hacia delante.
El perceptrón es un discriminador que traza su entrada a un único valor de salida:
Tiene un vector de pesos reales con el que se calcula una suma ponderada y usa un umbral para representar el grado de inhibición de la neurona
El valor de salida se usa para clasificar el patrón (x) como un caso positivo o un caso negativo, en el caso de un problema de clasificación binario
Adaline
B. Widrow y T. Hoff 1959
La estructura del Adaline es prácticamente idéntica al perceptron simple, pero es un mecanismo físico capaz de realizar aprendizaje.

Es un elemento combinador adaptativo lineal, que recibe todas las entradas, las suma ponderadamente, y produce una salida.

Se compone de una sola capa de n neuronas, con m entradas.

Se diferencia con el perceptron simple en la manera de utilizar la salida en la regla de aprendizaje.
La salida que utiliza es directamente la salida de la red (real) teniendo en cuenta cuánto se ha equivocado.
Se utiliza la diferencia entre el valor real esperado d y la salida producida por la red y.
Para un patrón de entrada se tendrá en cuenta el error producido.
Fue una de las primeras capas de la red neuronal con un algoritmo de entrenamiento. La estructura real de la red y los métodos utilizados para establecer los pesos de interconexión cambiar de una estrategia neural a otro, cada uno con sus ventajas y desventajas. Las redes pueden propagar la información en una sola dirección, o pueden rebotar hacia atrás y adelante hasta que la auto-activación se produce en un nodo de la red y se asienta en un estado final. La capacidad de flujo bidireccional de entradas entre las neuronas / nodos fue producido con la teoría de resonancia adaptativa, la neocognitron y la red de Hopfield, y la especialización de estas capas de nodo para fines específicos se introdujo a través de la red híbrida primero.
Cognitrón
Kunihiko Fukushima 1980
Red de Hopfield
John Hopfield 1982
Se usan como sistemas de Memoria asociativa con unidades binarias. Están diseñadas para converger a un mínimo local
Algoritmo de retropropagación
es un algoritmo de aprendizaje supervisado que se usa para entrenar redes neuronales artificiales. El algoritmo emplea un ciclo propagación – adaptación de dos fases. Una vez que se ha aplicado un patrón a la entrada de la red como estímulo, este se propaga desde la primera capa a través de las capas superiores de la red, hasta generar una salida. La señal de salida se compara con la salida deseada y se calcula una señal de error para cada una de las salidas. Las salidas de error se propagan hacia atrás, partiendo de la capa de salida, hacia todas las neuronas de la capa oculta que contribuyen directamente a la salida
Uso de las RNA
Se utilizan en la predicción de eventos matemáticos y en el aprendizaje de las maquinas.
WATSON de IBM
Una computadora que aprende de
internet
Predicción del clima
como método numérico
NAR
Non linear autoregresive network
NARX
Non linear autoregresive exogenous neural networ
Full transcript