Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

RECONOCIMIENTO DE VOZ CON MATLAB PARA EL CONTROL DE EQUIPOS

No description
by

kenny Miranda Anaya

on 1 April 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of RECONOCIMIENTO DE VOZ CON MATLAB PARA EL CONTROL DE EQUIPOS

RECONOCIMIENTO DE VOZ CON MATLAB PARA EL CONTROL DE EQUIPOS ELECTRONICOS POR PERSONAS DISCAPACITADAS

Por:
Kenny Miranda Anaya


Tesis Dirigida por: REYNALDO DAVILA BUENDIA



Introducción
SISTEMA DE RECONOCIMIENTO DE VOZ ACTUAL

Actualmente es imprescindible contar con sistemas de control, seguridad de determinados ambientes o sitios donde se resguardan información valiosa, o donde se requiera contar con registros de accesos del personal a un centro de trabajo.
El presente desarrollo consiste en la utilización de herramientas computacionales y electrónicas para lograr el reconocimiento de voz humana y ejecutar una acción especifica que en este caso será control un determinado ambiente por una persona discapacitada.

DESCRIPCION
En esta presentación se estudian y analizan los diferentes pasos para el procesado digital de la voz aplicada al reconocimiento del habla. Se realiza mediante MATLAB (MATRIX LABORATORY), elaborando una serie de pasos desde la obtención de la voz hasta el reconocimiento propio.
PROBLEMA PRINCIPAL
El problema principal de este proyecto es la implementación de un sistema que utilizando el reconocimiento del habla como herramienta permita controlar dispositivos eléctricos usualmente encontrados en un ambiente doméstico y hacer este un espacio cómodo, flexible y moderno.

Adicionalmente este desarrollo pretende traer beneficios adicionales para personas discapacitadas, las cuales requieren de ayuda para realizar tareas cotidianas como encender la luz o control de algún equipo electrónico.
DELIMITACION
DELIMITACION TEORICA
Teorema de Nyquist
FFT (Transformada Rápida De Fourier)
Procesamiento Digital de Señales
Métodos de Reconocimiento de voz basada en comparación de patrones
Tarjeta Arduino LEONARDO
DELIMITACION SOCIAL
Este proyecto puede ser utilizado por todo el público en general, dedicadas al rubro tecnológico o comercial.
El reconocimiento de voz tiene amplias aplicaciones,
citando algunas áreas tenemos telecomunicaciones, control y automatización, biomédica, seguridad y protección de información o algún acceso, logrando obtener una gran herramienta de seguridad.

Justificación
El fundamento de la justificación se cimenta en que el control de factores como las ondas sonoras que un humano emite o produce, son características para controlar o automatizar a una distancia corta o media, en este sentido personas discapacitadas no pueden realizar funciones por contacto, pero sí podrían hacerlo lo control de voz a una distancia

El presente proyecto se justifica por su economía ya que al adquirir este proyecto es una gran alternativa porque el 70 % corresponde a software y según los parametros este puede ser modificado.

Objetivos
Desarrollar un sistema de Reconocimiento de Voz Robusto con MATLAB, para el control de equipos electrónicos controlados por usuarios discapacitados.
Controlar una tarjeta Arduino a partir del sistema de Reconocimiento de voz, se deberá enviar la señal detectada de voz para que la tarjeta Arduino controle un circuito, dispositivo o equipo determinado.

Formulación de Hipótesis
Los datos de aproximación de los valores de los coeficientes principales del reconocimiento de voz están alrededor de 4%.
El factor de ruido en el interior es menos intenso que en el exterior en un 15% como dato base, según las condiciones se incrementa el porcentaje.
El desarrollo de obtención de parámetros de obtención de la voz en comparación entre personas tiene un margen de adaptabilidad de un 6%.

IDENTIFICACION DE VARIABLES
VARIABLES DEPENDIENTES
Factor de Ruido, Establecimiento de Parámetros
Filtrado de Señal, Niveles de Saturación
Perturbaciones Externas
Portabilidad de la Implementación
Versatilidad

VARIABLES INDEPENDIENTES
Sonidos Fricativos, Altas Frecuencias
Ambientes de exposición
Sensibilidad del Micrófono
Velocidad del Proceso, Niveles de Voltaje
Coeficientes Cepstrales
Comparación de Patrones
Análisis por exposición

FUNDAMENTO TEORICO
Micrófono
Es un transductor electro acústico, que tiene como función transformar o traducir la presión acústica ejercida sobre su capsula por las ondas sonoras en energía eléctrica.

MATLAB
MATLAB es el nombre abreviado de “MATrix LABoratory”. Es un lenguaje de alto nivel y de ambiente interactivo que permite realizar tareas intensas y con una mayor velocidad que los lenguajes de programación comúnmente usados.

SECUENCIA DE DISEÑO
CONVERTIDOR A/D

Este módulo convierte la señal analógica de la voz, en una señal digital a través de la tarjeta de audio de la portátil.

MUESTREO

Teniendo en cuenta el teorema de muestreo de Nyquist y que el ancho de banda en el cual se encuentra la señal de voz humana es 100 - 3500Hz, la frecuencia de muestreo elegida es de 8000 muestras/s.
 
Debido a que el formato de audio wav es un formato propio de Windows, con 8 o 16 bits y con índices de muestreo recomendados de 11,025 kHz, 22,05 kHz o 44,1 kHz, para configurar la función wavrecord desde MATLAB se emplea una frecuencia de muestreo de la señal de voz de Fs=11025Hz

ELIMINACIÓN DE RUIDO
 
Para este propósito se escogieron segmentos de 10ms. Si en un segmento la energía promedio es menor que un valor umbral proporcional a la energía promedio de la señal entera, dicho segmento es descartado. El valor umbral escogido es 20%.

ELIMINACIÓN DE RUIDO
 
Para este propósito se escogieron segmentos de 10ms. Si en un segmento la energía promedio es menor que un valor umbral proporcional a la energía promedio de la señal entera, dicho segmento es descartado. El valor umbral escogido es 20%.

VENTANEO
 
En esta etapa, la señal de voz es dividida en intervalos de tiempo corto con el uso de ventanas. Como la señal de voz varían muy poco sus propiedades estadísticas en intervalos de tiempo pequeños, entonces, se puede suponer como un proceso estacionario para este intervalo de tiempo.


 
DETECCIÓN DE INICIO Y FIN
 
Este módulo recorta la señal de voz a límites bien definidos, donde se tiene la seguridad de la existencia de voz. Con esto, se evita necesidad de realizar cálculos y almacenar tramas que no contienen información. Es decir, solo se procesa la pronunciación de una palabra.

FFT
Full transcript