Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Procesamiento de lenguaje natural

PRESENTACION PARA SEMINARIO DE TECNOLOGIA
by

José Antonio Brenes Carranza

on 15 February 2012

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Procesamiento de lenguaje natural

Transductores y AFS (cont.) Introducción Reseña histórica Niveles de procesamiento (cont) Procesamiento de lenguaje natural 2010 CI-1322 Automatas y compiladores José Antonio Brenes Carranza / Francisco Cocozza Garro Agenda Introducción
Primeros pasos en el procesamiento
del lenguaje natural
Niveles del procesamiento





Enfoques




Transducers
Aplicaciones del PLN
Conclusiones
Bibliografía Aplicaciones de los NLP Bibliografía Morfológico
Léxico
Sintáctico
Semántico
De intención


Simbólico
Estadístico
Conexionista
LAL-XML PLN
Códigos de guerra
Machine translation (MT)
Chomsky: Syntactic structures
Lenguaje humano... ¿complejo? Nivel morfológico Niveles de procesamiento (cont) Nivel léxico Niveles de procesamiento (cont) Nivel sintáctico Niveles de procesamiento (cont) Nivel semántico Niveles de procesamiento (cont) Nivel de intención Enfoques Enfoque simbólico
Enfoque estadístico
Enfoque conexionista
Enfoque LAL-XML Enfoques (cont) Enfoque simbólico También llamado rule-based
Fenómenos lingüísticos
Definición de reglas previamente
Problema Tomado de: http://www.scielo.org.ve/scielo.php?pid=S0459-12832009000200004&script=sci_arttext Ejemplo Enfoques (cont) Enfoque estadísticos También conocido como basado en aprendizaje
Entrenamiento
Implementación: cadenas de Marco Enfoques (cont) Enfoque conexionista Red
Unidades de procesamiento interconectadas
Redes neuronales
Unidades sin significado propio Tomado de: http://www.ikkaro.com/redes-neuronales Enfoques (cont) Enfoque LAL-XML No un enfoque
Tags: finalidad
Elección del procesador sintáctico Ejemplo Tomado de:http://www.diseon.com/blog/conferencias-universidad-valencia/ Nociones básicas


Procesamiento de lenguaje natural
¿Que se busca? Lenguaje natural
Lenguaje artificial Niveles de procesamiento 5 niveles: Fig 1. Niveles de procesamiento de lenguaje natural Estructura de las palabras

Ejemplo: Insustituible

IN – SUSTITU- IBLE

Prefijo –Raíz- Sufijo Transductores Palabra como una unidad
"Tokenización"
Se utiliza un léxico

Basado en el léxico se define el
significado de la palabra Sin embargo el significado depende de otros factores Información gramatical y semántica de las palabras Estructura de las oraciones
Dependencia entre palabras
Se basa en la gramática del lenguaje
Ambigüedades Fig 2. Comparación entre complejidad y niveles de procesamiento Niveles de procesamiento Sistemas de NLP:
- Fuertes
- Débiles
"Autómata El"
(Léxicamente correcto, sintácticamente incorrecto)

"El autómata"
(Lexica y sintácticamente correcto) NLP Transductores y AFS Significado de la oración
Basado en significado individual de las palabras
que conforman la oración
El análisis sintáctico no puede llevarse acabo de
forma independiente al análisis semántico
Técnicas de desambiguación Anáforas Ejemplo Nivel semántico (cont) Anaforas Técnica que permite tratar ambigüedades
Basada en la semántica de una oración
Sustituye palabras que referencian a otro objeto.



Utilizan información recopilada en niveles más bajos Mi auto se averió. Se debe reparar.

Mi auto se averió. Mi auto se debe reparar.



Chomsky: "Colourless green ideas sleep furiously" Nivel más complejo
Se necesita:


Interpretar intención del mensaje Inferencia
Conocimiento del mundo real


- ¿Puedes mostrarme el correo?
- Si puedo. Utilizados como componentes de sistemas que implementan PLN
Tranductores:



Son Autómatas de Estado Finito (AEF)
Producen una salida Léxico
Reglas Ejemplo <lal:s>He bought <lal:seg id="w1">a
new car</lal:seg> yesterday.</lal:s>
<lal:s>She was very surprised to
learn that <lal:w ref="w1">it</lal:w>
was very expensive.</lal:s>
Etiquetas: <lal:s>, <lal:w>, <lal:id>, <lal:w ref=""> Ejemplo Ventajas de los transductores Al ser un Autómata de Estado finito podemos:




Ocupa menos espacio Minimizarlo
Determinarlo: NFA-->DFA
Optimizarlo Buscadores Estudios demuestran que composición de consultas efectivas es difícil

Desconocimiento de operadores booleanos u operadores de proximidad


Buscadores capaces de procesar consulta escrita de forma natural Aplicaciones de los NLP (cont.) Dificultades al procesar lenguaje natural Área de estudio
Complejidad -> Dificultad al analizar

Excepciones del lenguaje Homónimos Palabra: bigger Ejemplo Salido el sol por oriente
de rayos acompañado,
me dan un huevo pasado
por agua, blando y caliente,
con dos tragos del que suelo
llamar yo néctar divino,
y a quien otros llaman vino
porque nos vino del cielo. Baltasar de Alcázar (1530-1606) Conclusiones Difícil desarrollar procesadores de lenguaje natural
Elección del enfoque
Numero de niveles a implementar
Una buena opción: Transducers (transductores)
Internet y NLP Escogencia de palabras clave no es siempre la mejor Solucion Procesadores de texto



Ejemplo Corrección de errores ortográficos
Verificador gramatical Aplicaciones de los NLP (cont.) Traducción:
Primeros usos del procesamiento del lenguaje natural
Ha ido evolucionado, en aras de ofrecer una traducción más precisa
Actualmente




Enfoque Estadístico: SMT (Statical Machine Translation) Aplicaciones de los NLP (cont.) Preguntas/Respuestas:

Inicios: Eliza (psiquiatra), basado en reglas y en palabras clave Posibles usos: Servicio al cliente 24 horas [ALCAZABA] Moll, L & Pastor, A. (2010, Junio). La alcazaba. Vol. 18.
[AMLS] Aguilar, C., Martínez, G., Lara, L., & Sierra, S. (2008, noviembre) Análisis lingüístico
de definiciones en contextos definitorios. Universidad Nacional Autónoma de México.
[BJG] Boldt, O., Jürgensen, H., van Noord, G., & Gerdemann, D. (2001). An Extendible Regular Expression Compiler for Finite-State Approaches in Natural Language Processing. Springer.
[CNLP] Morten, C. & Chater, N. Connectionist Natural Language Processing: The State of the
Art. University of Warwick.
[CR] Church, K. W., & Rau, L. F. (1995, Noviembre). Commercial applications of natural language processing. Communications of the ACM, 38(11).
[Cox] Coxhead, P. (2007). An Introduction to Natural Language Processing (NLP). Recuperado 11 06, 2010, de University of Birminghan: http://www.cs.bham.ac.uk/~pxc/nlpa/AI-HO-IntroNLP.pdf
[Cox2] Coxhead, P. (2007). Natural Language Processing & Applications. Recuperado Noviembre 06, 2010, de University of Birminghan: http://www.cs.bham.ac.uk/~pxc/nlpa/2007/NLPA-Intro.pdf
[ELI] Weizenbaum, J. (1983, Enero). ELIZA - a computer program for the study of natural language communication between man and machine. Communications of the ACM, 26(1).
[FULL] Miller, S., Stallard, D., Bobrow, R., & Schwartz, R. A Fully Statistical Approach To Natural Language Interfaces.Cambridge.
[GKLL] Grover, C., Klein, E., Lapata, M. & Lascarides A. XML-Based NLP Tools for
Analysing and Annotating Medical Language. Universidad de Edimburgo.
[GPW] Guthrie, L., Pustejovsky, J., Wilks, Y., & Slator, B. M. (1996). The role of lexicons in natural language processing. ACM, 39(1).
[HI] ISAHARA, H. Resource-based Natural Language Processing. National Institute of
Information and Communications Technology.


[KL1] Karttunen, L. (1994). Constructing lexical transducers. COLING '94 Proceedings of the 15th conference on Computational linguistics. 1. ACM.
[KL2]Karttunen, L. (2001). Applications of Finite-State Transducers in Natural Language Processing. CIAA '00 Revised Papers from the 5th International Conference on Implementation and Application of Automata. ACM.
[LNLP] Liddy, E. (2001). Natural Language Processing. Encyclopedia of Library and Information Science, 2nd Ed. NY. Marcel Decker, Inc.
[MBL] Mitkov, R., Boguraev, B., & Lappin, S. (2001, Diciembre). Introduction to the special issue on computational anaphora resolution. ACM, 27(4).
[MTBH] Hutchins, W. (1995) Machine Translation: A Brief History. Oxford.
[NF] Natutal Finder. Recuperado Noviembre 20, 2010, de Bitext. The bit and text company: http://www.bitext.com/es/demo_naturalfinder.html
[QQ] Alshawi, H. Qualitative and Quantitative Models of Speech Translation. AT&T.
[RAEm] morfología. Recuperado Noviembre 06, 2010, de Real Academia Española: http://buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=morfolog%EDa
[RAEh] homónimo. Recuperado Noviembre 06, 2010, de Real Academia Española: http://buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=homonimo
[SMT] Cómo se crean las traducciones de Google. (n.d.). Recuperado Noviembre 06, 2010, de Statical Machine Translation: http://translate.google.com/about/intl/es_ALL/
[VSS] Cohn, N., (2003) Visual Syntactic Structure: Towards a Generative Grammar of Visual Language. Recuperado Noviembre 06, 2010, de: http://buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=homonimo
[WNMB] Watanabe, H., Nagao, K., McCord, M., & Bernth, A. An Annotation
System for Enhancing Quality of Natural Language Processing. IBM.
[WRS] Wermter, S., Riloff, E., & Scheler, G. (1996, Marzo) Connectionist, Statistical and
Symbolic Approaches to Learning for Natural Language Processing. Springer, 1 edition. Diay webon
Full transcript