Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

VERS UN SYSTEME DE DIACRITISATION DU TEXTE ARABE

No description
by

felague miimou

on 30 June 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of VERS UN SYSTEME DE DIACRITISATION DU TEXTE ARABE

VERS UN SYSTEME DE DIACRITISATION DU TEXTE ARABE
Etudiant
Encadreur
LOUKAM Mourad
SAYEH Mohamed Amine
DOUARA Bachir Nacereddine
Introduction
La langue Arabe moderne standard (
MSA
)
l’absence
des signes diacritiques
La Diacritisation dans la langue Arabe
Consiste à attribuer
des signes diacritiques
Traitement Automatique De La Langue Arabe
Traduction Automatique
Reconnaissance Automatique de la Parole
Moteurs de Recherche
Vocalisation Automatisé
Problématique
l’absence
des signes diacritiques
icrOdev
O
pen Source
Exemple simple
Problème
d'ambigüités
Morphologiques
Syntaxiques
Comment l'Automatiser ?
Les voyelles courtes arabes ne sont pas des lettres de l’alphabet
Les signes diacritiques
Lettres de l'alphabet Arabe
Mr.
Mme.
BELKREDIM Fatma Zohra
Mr.
Mr.
Sémantiques
O
bjectif
système
un texte écrit en langue arabe non diacritisé
la diacritisation de texte
13
1
6
6
13 * 6 * 6 * 1 = 468 possibilités
Comment savoir l'ensemble de voyellesation correcte pour chaque mot ?
comment réduire les possibilités ?
Comment choisir en contexte la bonne voyellation parmi plusieurs ?
Comment éliminer l'ambigüités ?
Thème
Importance
Un
problème critique
dans le
Traitement Automatique
La Diacritisation
Mombre du jury
Mohamed ABBACHE
?
Comment diacritiser?
Quel est le mot qui convient?
Quel est le secret?
Comment faire son choix?
L’originalité
Méthodes statistiques.
Méthodes linguistique.
Schéma générale
La combinaison des deux méthodes.
Les Méthodes
Google Tashkeel
RDI ArabDiac© 4.0
Google Traduction
L’entreprise ARABI :
N’ont pas des logiciels libres.
Inconvénients
Ne partagent pas un grand nombre de caractéristiques.
Ne permet pas aux spécialistes et programmeurs la possibilité de développement de son code.
Conclusion
Les Dévelopeurs
En 2002, GAL a utilisé le Modèle de Markov caché HMM.
En 2012, Ahmed Hamdi a présenté l’utilisation « L’analyseur morphosyntaxique MADA »
En 2012, Taha Zerrougui a lancé un system de diacritisation libre (Open Source) appelé : « Mishkal .
Problèmes
Les articles scientifiques ne contients pas tout les details .
Les informations sur ce sujets sont trés rares .
Les ressources numeriques arabes sont rarement diacretisées .
implémentation de HMM au niveau de caractère
Merci
Full transcript