Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

MODELE VECTORIEL

No description
by

on 5 June 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of MODELE VECTORIEL

MODELE VECTORIEL
1- Introduction
Le modèle vectoriel est une représentation mathématique du contenu d'un document.
PLAN
1- Introduction;
2- Définitions :
2.1- Espace termes;
2.2- Le vecteur document;
2.3- Le vecteur requête;
3- Représentation:
3.1- Les poids des termes;
4- Les mesures de similarité;
5- Avantages et limites;
6- Conclusion;
7- Bibliographie.



2.3- Vecteur Requête:
2- Définitions
2.1- Espace des termes:
3- Représentations
Recherche de l'Information Documentaire
2
Proposé par
Gerard Salton
dans les années 1970.
Il est utilisé en
recherche d'information
, et plus précisément la
recherche documentaire.
Le projet
SMART
.
T est composé de (t1,t2,....,ti,.... et tN)
Espace termes
terme 1
terme i
terme N
2.2- Vecteur Document:
3
4
Un document
Dj
est représenté par un vecteur
Dj
décrit dans l'espace vectoriel
R
définit par
T:
Dj=(d , d ,....., d , d )
1
j
j
j
j
2
i
N
vecteur document
poids du terme
i
dans le document
j
appartient à
[0,1]
Une requête
Q
est représentée par un vecteur
Q
décrit dans l'espace vectoriel
R
définit par
T
:
Q=( q , q ,......., q , q )
5
1
i
2
N
le vecteur requête
le poids du terme
i
dans la requête
Q
appartient à
[0,1]
ElZIRANI Imane
FARZANE Abir
AMEGRISSI Achraf

Terme 1
Terme 2
Terme 3
D1
D2
6
fig 1:
Représentation vectorielle de deux documents D1 et D2 dans un espace composée de trois termes
Depuis la représentation:
Terme 2
Terme 3
D1
D2
7
fig 2:
Représentation vectorielle de deux documents D1 et D2 et d'une requête Q
dans un espace composé de trois termes.
Terme 1
Q
+ proches
=
+similaires
1
3.1- Les poids des termes:
On écrit les requête en langage naturel
Le modele vectoriel qui choisit les termes à retenir
?
Comment
Un document:

" Le piano est un instrument de musique polyphonique........"
Les termes retenus et comptés sont ceux significatifs, les termes vides sont rejetés.
"Le piano est un instrument de musique polyphonique........"
"Le
piano
est un instrument de musique polyphonique........"
8
10
Rappel
:

tf
: La fréquence du terme
ti
dans le document
Dj
est égale au nombre d'occurrence de
ti
dans
Dj
.
i j
df
: La fréquence dans le corpus du terme
ti
est le nombre de document du corpus où
ti
apparaît.
i
idf
: l'inverse de la fréquence documentaire.
j
"Le
piano
est un
instrument
de musique polyphonique........"
"Le
piano
est un
instrument
de
musique
polyphonique........"
"Le
piano
est un
instrument
de
musique

polyphonique
........"
idf = log ( N / df )
i
j
n
le nombre de documents dans le corpus
11
Poids du terme i dans le document j
d = tf * idf
i j
i j
j
poids du terme i dans la requête Q
q = idf
i
i
12
4- Les mesures de similarité
on avait déjà dit que:
Terme 1
Terme 2
Terme 3
D1
D2
+ proches
=
+similaires
Terme 2
Terme 3
D1
D2
Terme 1
Q
14
La fonction de similarité:
RSV ( D , Q ) =
cos ( D , Q)
j
j
=
Q
Q
D
D
j
14
13
14
14
on a:
D
Q
=
K=1
N
d . q
K j
K
Q
D
j
=
K=1
N
K=1
N
(d ) .
(q )
2
2
k j
k
K=1
N
K=1
N
(d ) .
(q )
2
2
k j
k
RSV( D , Q )=
j
K=1
N
d . q
K j
K
5. Avantages et limites
Avantages:
Facile à utiliser.
Le modèle permet de renvoyer des documents qui répondent approximativement à la requête.
Permet de trier les documents selon leur degré de similarité avec la requête.
Limites:
Considérer que les termes de l’index sont tous indépendants.
Le langage de requête est moins expressif.
6-Conclusion
7- Bibliographie / Webographie:
Un modèle vectoriel étendu de recherche d’information adapté aux images Jean Martine, Yves Chiaramella, Philippe Mulhem.

Un modèle vectoriel relationnel de recherche d’information adapté aux images; Directeurs de thèse : Yves Chiaramella et Philippe Mulhem

Recherche d’Information (RI); Fondements, Philippe Mulhem, CLIPS-IMAG

http://www.peyronnet.eu/blog/modele-vectoriel-et-cosinus-de-salton/

http://perso.limsi.fr/xtannier/fr/Enseignement/m2r_tal/M2R_TAL_RI.pdf


Merci pour votre attention !
Full transcript