[PDF] Calcul du sens des mots arabes ambigus - Anis Zouaghi1 Mounir





Previous PDF Next PDF



Fiche de synthèse n° 5 Mouvements : position vitesse et accélération

À une direction correspond deux sens possibles. En général un mouvement est à 3 dimensions le vecteur position a donc 3 coordonnées.



Notion de vecteur

La grandeur des vecteurs sera la longueur mesurée sur l'axe. Comment décrire la direction et le sens d'un vecteur. On peut utiliser les points cardinaux.



Vecteurs et coordonnées

Le vecteur qui a une longueur nulle est appelé vecteur nul et on le note 0 . Ce vecteur n'a ni direction ni sens. Pour tout point A du plan



Calcul du sens des mots arabes ambigus - Anis Zouaghi1 Mounir

Apr 13 2006 permet de représenter chaque sens possible par un vecteur sémantique



FICHE PEDAGOGIQUE

Tous les points appartenant physiquement ou liés cinématiquement à un solide S en translation ont le même vecteur vitesse (même direction même norme



2.7 Vecteurs libres de lespace physique.

Si a ou b est nul ou si les deux vecteurs sont parall`eles leur produit vectoriel est le vecteur nul 0. En fonction de cette définition



1. Les vecteurs

La translation qui transforme A en A' transforme de la même façon B en B'



Partie 1 : Produit dun vecteur par un réel

Remarques : • Les vecteurs 5 ? et ? ont la même direction et le même sens. • La norme du vecteur 5 ? est égale à 5 fois la norme du vecteur ?.



LES VECTEURS

Y?. ?. Page 9. 9 sur 19. Yvan Monka – Académie de Strasbourg – www.maths-et-tiques.fr. 2) Soit trois points A B et C. Représenter le vecteur YYYYY? 



EXERCICES DAUTOMATISATION EXERCICES

En déduire la direction et le sens de la résultante des forces qui s'appliquent sur le système {parachutiste + parachute}. 1. Le vecteur variation de vitesse 



[PDF] Chapitre 1 Rappel sur les vecteurs - Cours

La direction d'un vecteur est déterminée par une demi-droite appelée support du vecteur dont le sens est celui allant de l'origine de la demi-droite vers l' 



[PDF] VECTEURS ET REPÉRAGE - maths et tiques

http://www maths-et-tiques fr/telech/Lecture_coord pdf Partie 2 : Coordonnées d'un vecteur Méthode : Déterminer les coordonnées d'un vecteur par calcul



[PDF] TRANSLATION ET VECTEURS - maths et tiques

Les couples de points (A ; A') (B ; B') et (C ; C') définissent un vecteur caractérisé par : - une direction : celle de la droite (AA') - un sens : de A vers 



[PDF] Chapitre 8 : Vecteurs - lycée Joubert–Maillard

Propriété : Lorsque A et B sont deux points distincts le vecteur ? AB est caractérisé par : • une direction : celle de la droite (AB) • un sens : de A 



[PDF] VECTEURS - Pierre Lux

Il y a deux sens de parcours sur la droite (AB) : de A vers B ou de B vers A B) VECTEURS Deux points distincts A et B définissent deux vecteurs notés



[PDF] Un vecteur est un segment de droite orienté Le premier point A es

Deux vecteurs sont opposés lorsqu'ils ont : - même direction - même longueur et - des sens contraires Les vecteurs AB et BA sont opposés On 



[PDF] Introduction vecteurs - Sofad

Nous y décrivons un vecteur géométrique et un vecteur algébrique de même que la notation et le symbolisme propres aux vecteurs Nous étudions les opérations 



[PDF] Les vecteurs - Labomath

Deux vecteurs sont égaux lorsqu'ils ont même longueur même direction et même sens C'est pour cette raison qu'on représente les vecteurs par des flèches Les 



[PDF] Vecteurs - Translations - Cours

Une direction n'est pas une figure géométrique Elle est représentée par une droite ( quelconque ) de son groupe Sens : Sur une droite il 



[PDF] Chapitre I Les vecteurs

1 VECTEURS ET REPRÉSENTATION GRAPHIQUE 1 1 Notation et représentation graphique Soit un vecteur donné caractérisé par sa direction son sens et sa 

  • Quel est le sens d'un vecteur ?

    Le sens du vecteur est le sens du déplacement de son origine vers son extrémité et sa norme est la distance entre les deux points (ou la longueur du segment entre les deux points).
  • Comment trouver le sens d'un vecteur ?

    La direction du vecteur est celle de la 'droite' dans laquelle est inclus le vecteur, le sens est donné par l'orientation du segment: 'vers la gauche' ou bien 'vers la droite', la norme correspond à la longueur du segment. Le sens est déterminé par la fl?he.
  • Qu'est-ce que la direction et le sens d'un vecteur ?

    La direction, c'est la droite du vecteur, plus particulièrement son inclinaison. On peut avoir un vecteur horizontal, vertical, ou encore en diagonale. Le sens, c'est le bout de la fl?he du vecteur.
  • Par convention, l'orientation d'un vecteur est donnée par l'angle qu'il forme avec l'axe des x positifs dans le sens antihoraire. Le vecteur ?u dans l'image en est un exemple. Toutefois, il est possible qu'un angle ait une valeur négative, comme le vecteur ?v de la même image.

RECITAL 2006, Leuven, 10-13 avril 2006

Calcul du sens des mots arabes ambigus

Anis Zouaghi

1 , Mounir Zrigui 1 , Mohamed Ben Ahmed 2 1

Unité de Monastir - Labo RIADI

anis.zouaghi@riadi.rnu.tn ; mounir.zrigui@fsm.rnu.tn 2

Université de la Mannouba - Labo RIADI

mohamed.benahmed@riadi.rnu.tn

Résumé

Nous présentons dans cet article un analyseur sémantique pour la langue arabe. Cet analyseur contribue à la

sélection du sens adéquat parmi l'ensemble des sens possibles que peut recevoir un mot hors contexte. Pour

atteindre cet objectif, nous proposons un modèle vectoriel qui permet de lever les ambiguïtés locales au niveau

de la phrase et celles relevant du domaine. Ce modèle est inspiré des modèles vectoriels très utilisés dans le

domaine de la recherche documentaire.

Mots-clef : désambiguïsation sémantique, modèle vectoriel, traitement de la parole arabe, influence sémantique.

Abstract

This article describes a semantic analyzer for the Arabic language. This analyzer contributes to the selection of

the adequate meaning among the set of possible meanings for a given word. To achieve this goal, we propose a

vectorial model that allows lifting local ambiguities on the level of the sentence and those concerning semantic

domains. This model is inspired from vector models commonly used in information retrieval.

Keywords: semantic disambiguation, vector models, processing of Arabic speech, pertinent context, semantic

influence.

1. Introduction

Notre travail s'intègre dans le cadre du projet Oréodule : un système de reconnaissance, de

traduction et de synthèse de la parole spontanée. L'objectif de cet article est de présenter un

analyseur sémantique des mots arabes ambigus. Contrairement à la plupart des analyseurs utilisés dans les systèmes de compréhension de la parole, basés sur les modèles HMM

(Minker, 1999 ; Bousquet, 2002), notre analyseur est basé sur un modèle vectoriel. Ce modèle

permet de représenter chaque sens possible par un vecteur sémantique, composé des mots ayant une affinité sémantique avec le mot ambigu. Ce modèle est inspiré des modèles vectoriels utilisés dans le domaine de la recherche documentaire. Bien que la

désambiguïsation sémantique possède un enjeu important dans les applications TALN (Ide et

al., 1998), les ressources nécessaires pour résoudre ce problème restent presque indisponibles

pour la langue arabe. Ceci nous a amené à créer notre propre corpus d'entraînement, et de

l'étiqueter sémantiquement en attribuant à chaque mot ambigu l'ensemble de traits

sémantiques Tse approprié, où chaque Tse est constitué de 3 traits et représenté comme suit

Tse = (domaine, classe sémantique, trait micro sémantique).

2. Méthode de calcul du sens

ANIS ZOUAGHI, MOUNIR ZRIGUI, MOHAMED BEN AHMED

RECITAL 2006, Leuven, 10-13 avril 2006 774

L"interprétation d"un mot ambigu est obtenue suite à la coopération de 2 étapes d"analyse. La

1 re

étape correspond à la levée des ambiguïtés relevant du domaine. Elle permet de déterminer

les ensembles Tse représentant une probabilité faible pour décrire le sens du mot ambigu dans

le texte où il est apparu, alors que la 2 e étape correspond à une analyse plus fine. Cette

analyse est basée sur l"étude des affinités sémantiques entre le mot ambigu et les mots qui

l"entourent dans l"énoncé.

3. Étape de levée des ambiguïtés relevant du domaine

Au cours de cette étape d'analyse, nous considérons l'influence du domaine sur la

caractérisation du sens d'un mot. Ainsi, notre modèle considère une fenêtre d'analyse de taille

assez grande (égale à la longueur du texte). À partir de l'inventaire des sens possibles du mot

ambigu, est calculée la probabilité d'interprétation du mot MA avec chaque Tse i possible.

Cette probabilité est calculée comme suit :

P ARD (Tse i / MA) = P(D k ) × P(Tse i / MA, D k ) (1) L'équation (1) tient compte de l'influence du domaine dans le calcul du sens de MA. Ceci par la considération des 2 probabilités P(D k ) et P(Tse i / MA, D k ). P (D k ) calcule la probabilité que le texte auquel appartient MA appartient au domaine D k ; P(Tse i / MA, D k ) est la probabilité que le sens Tse i soit affecté au mot MA sachant que le texte appartient au domaine D k

3.1. Calcul du domaine décrit par un texte

L'identification du domaine auquel appartient le mot ambigu est obtenue à partir de la probabilité P(D k ), en se basant sur un modèle vectoriel. Ce modèle permet de caractériser chaque domaine par un ensemble de mots-clés. À chaque mot-clé est attribué un poids p ij en utilisant la méthode Tf-Idf (Term frequency - Inverse document frequency). Ainsi le poids p ij d'un mot m i dans un texte décrivant un domaine D j est obtenu à partir de l'équation suivante : p ij = [tf (m i , D j )×log (n / df (m i ))] / [tf (m i , D j )+0.5+(1.5×n×l(D j Dk

Dkl)() × log(n+1)] (2)

où n et l(D k ) désignent respectivement le nombre des domaines considérés et la longueur de l'ensemble des textes représentant le domaine D k ; le terme tf (m i , D j ) désigne le nombre d'occurrences de m i dans D j ; df (m i ) correspond au nombre de domaines où apparaît m i À partir de ces poids, est associé à chaque domaine D j considéré un vecteur caractéristique présenté comme suit : D j =(p 1j , p 2j , p 3j ,.., p ij ,..., p nj

tous les mots considérés pertinents pour l'identification de chacun des domaines considérés.

Nous définissons la probabilité notée P (D jT ) qu'un texte T décrit un domaine D j dont le vecteur caractéristique est D j = (p 1j , p 2j , p 3j ,.., p ij ,..., p nj ), comme la somme des probabilités p ij des mots pertinents rencontrés dans le texte T : P (D j ) = P (D jT ?Tmi pij (3)

3.2. Calcul du sens en considérant l'influence du domaine

Comme signalé ci-dessus, notre modèle calcule le sens d'un mot ambigu MA en tenant compte de l'influence sémantique du domaine sur celui-ci. Ceci est réalisé en utilisant la probabilité conjointe P (Tse i / MA, D k ) dont la formule est donnée par l'équation (4) suivante

P (Tse

i / MA, D k ) = N (Tsei(MA), D k ) / N (MA, D k ) (4)

CALCUL DU SENS DES MOTS ARABES AMBIGUS

RECITAL 2006, Leuven, 10-13 avril 2006 775

où Tse i (MA) est l"instanciation du sens de MA par l"ensemble Tse i , et le terme N (Tse i (MA), D k ) désigne le nombre d"interprétation de MA par Tse i dans le domaine D k . N(MA, D k ) est en faite tf (MA, D k ) qui désigne le nombre d"occurrences de MA dans D k

4. Étape de levée des ambiguïtés locales

Cette étape permet de calculer le sens adéquat du mot ambigu en se basant sur une analyse

sémantique locale. Pour cela, nous considérons une fenêtre d'analyse plus réduite que celle

considérée dans la première étape lors de la levée des ambiguïtés relevant du domaine. La

taille de cette fenêtre est égale à la longueur du contexte droit du mot cible dans la phrase où

il est apparu. Pour lever les ambiguïtés locales, nous représentons chaque sens possible d'un

mot ambigu MA par un vecteur sémantique noté . Ce vecteur permet de caractériser chaque sens possible Tse j de MA par les mots qui ont une influence sémantique sur MA. À chacun de ces mots est attribué un poids q ij déterminé à partir de la formule (5) suivante : q ij = N (m i , Tse j (MA) / N (m i ) (5) où le terme N (m i , Tse j (MA)) désigne le nombre de cooccurrence du mot m i avec MA dans une même phrase, sachant que ce dernier est instancié par le sens Tse j , et N(m i ) désigne le nombre total d'occurrence de m i avec MA dans un même contexte (phrase). Ce poids q ij peut

être aussi obtenu en utilisant une des méthodes de mesure de la similarité sémantique entre

deux mots, telle que l'information mutuelle moyenne (Rosenfeld, 1994). À partir de ces poids q ij

est associé à chaque sens possible de MA un vecteur sémantique caractéristique présenté

comme suit : = (q 1j, q

2j, ..,

q kj, ..., q nj ). Les mots considérés comme ayant une influence sémantique sur MA sont les mots dont le poids q ij est supérieur à un seuil donné.

Pour identifier le sens Tse

j adéquat à attribuer au mot MA dans une phrase P, nous utilisons le modèle P AL décrit comme suit : P AL (Tse j /MA) = ?Cdmi qij (6) Ce modèle définit la probabilité d'affecter le sens Tse j au mot MA, et dont le vecteur sémantique est = (q 1j, q

2j, ..,

q kj, ..., q nj ), comme la somme des probabilités q ij des mots m i influant sur le sens de MA, rencontrés dans le contexte droit Cd du mot MA.

5. Analyseur sémantique des mots ambigus

Notre modèle calcule le sens d'un mot en tenant compte des ambiguïtés locales et des ambiguïtés relevant du domaine. Nous avons ainsi combiné les 2 modèles P ARD et P AL , à partir de l'équation suivante : P(Tse i /MA) = λ×P ARD (Tse i /MA) + ρ×P AL (Tse i /MA) (7) avec λ et ρ deux coefficients à déterminer empiriquement à travers des tests et des comparaisons de pertinence.

6. Application du modèle

Pour l'évaluation de notre modèle, nous avons utilisé 100 énoncés (859 mots) décrivant des

demandes de renseignements ferroviaires en langue arabe. Nous avons testé chacun des

modèles définis séparément, afin de pouvoir juger de leur efficacité et étudier leurs limites.

En ce qui concerne le modèle P

AL , nous l'avons appliqué pour déterminer le rôle sémantique accompli par une ville (ville de départ, ou d'arrivée, ou de stop ou de correspondance). Pour

ANIS ZOUAGHI, MOUNIR ZRIGUI, MOHAMED BEN AHMED

RECITAL 2006, Leuven, 10-13 avril 2006 776

évaluer le modèle P

ARD , nous l"avons appliqué pour la détermination du type et de l"acte illocutoire accompli par un énoncé.

6.1. Évaluation du modèle de calcul du domaine

Comme mentionné dans le paragraphe 3.1, chaque domaine est caractérisé par un ensemble de mots-clés. Dans notre cas il s'agit d'attribuer à chaque type d'énoncé, un vecteur caractéristique D j . Pour cela, nous avons utilisé 5 vecteurs pour la représentation des 5 types

d'énoncés considérés (voir tableau 1). Pour réduire la dimension de ces vecteurs, les mots-

clés dérivés d'une même racine sont regroupés en une seule entrée. Par exemple, les mots-

clés (réserver). Les ensembles de termes { Type de l'énoncé Mots-clés Vecteurs caractéristiques (les valeurs sont obtenues en utilisant l'équat. 2)

Demande d"horaire ΕΎϗϭ΄Α ,ΕΎϗϭϷ΍ ,ΕΎϗϭ΃ ,ΖϴϗϮΗ ,ϰΘϣ ,ΔϋΎγ ,ϱ΃ ,ϡΎϳϷ΍(0.274; 0; 0; 0; 0; 0; 0; 0; 0.351; 0.142;

0.351; 1.111; 0)

0; 0.577)

0; 0; 0)

Demande de trajet ήΒόϳ ,έϮΒόϟ΍ (0; 0,661; 0,075; 0; 0; 0; 0; 0; 0; 0.075;

0; 0; 0)

0)

Tableau 1. Vecteurs caractéristiques D

j associés à chaque type d'énoncé Ainsi chaque vecteur caractéristique est de la forme D j

ϰΘϣ ,ΔϋΎγ ,ϱ΃ ,ϡΎϳϷ΍, ΔϔϳήόΗ). En appliquant par exemple ce modèle au calcul du type de l'énoncé (E)

suivant :

ΕέΰϨΑ ϭ ΔγϮγ ϦϴΑ Γήϔδϟ έΎτϘϟ΍ ϲϓ ϝϭϷ΍ ϒϨμϟ΍ Ϧϣ ήϛ΍άΗ 4 ΰΠΣ Ϊϳέ΃ Je veux réserver 4 billets de classe

première dans le train pour un voyage entre Sousse et Bizerte). On trouve que cet énoncé est

de type demande de réservation (P (DRéservation E ) = 1,243). Ce modèle est efficace face aux énoncés ne contenant pas des autocorrections. Pour améliorer les performances du modèle face aux autocorrections, nous avons introduit dans les vecteurs D j des classes de mots C tij

Une classe C

tij est appelée modificateur du poids du mot i dans les énoncés de type D j, enquotesdbs_dbs14.pdfusesText_20
[PDF] le sens d'un verbe

[PDF] le sens de l'eau

[PDF] le sens de l'effort

[PDF] le sens de l'effort episode 2

[PDF] le sens de l'effort episode 4

[PDF] le sens de l'effort streaming

[PDF] le sens de l'humus

[PDF] le sens de la fete

[PDF] le sens de la fête amazon prime

[PDF] le sens de la fête netflix

[PDF] le sens de la fête watch online

[PDF] le sens de la vie lyrics

[PDF] le sens de lecture anglais

[PDF] le sens de lecture d'une image

[PDF] le sens de lecture traduction anglais