Apport de la diacritisation de lanalyse morphosyntaxique de larabe
08-Jun-2012 Apport of Diacritization in Arabic Morpho-Syntactic Analysis ... langue arabe se caractérise par l'absence des voyelles courtes ...
Lapport du monde arabe à la science - 5 à 7 de lAcadémie des
03-Dec-2019 ... -sciences.fr/fr/Seances-publiques/5-a-7-apport-sciences-arabes.html ... comprendre que l'intérêt pour cette science en arabe a été en ...
38 LINFLUENCE ARABE DANS LE SUD-EST DE MADAGASCAR L
graphie d'origine arabe. Naturellement il y a lieu d'ecartor tout autre apport
LAPPORT DE LA TRADUCTION ARABE DE STÉPHANE À L
L'APPORT DE LA TRADUCTION ARABE DE. STÉPHANE À L'ÉTABLISSEMENT DU TEXTE GREC. DU DE MATERIA MEDICA DE DIOSCORIDE. Marie Cronier.
LApport scientifique arabe à travers les grandes figures de lépoque
Ainsi une large part du volume IV de la nouvelle édition de cette histoire est consacrée à l'apport de l'Islam et du monde musulman aux progrès scientifiques
Traitement Automatique des Langues et Recherche dInformation en
03-May-2010 d'Information en langue arabe dans un domaine de spécialité: Apport des connaissances morphologiques et syntaxiques pour l'indexation.
Indépendance et Tentatives de Regroupement des Pays Arabes du
manière approfondie du nationalisme arabe et des tentatives durant tout le moyen-âge de l'apport des Arabes à la civilisa humaine.
Observations sur les études philologiques en arabe classique
Or la grammaire arabe que l'on possede pour l'arabe classique a cette pas de l'apport de base des grammairiens arabes; ils sont plut6t & con-.
Médecine grecque et médecine arabe: transmission du savoir entre
27-Nov-2017 Apport des sciences arabes. Médecine grecque et médecine arabe: transmission du savoir entre Orient et Occident.
Lindustrie Sidérurgique dans le Monde Arabe
L'Union compte près de 80 sociétés Membres de 15 Pays Arabes Quel est l'apport de l'Union Arabe du Fer et de l'Acier dans le.
Searches related to apport en arabe PDF
Les arabes et en particulier les musulmans se sont intéressés à l’astronomie pour des raisons très pratiques : • Se repérer dans le désert pour les populations nomades ou en mer Mais surtout pour motif religieux : •Déterminer les heures des cinq prières quotidiennes
Combien de mots couramment utilisés en français portent la marque de l’arabe?
Plus de 500 mots couramment utilisés en français portent la marque de l’arabe. Entretien | Alcool, mousson, douane... La langue arabe a irrigué le français, en particulier depuis le Moyen ge, selon des voies parfois surprenantes, révélées par le lexicographe Roland Laffitte.
Quels sont les inconvénients de la langue arabe ?
L’inconvénient avec la langue arabe, c’est qu’elle utilise un alphabet très différent du français, ce qui rend les communications parfois complexes. Heureusement, des outils existent pour pouvoir écrire en arabe, sur téléphone comme sur ordinateur.
Comment pratiquer l’arabe?
Pour ce faire, pratiquez votre arabe lorsque vous vous exprimez. Vous pouvez aussi converser avec des natifs ou intégrer des groupes de discussion. Enfin, n’hésitez pas à vous informer sur les types d’exercices, les consignes, etc.
Combien de mots portent la marque de la langue arabe?
Le lexicographe Roland Laffitte estime qu’environ 400 à 800 mots couramment utilisés en français portent la marque de la langue arabe. Comment ces mots sont-ils arrivés dans notre langue ?
École Centrale de Nantes
Université de Nantes
École des Mines de Nantes
ÉCOLE DOCTORALE STIM
" SCIENCES ET TECHNOLOGIES DE L'INFORMATION ET DES MATÉRIAUX »
Année 2008
N o attribué par la bibliothèqu eTraitement Automatique des Langues et Recherche
d'Information en langue arabe dans un domaine de spécialité : Apport des connaissances morphologiques et syntaxiques pour l'indexationTHÈSE DE DOCTORAT
Discipline : INFORMATIQUE
Présentée
et soutenue publiquement parSiham Boulaknadel
Le 18 Octobre 2008, devant le jury ci dessous
Président : José Martinez LINA, Univ.Nantes Rapporteurs : Josiane Mothe, Professeur IRIT, Univ.ToulouseAbdelfatah Hamdani, Professeur IERA
Examinateurs : Béatrice Daille, Professeur LINA, Univ.Nantes Driss Aboutajdine, Professeur FSR, Univ.Mohammed V Elqadi Abderrahim, Professeur Assistant EST, Meknès Directeur de thèse : Pr. Béatrice Daille / Pr. Driss Aboutajdine Laboratoire: LABORATOIRE D'INFORMATIQUE DE NANTES ATLANTIQUE.CNRS FRE 2729. 2, rue de la Houssinière, BP 92 208 . 44 322 Nantes, CEDEX 3. N° ED 503- 020
favet neptunus euntiTRAITEMENT AUTOMATIQUE DES LANGUES ET
RECHERCHE D"INFORMATION EN LANGUE ARABE :
APPORT DES CONNAISSANCES MORPHOLOGIQUES ET
SYNTAXIQUES POUR L"INDEXATION
SihamBOULAKNADEL
Université de Nantes
SihamBOULAKNADEL
Traitement automatique des langues et Recherche d"information en Langue arabe : apport des connaissances morphologiques et syntaxiques pour l"indexation xxiiiCe document a été préparé avec L
ATEX2"et la classethese-LINAversion 0.92 de l"as-
sociation de jeunes chercheurs en informatique LOGIN, Université de Nantes. La classe these-LINAest disponible à l"adresse :Impression : memoire.tex - 2/2/2009 - 12:25
Révision pour la classe : $Id: these-LINA.cls,v 1.3 2000/11/19 18:30:42 fred ExpRésumé
La Recherche d"Information a pour objectif de fournir à un utilisateur un accès facile à l"information
qui l"intéresse, cette information étant située dans une masse de documents textuels. Afin d"atteindre
cet objectif, un système de recherche d"information doit représenter, stocker et organiser l"information,
puis fournir à l"utilisateur les éléments correspondant au besoin d"information exprimé par sa requête.
La plupart des systèmes de recherche d"information (SRI) utilisent des termes simples pour indexer
et retrouver des documents. Cependant, cette représentation n"est pas assez précise pour représenter le
contenu des documents et des requêtes, du fait de l"ambiguïté des termes isolés de leur contexte. Une
solution à ce problème consiste à utiliser des termes complexes à la place de termes simples isolés.
Cette approche se fonde sur l"hypothèse qu"un terme complexe est moins ambigu qu"un terme simpleisolé. Notre thèse s"inscrit dans le cadre de la recherche d"information dans un domaine de spécialité
en langue arabe. L"objectif de notre travail a été d"une part, d"identifier les termes complexes présents
dans les requêtes et les documents. D"autre part, d"exploiter pleinement la richesse de la langue en
combinant plusieurs connaissances linguistiques appartenant aux niveaux morphologique et syntaxique, et de montrer comment l"apport de connaissances morphologiques et syntaxiques permet d"améliorerl"accès à l"information. Ainsi, nous avons proposé une plate-forme intégrant divers composants dans le
domaine public; elle conduit à montrer l"apport significatif et tranché de plusieurs de ces composants.
En outre, nous avons avons défini linguistiquement les termes complexes en langue arabe et nous avons
développé un système d"identification de termes complexes sur corpus qui produit des résultats de bonne
qualité en terme de précision, en s"appuyant sur une approche mixte qui combine modèle statistique et
données linguistiques viiRemerciements
munications (LRIT) de la Faculté des Sciences de Rabat. Il a été effectué dans le cadre du programme
de la co-tutelle, en collaboration avec le laboratoire d"Informatique de Nantes Atlantique (LINA) de l"université de Nantes, France.Je tiens tout d"abord à exprimer ma profonde gratitude à Monsieur Driss Aboutajdine, professeur à la
Faculté des Sciences de Rabat et responsable du LRIT, pour m"avoir encadré avec un intérêt constant et
une grande compétence, pour sa disponibilité, son soutien, ses conseils, et les encouragements qui m"ont
permis de mener à bien ce travail.pour son aide précieuse, les efforts qu"elle a prodigués pour l"accomplissement de ce travail, ainsi pour
la qualité de l"encadrement qu"elle m"a assuré.Je tiens aussi à remercier Monsieur Abderrahim El Qadi, professeur assistant à l"école Supérieure de
Technologie de Meknès, pour son co-encadrement, pour les discussions fructueuses que nous avons eues
et pour l"intérêt qu"il a bien voulu porter à mon travail.Que Monsieur José Martinez, professeur à l"université de Nantes, trouve ici l"expression de mes
remerciements les plus sincères d"avoir accepté de présider cette thèse.Je suis très honorée par la présence de Madame Josiane Mothe, professeur à l"université de Tou-
louse, France, et Monsieur Abdelfatah Hamdani, professeur à l"Institut des Etudes et de Recherches pour
l"Arabisation. Qu"ils trouvent ici mes sincères remerciements d"avoir accepté d"être rapporteurs de ce
travail.J"exprime également mes remerciements à tous les membres du Comité Scientifique de la coopéra-
tion franco-marocaine dans le domaine des STIC (programme géré par l"INRIA du côté français).
pour m"avoir permis d"effectuer ce travail dans de bonnes conditions matérielles.Je remercie toutes les personnes qui ont participé de manière directe ou indirecte à la concrétisation
de ce travail et plus particulièrement mon amie Fadoua Ataa-Allah, qui m"a accompagné au cours de mes
années de thèse. Qu"elle trouve ici une expression de ma reconnaissance.Je voudrais aussi remercier tous mes collègues du laboratoire LRIT qui ont rempli ces années de
complicité de moments agréables ainsi que l"équipe TALN dont la compagnie en contexte professionnel
est réellement enrichissante. Je remercie ma famille qui a su manifester son soutien et m"entourer d"affection pendant les moments difficiles. ixSommaire
Résumé
Avant-Propos
............................................................................... ixTable des matières
......................................................................... xiii1 Introduction
............................................................................. 12 Recherche d"information
................................................................. 53 Impact du TAL en RI
................................................................... 174 La Langue Arabe : état de l"art
......................................................... 295 Identification des termes complexes
6 RI en langue arabe
7 Conclusion et perspectives
Bibliographie
.............................................................................. 93Bibliographie
.............................................................................. 93Liste des tableaux
......................................................................... 101Table des figures
.......................................................................... 103A Catégories grammaticales
.............................................................. 107B Anti-dictionnaire
...................................................................... 109C Requêtes
.............................................................................. 111D Transcription de Buckwalter
........................................................... 113 xiTable des matières
Résumé
viiAvant-Propos
ixTable des matières
xiii1 Introduction
11.1 Organisation de la thèse
32 Recherche d"information
52.1 Introduction
52.2 Processus de recherche d"information
52.3 Modèles de RI
62.3.1 Modèles ensemblistes
72.3.2 Modèles algébriques
72.3.3 Modèles probabilistes
92.3.4 Description détaillée du modèle vectoriel
92.3.5 Critères d"évaluation des SRI
142.4 Conclusion
163 Impact du TAL en RI
173.1 Impact des connaissances morphologiques en recherche d"information
173.1.1 Traitement de la variation morphologique en RI
173.2 Impact des connaissances syntaxiques en recherche d"information
183.2.1 Notions de syntaxe
193.2.2 Utilisation des connaissances syntaxiques au sein d"un SRI
203.2.3 Adaptation des SRI pour l"intégration des connaissances syntaxiques
233.3 Impact des connaissances sémantiques en RI
243.3.1 Types de connaissances sémantiques utilisables en RI
243.3.2 Approches d"intégration des connaissances sémantiques
243.4 Conclusion
264 La Langue Arabe : état de l"art
294.1 la langue Arabe et ses variantes
304.2 Grammaire et caractéristiques de l"arabe
314.2.1 Voyellation
314.2.2 Flexion
324.2.3 Agglutination
334.2.4 Pro-drop (= à sujet pronominal vide)
334.3 Les parties de discours en arabe
334.3.1 Les parties de discours classiques
34xiii xiv TABLE DES MATIÈRES
4.3.2 Classification récentes des unités lexicales de l"arabe
344.4 Ressources linguistiques : état des lieux
354.4.1 Lexiques
364.4.2 Corpus
384.5 Outils de traitement automatique de la langue arabe
414.5.1 Analyseurs morphologiques
424.5.2 Les concordanciers
434.5.3 Racineurs
434.6 Conclusion
455 Identification des termes complexes
475.1 Spécifications linguistiques des termes complexes
475.1.1 Termes complexes
485.1.2 Typologie, composition des termes complexes terminologiques du domaine de l"environnement
495.1.3 Variation des termes complexes
525.2 Extraction automatique des termes complexes
555.2.1 Les modèles linguistiques
555.2.2 Les modèles statistiques
565.2.3 Les modèles hybrides
565.2.4 Principe de la méthodologie
575.2.5 Analyse linguistique
585.2.6 Analyse statistique
615.3 Conclusion
646 RI en langue arabe
676.1 La collection de test : corpus en langue arabe standard dans un domaine de spécialité[AR¡ENV]
676.1.1 Moissonage du web
676.1.2 Normalisation
686.1.3 Caractéristiques de la collection
686.1.4 Lexique et métriques
686.1.5 Distribution des catégories grammaticales
706.1.6 Requêtes
716.2 Architecture de connaissances linguistiques en RI
716.2.1 Connaissances linguistiques
726.2.2 Architecture envisagée
736.3 Modèles de représentation
736.3.1 Influence des schémas de pondération
746.3.2 Apport du modèle LSA pour le modèle vectoriel
746.3.3 Influence des schémas de pondération sur le choix de la dimension réduite k du modèle LSA
766.3.4 Apport de pondération des requêtes
766.4 Impact respectif des connaissances linguistiques sur les performances des SRI
796.4.1 Racinisation
796.4.2 Syntagmes nominaux
836.4.3 Termes complexes
846.5 Conclusion
86TABLE DES MATIÈRES xv
7 Conclusion et perspectives
897.1 Identification des termes complexes et ses variantes
897.2 Evaluation des traitements linguistiques en recherche d"information
907.3 Perspectives
91Bibliographie
93Bibliographie
93Liste des tableaux
101Table des figures
103A Catégories grammaticales
107B Anti-dictionnaire
109C Requêtes
111D Transcription de Buckwalter
113CHAPITRE1
Introduction
L"évolution très rapide d"Internet a conduit à révéler la RI au grand jour, notamment par le biais
des moteurs de recherche. La profusion de données numériques disponibles a rendu indispensables des
moyens de recherche performants et automatiques, permettant à tout un chacun de trouver une informa-
tion précise. Un systèmes de recherche d"information (SRI) doit faire face à trois types de défis à savoir,
la gestion d"un volume important d"informations, la présence de multiples supports et, finalement, le
caractère plurilingue de la Toile qui représente un enjeu considérable. Dans ce contexte, l"importance
grandissante d"autres langues que l"anglais a suscité le développement d"outils et de techniques auto-
matiques afin de permettre leur traitement informatique. Ce besoin n"est pas marginal. En septembre 20071
, la proportion d"internautes naviguant en langue arabe était estimée à 17,4 %. Sur cette base, nous
estimons que l"utilisation de la langue arabe sur le Web va atteindre des valeurs comparables à celle des
langues européennes.En comparaison de l"anglais ou d"autres langues indo-européennes, la langue arabe présente des carac-
téristiques singulières. Ainsi, son traitement automatique doit faire face à : la nature agglutinante de la langue : l"ensemble des morphèmes collés à l"unité lexicale 2 véhiculent plusieurs informations morphosyntaxiques. la richesse flexionnelle de l"arabel"absence de voyellation de la majorité des textes arabes écrits : ce phénomène entraîne un nombre
important d"ambiguités morphologiques. En arabe, chaque lettre doit prendre un signe de voyella-tion et de surcroît les voyelles finales sont porteuses de certains traits morpho-syntaxiques comme
la déclinaison, le mode, le cas. Face à ces défis et sous l"impulsion des campagnes d"évaluation TREC-2001 [ 55], diverses approches [ 4quotesdbs_dbs26.pdfusesText_32
[PDF] apport en capital
[PDF] agio définition
[PDF] goodwill
[PDF] cession de clientèle profession libérale
[PDF] gaec statut juridique
[PDF] création d'un gaec entre époux
[PDF] rémunération associé gaec ?
[PDF] différence entre gaec et earl
[PDF] avantage gaec
[PDF] retrait associé gaec
[PDF] dissolution gaec
[PDF] nutrition femme enceinte pdf
[PDF] recommandation alimentaire grossesse
[PDF] supplémentation grossesse has