[PDF] Sémantique et corpus spécialisés: Constitution de Bases de





Previous PDF Next PDF



Bases de langlais informatique

http://formation-continue.univ-tlse2.fr. Bases de l'anglais informatique. Le plus de la formation. Cours interactifs en salle multimédia. Petits groupes.



Sémantique et corpus spécialisés: Constitution de Bases de

26 mai 2016 Université Toulouse Le Mirail 2003. ... Pour Kennedy



SYLLABUS LFLEX Mention Mathématiques Mathématiques

il y a 5 jours Mathématiques Informatique en Double Licence ... Revoir les bases grammaticales de l'anglais pour les étudiants en difficulté( A0 A1



SYLLABUS LFLEX Mention Mathématiques et informatique

il y a 5 jours RESPONSABLE DE MENTION MATHÉMATIQUES ET INFORMATIQUE APPLIQUÉES AUX ... Revoir les bases grammaticales de l'anglais pour les étudiants en ...



SYLLABUS LICENCE Mention Electronique énergie électrique

6 sept. 2022 L'objectif est de former des étudiants pour qu'ils aient une base ... nique Automatique



SYLLABUS LFLEX Mention Mathématiques et informatique

il y a 7 jours id=1547. L'enseignement se fait en anglais en mode hybride afin que les étudiants des universités européennes partenaires du projet puissent ...



Économie

Sciences Humaines et Sociales) délivrée par la Faculté d'Informatique de l'Université. Toulouse Capitole. Dans l'esprit des sections européennes des lycées



COMMISSION DE LA FORMATION ET DE LA VIE UNIVERSITAIRE

UNIVERSITE TOULOUSE 1 CAPITOLE N° CFVU 11-IUT-004-MCC-BUT-INFORMATIQUE ... Vu l'arrêté du 3 août 2005 relatif au diplôme universitaire de technologie.



SYLLABUS LFLEX Mention Mathématiques Parcours Spécial

il y a 7 jours valider une double licence de mathématiques et d'informatique. ... Revoir les bases grammaticales de l'anglais pour les étudiants en ...



SYLLABUS LFLEX Mention Physique Chimie Licence de Physique

de la mati`ere et en programmation informatique (outils numériques et d'aide `a Revoir les bases grammaticales de l'anglais pour les étudiants en ...

Sémantique et corpus spécialisés :

Constitution de bases de connaissances

terminologiques

Anne Condamines

Mémoire présenté en vue de l"obtention de l"Habilitation à

Diriger les Recherches en Linguistique

Université Toulouse Le Mirail

Jury :

Andrée Borillo, professeur, Univ. Toulouse Le Mirail

Josiane Boutet, professeur, IUFM, Paris

Benoît Habert, professeur, Univ. Paris X, rapporteur Jennifer Pearson, responsable de la traduction à l"Unesco, Paris Marie-Paule Péry-Woodley, professeur, Univ. Toulouse Le Mirail, rapporteur François Rastier, directeur de recherches, CNRS, Modyco, rapporteur

26 Juin 2003

Je vois de plus en plus à la fois l"immensité du travail qu"il faudrait pour montrer au linguiste

ce qu"il fait ... et en même temps l"assez grande vanité de tout ce qu"on peut faire finalement

en linguistique. Saussure, Lettre à Meillet, 4 janvier 1894, cité par (Benveniste, 1966, 37)

REMERCIEMENTS

Benoît Habert et François Rastier m"ont honorée en acceptant d"être rapporteurs de mon dossier

d"Habilitation à diriger les recherches. Je les remercie chaleureusement.

Marie-Paule Péry-Woodley a joué parfaitement son rôle de " marraine », je lui en suis très

reconnaissante ; bien avant cette habilitation, nos discussions scientifiques (et les autres aussi) avaient

accompagné mon parcours de recherche.

Andrée Borillo est certainement celle qui est la mieux à même de mesurer l"évolution de ma réflexion;

j"espère qu"elle n"est pas déçue d"une pensée qu"elle a certainement contribuée à former.

Josiane Boutet et Jennifer Pearson ont accepté de faire partie du jury ; j"apprécie l"intérêt que, ce

faisant, elles témoignent à mon travail.

Même si elle s"élabore souvent dans la solitude, une réflexion n"est jamais le fruit d"une pensée

isolée ; elle se nourrit de rencontres intellectuelles, de collaborations, de confrontations. De ce point de

vue-là, je dois beaucoup à tous ceux qui ont accepté de faire un peu de route avec moi.

Je remercie mes amis de l"opération " Sémantique et corpus » de l"ERSS (en poste ou encore

étudiants) qui m"ont permis d"assurer ma réflexion en l"ancrant dans une perspective

fondamentalement linguistique. Nos discussions sur le rôle des corpus dans l"étude du sens, sur les

possibilités d"utiliser des outils et sur des questions plus futiles aussi m"ont souvent donné du

courage : A. Borillo, D. Bourigault, C. Fabre, N. Hathout, L. Tanguy, M. -P. Péry-Woodley, C. Pernet,

C. Frérot, M. Hodac, M. -P. Jacques, M. Lecolle, H. Miguet, S. Osdowska, J. Rebeyrolle, P. Vergely.

J"adresse un remerciement tout particulier à Josette Rebeyrolle qui m"accompagne dans mes

" aventures » avec des entreprises depuis 1992 et qui a suivi de près l"élaboration de ce mémoire.

Je remercie mes collègues et amis du groupe TIA (Terminologie et Intelligence Artificielle) ; la

pluridisciplinarité accompagnée de l"esprit d"ouverture qui règne dans ce groupe m"ont amenée à un

point de vue distancé sur la linguistique qui m"a permis d"établir mes convictions, même si ce fut au

prix de prises de consciences difficiles. Le groupe ASSTICCOT, bien que plus récent, a eu le même

effet stimulant. Je ne peux citer tous les noms mais je tiens à mentionner Nathalie Aussenac-Gilles,

informaticienne à l"Irit, ma fidèle complice, avec qui nous essayons, depuis 1986, de construire une

pensée interdisciplinaire cohérente autour de l"acquisition de connaissances à partir de textes.

J"ai la chance de travailler dans un laboratoire de linguistique qui ne connaît pas d"antagonismes

insupportables. J"ai plaisir à être chercheur dans un tel contexte et j"exprime ma gratitude à tous les

membres de l"ERSS : les directeurs, l"ancien (M . Plénat) et le nouveau (J. Durand), les chercheurs

anciens ou actuels (M. Aurnague, M. Bras, A. Le Draoulec, S. Lignon, L. Sarda, et tous les autres...).

Pour des questions moins scientifiques mais tout aussi importantes, ma reconnaissance va à Laurence

Lamy et Nicole Serna. Elles savent combien leur amitié m"est précieuse.

Grâce aux projets auxquels j"ai participé, j"ai rencontré beaucoup d"acteurs du monde " économique ».

Je leur exprime ma gratitude : cette confrontation avec une certaine réalité m"a gardée d"une vision

uniquement universitaire de la recherche. 1

SOMMAIRE

LISTE DES FIGURES ET DES TABLEAUX ....................................................................................................... 4

INTRODUCTION .................................................................................................................................................. 5

CHAPITRE I : LA SEMANTIQUE DE CORPUS OU LA CONFRONTATION AVEC LA REALITE

LANGAGIERE : POUR UNE SEMANTIQUE DOUBLEMENT SITUEE ........................................................ 10

1. MODES DE PRISE EN COMPTE DES CORPUS EN SEMANTIQUE ..................................................................... 11

1.1. La notion de corpus n"a pas de pertinence ................................................................................... 11

1.2. Recours au corpus " introspectif » ................................................................................................ 13

1.2.1 Sémantique lexicale .................................................................................................................................. 13

1.2.2 Sémantique cognitive ................................................................................................................... 14

1.2.3 Linguistique de l"énonciation : Sémantique instructionnelle ............................................................. 16

1.3. Recours à un corpus réel ............................................................................................................... 17

1.3.1 Corpus comme représentatif de la compétence des locuteurs ................................................................... 17

1.3.1.1 Lexicologie et établissement de grammaires à partir de corpus ..................................................... 17

1.3.1.2 Enseignement à partir de corpus..................................................................................................... 19

1.3.2 Le corpus comme objet d"étude ................................................................................................................ 20

1.3.2.1 Sociolinguistique ............................................................................................................................ 20

1.3.2.2 Langues spécialisées et terminologie textuelle ............................................................................... 22

1.3.2.3 TAL et sous-langages ..................................................................................................................... 23

1.3.2.4 Linguistique textuelle, analyse de discours, sémantique interprétative ......................................... 26

1.3.3 Qu"est-ce qu"un corpus ? .......................................................................................................................... 27

1.4. La langue est-elle un objet d"étude autonome ? ............................................................................ 29

2. POUR UNE SEMANTIQUE DE CORPUS DOUBLEMENT SITUEE ...................................................................... 32

2.1. La situation de production des textes : la question du genre textuel ............................................. 32

2.2. La situation d"interprétation des textes : vers la définition de genres interprétatifs ? .................. 35

2.2.1 La situation d"interprétation .......................................................................................................... 35

2.2.2 Comment justifier l"existence de " genres interprétatifs » ................................................................ 38

2.2.2.1 Arguments théoriques pour la définition de " genres interprétatifs » ........................................ 38

2.2.2.2 Arguments empiriques ........................................................................................................ 39

3. CONCLUSION ........................................................................................................................................... 41

CHAPITRE II : LES BASES DE CONNAISSANCES TERMINOLOGIQUES ................................................. 42

1. ORIGINE DU CONCEPT DE BCT ................................................................................................................ 43

1.1. Premiers projets de constitution de BCT : CODE et QUIRK ........................................................... 43

1.1.1 Le projet COGNITERM ................................................................................................................... 43

1.1.2 Le system QUIRK ......................................................................................................................... 44

1.2. Le système toulousain " ARAMIIHS » .............................................................................................. 44

1.3. Le groupe TIA ............................................................................................................................... 46

2. LE CONCEPT DE BCT : CARACTERISTIQUES DU MODELE DE DONNEES ..................................................... 47

2.1. Mise en réseau des concepts ......................................................................................................... 47

2.2. Le problème du concept ................................................................................................................ 48

2.2.1 Concept et terminologie ............................................................................................................... 48

2.2.2 Concept et formalisation de la connaissance ................................................................................... 51

2.3. Prise en compte de l"usage ............................................................................................................ 53

3. BCT ET ONTOLOGIES ............................................................................................................................... 53

3.1. BCT et ontologies : un problème similaire ? ................................................................................. 53

3.2. Ontologies, BCT et TAL ................................................................................................................ 55

3.3. BCTCorpus et BCTApplicative ..................................................................................................... 56

3.4. BCT et linguistique ........................................................................................................................ 57

4. CONCLUSION ........................................................................................................................................... 59

CHAPITRE III : CONSTITUTION DE BASES DE CONNAISSANCES TERMINOLOGIQUES :

EXPERIMENTATIONS, THEORISATION ........................................................................................................ 60

1. DU CORPUS A LA BCT : MISE EN PLACE ET PROBLEMATIQUES ................................................................. 61

1.1. Constitution d"un modèle de données ............................................................................................ 61

1.2. Représentation et calcul des relations sémantiques : synonymie, homonymie, polysémie ............ 64

2

1.2.1 Représentation des relations sémantiques ....................................................................................... 64

1.2.2 Calcul des relations sémantiques ................................................................................................... 66

1.3. Constitution du corpus .................................................................................................................. 67

1.3.1 Le problème de la clôture ............................................................................................................. 67

1.3.2 La question de la représentativité .................................................................................................. 70

2. PRESENTATION GENERALE DE LA METHODE D"ANALYSE DE CORPUS POUR CONSTRUIRE UNE BCT ......... 71

2.1. Approche sémasiologique vs onomasiologique ............................................................................. 72

2.2. Sens et contexte ............................................................................................................................. 73

2.3. Première approche des études à effectuer ..................................................................................... 74

3. D"UN CORPUS A UNE BCT : LES OUTILS ................................................................................................... 76

3.1. Outils de type descendant .............................................................................................................. 77

3.2. Outils de type ascendant ............................................................................................................... 78

3.3. Outils mixtes .................................................................................................................................. 80

3.4. Outils d"analyse de corpus ............................................................................................................ 82

4. CONCLUSION ........................................................................................................................................... 83

CHAPITRE IV : D"UN CORPUS A UNE BCT : NOUVEL ECLAIRAGE SUR DES PHENOMENES

LINGUISTIQUES CONNUS ............................................................................................................................... 84

1. REPERAGE DES TERMES ........................................................................................................................... 85

1.1. Repérage de termes basé sur la notion de " déviance » ................................................................ 85

1.1.1 Déviance et travaux sur la langue .................................................................................................. 86

1.1.2 Mise en oeuvre de la notion de déviance ......................................................................................... 87

1.2. Le recours systématique à une norme est-il possible ? ................................................................. 88

1.3. La normalisation comme recherche d"une cohésion interne ......................................................... 91

1.4. Recherche de cohésion interne et acquisition de connaissances à partir de textes ....................... 92

2. POLYSEMIE EN CORPUS SPECIALISE ......................................................................................................... 94

2.1. Identification des acceptions possibles de satellite dans un corpus du CNES .............................. 95

2.2. Polysémie et point de vue .............................................................................................................. 98

2.3. Repérage des mots polysémiques : recours à la statistique .......................................................... 99

3. LES NOMINALISATIONS ............................................................................................................................ 99

3.1. Etude statistique des nominalisations dans un corpus spécialisé................................................ 100

3.1.1 Mise en place de l"étude ............................................................................................................. 100

3.1.2 Résultats de cette première étude ................................................................................................. 102

3.1.3 Conclusion ................................................................................................................................ 104

3.2. Etude du fonctionnement des nominalisations en syntagme, dans un corpus technique ............. 105

3.2.1 Les structures syntagmatiques étudiées ........................................................................................ 105

3.2.2 Résultats ................................................................................................................................... 106

3.3. Etude du fonctionnement sémantique des nominalisations en corpus spécialisé ........................ 107

3.3.1 Etude de quelques cas ................................................................................................................ 108

3.3.1.1 Le verbe a deux significations/le nom n"est pas attesté ......................................................... 108

3.3.1.2 Le verbe n"est pas attesté, le nom a deux significations ........................................................ 108

3.3.1.3 Le nom a deux significations, le verbe n"en a qu"une des deux .............................................. 108

3.3.2 Interprétation aspectuelle des noms déverbaux : insuffisance de la distinction dynamique vs non-

dynamique

................................................................................................................................ 109

3.4. Synthèse ....................................................................................................................................... 110

4. CONCLUSION ......................................................................................................................................... 110

CHAPITRE V :D"UN CORPUS A L"ELABORATION D"UN RESEAU RELATIONNEL : LA QUESTION

DES MARQUEURS ........................................................................................................................................... 112

1. RELATIONS CONCEPTUELLES, MARQUEURS : POSITION DU PROBLEME ................................................... 113

1.1. Notions de relation et de réseau relationnel ............................................................................... 113

1.1.1 Relations et structuralisme .......................................................................................................... 113

1.1.2 Réseaux relationnels .................................................................................................................. 114

1.1.2.1 Représentations sous forme relationnelle ............................................................................ 114

1.1.2.2 Relations et définitions ..................................................................................................... 117

1.1.2.3 Y a-t-il des relations conceptuelles préexistantes ? .............................................................. 119

1.2. La notion de marqueur de relations ............................................................................................ 119

1.2.1 La notion de marqueur ............................................................................................................... 119

1.2.2 Les marqueurs de relations conceptuelles ..................................................................................... 120

1.2.2.1 Marqueurs comme indicateurs d"un contenu ...................................................................... 120

3

1.2.2.2 Marqueurs comme signes linguistiques .............................................................................. 121

2. ROLE DU CORPUS DANS LA DESCRIPTION DES MARQUEURS DE RELATIONS CONCEPTUELLES ................. 123

2.1. Postulats sous-tendant la constitution de réseaux, en terminologie et en intelligence artificielle

124

2.2. Etude du fonctionnement des marqueurs en corpus .................................................................... 125

2.2.1 Cas extrêmes : lien marqueur/corpus quasi inexistant ou quasi total ..................................... 125

2.2.1.1 Dépendance marqueur/corpus quasi inexistante ................................................................... 125

2.2.1.2 Dépendance relation/marqueur quasi totale ......................................................................... 128

2.2.2 Dépendance en fonction du genre du corpus ................................................................................. 130

2.2.2.1 Le cas de avec ................................................................................................................. 130

2.2.2.2 Le cas de chez ................................................................................................................. 135

2.3. Quand le fonctionnement des marqueurs se complexifie ............................................................ 138

2.3.1 Marqueurs lexico-syntaxiques ..................................................................................................... 138

2.3.2 Marqueurs et interprétation ......................................................................................................... 140

2.3.2.1 " L"application » s"inscrit dans les fonctionnements textuels ............................................... 140

2.3.2.2 Genres textuels et genres interprétatifs ............................................................................... 144

3. CONCLUSION ......................................................................................................................................... 146

CONCLUSION ................................................................................................................................................... 148

1. REPRESENTATION RELATIONNELLE ....................................................................................................... 149

2. LA QUESTION DU GENRE ........................................................................................................................ 151

3. ANALYSE INTROSPECTIVE, ANALYSE DE TEXTES, QUELLES COMPLEMENTARITES POSSIBLES ? .............. 153

BIBLIOGRAPHIE .............................................................................................................................................. 154

INDEX ................................................................................................................................................................ 165

ANNEXE ............................................................................................................................................................ 169

1. MMS (MATRA MARCONI SPACE) (1991-1993) ..................................................................................... 169

2. CNES 1 (CENTRE NATIONAL D"ETUDES SPATIALES) (1995) ................................................................. 170

3. EDF (1997-1998) .................................................................................................................................. 170

4. SYSTEME DE GESTION GLOBALE DES DEPLACEMENTS (SGGD), DDE (DIRECTION DEPARTEMENTALE DE

L

"EQUIPEMENT) DE LA HAUTE GARONNE (1998-1999) ......................................................................... 170

5. CENA (CENTRE D"ETUDE DE LA NAVIGATION AERIENNE) (1999-2003) .............................................. 171

6. CNES 2 (2002-2004) ............................................................................................................................. 171

4

Liste des figures et des tableaux

Figure 1 : Modèle de BCT ........................................................................................................ 61

Figure 2 : Exemple de traitement de recommandations par un organisme officiel .................. 63

Figure 3 : Exemple de relation entre concepts justifiée par un extrait de corpus..................... 64

Figure 4 : Exemple de représentation de polysémie et de synonymie ..................................... 65

Figure 5 : Mode d"attribution d"une classe sémantique, dans le cas d"une grammaire

sémantique ........................................................................................................................ 93

Figure 6 : Graphe canonique pour EASY et EAGER (d"après Sowa, 1991, 47) ................... 115 Figure 7 : Représentation sous forme de réseau de la phrase " Paul possède une voiture

appelée Titine et Jean une autre appelée Anastasie » (d"après Sabah, 1988, 207) ........ 115

Figure 8 : Extrait du réseau ontologique de " poisson » (d"après Otman, 1996, 56) ............. 116

Tableau 1 : Bruits et silences générés par les outils d"aide à l"extraction terminologique ...... 80

Tableau 2 : Répartition des points de vue dans le corpus du CNES ........................................ 98

Tableau 3 : Répartition des noms d"action, des noms d"une autre nature et des verbes dans 3

corpus techniques et 3 corpus littéraires ........................................................................ 103

Tableau 4 : Résultats chiffrés des structures contenant une nominalisation, dans un corpus

technique et dans un corpus journalistique .................................................................... 106

5

Introduction

Les différents termes du titre du mémoire présenté ici annoncent bien, me semble-t-il, les

principales questions qui vont y être abordées. Ces questions s"organisent en trois grands thèmes, l"un concerne les bases de connaissances terminologiques et l"évolution des

perspectives en terminologie, examinées tant d"un point de vue théorique qu"applicatif ;

l"autre s"intéresse à l"utilisation des corpus en sémantique et à ses conséquences

épistémologiques; le troisième évalue les possibilités de relations entre linguistique et

informatique, lorsqu"il s"agit de construire une représentation des connaissances à partir d"un

corpus. Ces thèmes sont intimement liés. En effet, la création des bases de connaissances

terminologiques a été possible du fait de la rencontre de la terminologie et de l"informatique,

mais une des conséquences en a été que la terminologie s"est rapprochée de la linguistique et

s"est ancrée dans la sémantique de corpus. Ainsi, si les problématiques couvertes semblent

vastes, en réalité, elles s"étayent mutuellement tout en permettant un éclairage nouveau sur

des phénomènes linguistiques traditionnellement observés sur des bases fondamentalement

différentes. Citons des exemples aussi divers que la polysémie, la notion de métalangage, le

genre textuel, le fonctionnement des nominalisations, les relations entre linguistique théorique

et linguistique appliquée : autant de problèmes qui sont examinés dans ce mémoire mais

d"une manière qui leur donne un relief particulier, en lien avec un point de vue qui consiste à

pratiquer une analyse parfaitement située.

Les bases de connaissances terminologiques (BCT)

Officiellement apparu en 1992, le terme de base de connaissances terminologiques scelle le rapprochement entre l"intelligence artificielle et la terminologie sur la question de la

représentation des connaissances. C"est plus particulièrement la mise en réseau des concepts

qui symbolise ce rapprochement, ce mode de représentation étant utilisé à la fois par la

psycholinguistique par exemple et par les langages de représentation informatiques. Depuis cette date, les relations IA/terminologie ont beaucoup évolué et les BCT ne symbolisent plus la fusion initialement envisagée entre ces deux disciplines. Impliquée dans

l"interdisciplinarité, chaque discipline a dû préciser ses présupposés. La problématique qui

anime actuellement l"ingénierie des connaissances est celle des ontologies : comment les

constituer, les formaliser et les pérenniser ? Ce n"est pas de ce point de vue que je me placerai 6 principalement mais de celui de la sémantique textuelle. En effet, la terminologie a dû, quant

à elle, s"interroger sur ses rapports avec la linguistique. Il a fallu d"une part s"interroger sur les

rapports entre lexicologie et terminologie et définir le concept, qui est la notion de base

utilisée par la terminologie. Il a fallu aussi engager une réflexion sur le corpus dans la

constitution des données terminologiques et surtout sur la manière de le prendre en compte dans la construction de ces données, c"est-à-dire dans la construction d"un sens. La vision

référentielle, traditionnelle en terminologie, est ainsi apparue comme insuffisante voire

inadéquate pour rendre compte du fonctionnement des textes spécialisés, ce qui a accéléré le

développement de la terminologie textuelle.

Curieusement ainsi, une des conséquences de la rencontre entre terminologie et IA a été

d"amener chacune à revisiter ses postulats et la façon de poser sa problématique. Le mariage a

donc été particulièrement fructueux et les liens initiaux - de symbiose, pour reprendre un qualificatif de Skuce et Meyer (Skuce et Meyer, 1991) - se sont transformés et enrichis.quotesdbs_dbs25.pdfusesText_31
[PDF] Bases de mur Thermur plus (dimensionnement) - Anciens Et Réunions

[PDF] BASES DE PHYSIOLOGIE UV 103 Chronobiologie

[PDF] Bases décisionnelles pour les garagistes

[PDF] bases du béton armé - Le coin du projeteur - Anciens Et Réunions

[PDF] Bases du dépistage - France

[PDF] BASES DU JEU “Étoile Magique” de l`Association des Campings de

[PDF] BASES DU LANGAGE HTML5

[PDF] Bases du Mod`ele Linéaire

[PDF] Bases du Web Design

[PDF] BASES D`EXERCICES EN LIGNE À L`UNIVERSITÉ BASES D

[PDF] Bases d`hydraulique - Anciens Et Réunions

[PDF] bases ecologiques , interet epidemiologique - France

[PDF] Bases et Diagnostic

[PDF] Bases et Méthodes de la Chimie Quantique

[PDF] Bases informatiques - Ordinateur