[PDF] Économie: cours dintroduction à lanalyse économique





Previous PDF Next PDF



1 METHODOLOGIE POUR LE COMMENTAIRE LITTERAIRE

On a commencé le paragraphe avec l'idée générale puis on a fait figurer des mots-clés de l'analyse littéraire tels que « champ lexical » pour enfin en venir à 



Annales français Terminale A

L'épreuve de français au baccalauréat est constituée de trois (3) sujets au choix: la contraction de texte le commentaire composé et la dissertation/.



Reproduction interdite

à gagner ! *. Seconde & Première mon année. Français. 2de & 1re. Français vous former au commentaire la deuxième série à la dissertation



MODULE DE FORMATION Second cycle

30 sept. 2019 français à partir du texte suivant



Analyse syntaxique à laide des tables du Lexique-Grammaire du

31 mars 2011 Ceci permet son intégration dans l'analyseur syntaxique frmg (French MetaGrammar) (Thomasset et de La Clergerie. 2005)



Août 2021 ------------------------------- MODULE DE FORMATION

Au second cycle Le français laisse peu à peu la place aux mathématiques. ... l?organisation des centres d?intérêt du sujet de commentaire composé.



Économie: cours dintroduction à lanalyse économique

14 janv. 2022 économiques sont décrites à l'aide d'analyses graphiques de statistiques ... et du progrès social pour le gouvernement français) sont les ...



Méthodologie de la dissertation littéraire (composition française

Il faut d'abord réfléchir au sujet de manière abstraite sans se demander : quelles œuvres



Présentation des Travaux Dirigés – Introduction à léconomie

« Selon l''INSEE le taux d''épargne des ménages français représentait 18



Méthode du commentaire de document en Histoire

A l'aide de ces premiers éléments d'information vous pouvez vous rappeler du contexte historique général dans lequel s'inscrit le document

Th ese de doctorat pour l'obtention du grade de

Docteur de l'Universite Paris-Est

Specialite Informatique Linguistique

au titre de l'

Ecole Doctorale MSTIC

Presentee et soutenue publiquement par

Elsa Tolone

le 31 mars 2011Analyse syntaxique a l'aide des tables du Lexique-Grammaire dufrancaisDevant le jury compose par : Rapporteurs :Laurence Danlos (Universite Denis Diderot - Paris 7)

Laura Kallmeyer (Universitat Dusseldorf)

Examinateurs :

Eric de La Clergerie (INRIA Paris{Rocquencourt)

Denys Duchier (Universite d'Orleans)

Directeur de these :

Eric Laporte (Universite Paris-Est)

Co-directeur de these :Matthieu Constant (Universite Paris-Est) 2

Remerciements

Avant tout, je tiens a remercier les membres du jury, Laurence Danlos, Laura Kall- meyer,Eric de la Clergerie et Denys Duchier, d'avoir accepte d'evaluer mon travail et pour leur commentaires enrichissants. Je remercie egalement mon directeur de these, Eric Laporte, pour toutes ses precieuses remarques, notamment lors de la redaction de mon travail. Sans oublier mon co-directeur, Matthieu Constant, pour m'avoir conseille durant mon travail et son aide pour certains outils. L'aide de Christian Leclere a ete pour moi d'une importance capitale puisqu'il est l'auteur principal des tables de verbes et qu'il a bien voulu m'accorder le temps necessaire pour demystier toutes mes interrogations. Ma collaboration avec Stavroula Voyatzi m'a permis egalement d'aborder les expres- sions gees et les adverbes avec beaucoup plus de facilite. Enn, Beno^t Sagot m'a enormement aide quand a la comparaison des deux formats de lexiques et pour les outils de conversion. Un grand merci aEric de la Clergerie pour sa reactivite et l'adaptation de son analy- seur syntaxique a mon lexique. Certains doctorants ont egalement jouer un r^ole important : Kyriak iIoannidou a vecson optimisme exemplaire et ses questions ac harneesqui m'ont permis d'envisager la poursuite de ce travail pour le grec, W ankaweePuangk ora vecsa gen tillesseet son aide ame d epataugerparmi la masse de ches cartonnees, Myria mRakho et An tonySigogne a vecl'utilisation du fruit de mon tra vaildans d'autres applications, en n,aussi bien les do ctorantsde P aris-Est,de P aris7, de Nancy ,que de la F aMAF m'ont permis de partager de bons moments lors de ces dernieres annees. Merci a Noemi Boubel et son equipe du CENTAL, ainsi qu'a Paul Sabatier et son equipe du LIF pour leur accueil chaleureux et leur inter^et lors de mes seminaires. Je souhaiterais egalement remercier Tita Kyriacopoulou, qui a su me donner go^ut a la linguistique, lorsqu'en licence j'ai suivi son cours tout a fait par hasard, et qui gr^ace a son dynamisme et a ses discussions passionnantes, m'a aidee a choisir ma voie. Pour nir, je souhaiterais remercier tous mes relecteurs que j'ai deja cites pour la plupart : j'ajouterais Lidia Varga, ainsi que mes parents, qui ont tous les deux eu le courage de lire ma these jusqu'au bout. Enn, merci a toute ma famille et a tous mes amis pour m'avoir soutenue durant toutes ces annees. 3 4

Resume

Les tables du Lexique-Grammaire, dont le developpement a ete initie par Gross 1975
constituent un lexique syntaxique tres riche pour le francais. Elles couvrent diverses categories lexicales telles que les verbes, les noms, les adjectifs et les adverbes. Cette base de donnees linguistiques n'est cependant pas directement exploitable informatiquement car elle est incomplete et manque de coherence. Chaque table regroupe un certain nombre d'entrees jugees similaires car elles acceptent des proprietes communes. Ces proprietes ont pour particularite de ne pas ^etre codees dans les tables m^emes mais uniquement decrites dans la litterature. Pour rendre ces tables exploitables, il faut expliciter les proprietes intervenant dans chacune d'entre elles. De plus, un grand nombre de ces proprietes doivent ^etre renommees dans un souci de coherence. Notre objectif est d'adapter les tables pour les rendre utilisables dans diverses applica- tions de Traitement Automatique des Langues (TAL), notamment l'analyse syntaxique. Nous expliquons les problemes rencontres et les methodes adoptees pour permettre leur integration dans un analyseur syntaxique. Nous proposonsLGExtract, un outil generique pour generer un lexique syntaxique pour le TAL a partir des tables du Lexique-Grammaire. Il est relie a une table glo- bale dans laquelle nous avons ajoute les proprietes manquantes et un unique script d'extraction incluant toutes les operations liees a chaque propriete devant ^etre eectuees pour toutes les tables. Nous presentons egalementLGLex, le nouveau lexique syntaxique genere des verbes, des noms predicatifs, des expressions gees et des adverbes. Ensuite, nous montrons comment nous avons converti les verbes et les noms predicatifs de ce lexique au format Alexina, qui est celui du lexique Lefff(Lexique des Formes

Flechies du Francais) (

Sagot 2010
), un lexique morphologique et syntaxique a large couverture et librement disponible pour le francais. Ceci permet son integration dans l'analyseur syntaxiquefrmg(French MetaGrammar) (Thomasset et de La Clergerie, 2005
), un analyseur profond a large couverture pour le francais, base sur les grammaires d'arbres adjoints (TAG), reposant habituellement sur le Lefff. Cette etape de conversion consiste a extraire l'information syntaxique codee dans les tables du Lexique-Grammaire. Nous presentons les fondements linguistiques de ce processus de conversion et le lexique obtenu. Nous evaluons l'analyseur syntaxiquefrmg sur le corpus de reference de la campagne d'evaluation d'analyseurs du francais Passage (Produire des Annotations Syntaxiques a GrandeEchelle) (Hamonet al.,2008 ), en comparant sa version basee sur le Lefffavec notre version reposant sur les tables du

Lexique-Grammaire converties.

5 6

Abstract

Lexicon-Grammar tables, whose development was initiated by Gross 1975
), are a very rich syntactic lexicon for the French language. They cover various lexical categories such as verbs, nouns, adjectives and adverbs. This linguistic database is nevertheless not directly usable by computer programs, as it is incomplete and lacks consistency. Tables are dened on the basis of features which are not explicitly recorded in the lexicon. These features are only described in literature. To use these tables, we must make explicit the essential features appearing in each one of them. In addition, many features must be renamed for consistency sake. Our aim is to adapt the tables, so as to make them usable in various Natural Lan- guage Processing (NLP) applications, in particular parsing. We describe the problems we encountered and the approaches we followed to enable their integration into a parser. We proposeLGExtract, a generic tool for generating a syntactic lexicon for NLP from the Lexicon-Grammar tables. It relies on a global table in which we added the missing features and on a single extraction script including all operations related to each property to be performed for all tables. We also presentLGLex, the new generated lexicon of French verbs, predicative nouns, frozen expressions and adverbs. Then, we describe how we converted the verbs and predicatives nouns of this lexicon into the Alexina framework, that is the one of the Leffflexicon (Lexique des Formes Flechies du Francais) (Sagot,2010 ), a freely available and large-coverage morphological and syntactic lexicon for French. This enables its integration in thefrmgparser (French

MetaGrammar) (

Thomasset et de La Clergerie

2005
), a large-coverage deep parser for French, based on Tree-Adjoining Grammars (TAG), that usually relies on the Lefff. This conversion step consists in extracting the syntactic information encoded in Lexicon- Grammar tables. We describe the linguistic basis of this conversion process, and the resulting lexicon. We evaluate thefrmgparser on the reference corpus of the evaluation

campaign for French parsers Passage (Produire des Annotations Syntaxiques a GrandeEchelle) (Hamonet al.,2008 ), by comparing its Lefff-based version to our version relying

on the converted Lexicon-Grammar tables. 7 8

Table des matieres

1 Introduction

13

1.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

1.2 Objectif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

14

1.3 Plan de la these . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15 I

Etat de l'art17

2 Les analyseurs syntaxiques et les lexiques syntaxiques

19

2.1 Analyse syntaxique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

2.2 Lexiques syntaxiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

26

3 Les tables du Lexique-Grammaire

33

3.1 Notations du Lexique-Grammaire . . . . . . . . . . . . . . . . . . . . . .

33

3.2 Point de depart : Les tables du Lexique-Grammaire . . . . . . . . . . . .

38

4 Le lexique syntaxiqueLefffet l'analyseur syntaxiquefrmg45

4.1 Le lexique syntaxique Lefffet le format Alexina . . . . . . . . . . . . . .45

4.2 L'analyseur syntaxiquefrmg. . . . . . . . . . . . . . . . . . . . . . . .5 2

II Modications des tables

63

5 Amelioration des tables et creation des tables des classes

65

5.1 Provenance des tables et etat des lieux . . . . . . . . . . . . . . . . . . .

65

5.2 Format d'origine et classication . . . . . . . . . . . . . . . . . . . . . . .

68

5.3 Formalisation et homogeneisation des proprietes syntaxico-semantiques .

79

5.4 Tables des classes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

83

5.5 Codage des tables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

86

5.6 Bilan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

93

6 Constructions de base pour toutes les categories

95

6.1 Les classes des verbes distributionnels : Les completives et les innitives .

96

6.2 Les classes des verbes distributionnels de BGL . . . . . . . . . . . . . . .

100

6.3 Les classes des noms predicatifs . . . . . . . . . . . . . . . . . . . . . . .

112
9

Table des matieres

6.4 Les classes des expressions gees . . . . . . . . . . . . . . . . . . . . . . .

131

6.5 Les classes des adverbes . . . . . . . . . . . . . . . . . . . . . . . . . . .

138

6.6 Recensement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

143

III Conversion des tables

153

7 Conversion au formatLGLex155

7.1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

155

7.2 L'outilLGExtract. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .157

7.3 Le lexiqueLGLex. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .161

7.4 Le script deLGExtract. . . . . . . . . . . . . . . . . . . . . . . . . . . .167

7.5 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

172

8 Conversion au formatLefff175

8.1 Conversion du lexiqueLGLexen un lexique au format Alexina . . . . . .175

8.2 Le lexiqueLGLex-Lefff. . . . . . . . . . . . . . . . . . . . . . . . . . . .191

IV Resultats

193

9 Recapitulatif des travaux eectues

195

9.1 Bilan sur l'avancement des travaux de conversion . . . . . . . . . . . . .

195

9.2Evolution de la version 3 . . . . . . . . . . . . . . . . . . . . . . . . . . .195

9.3 Extraits de la table 31R dans tous les formats disponibles . . . . . . . . .

200

10 Integration dansfrmget evaluation205

10.1 Integration dans l'analyseur syntaxiquefrmg. . . . . . . . . . . . . . .205

10.2Evaluation et discussion . . . . . . . . . . . . . . . . . . . . . . . . . . .206

10.3 Fouille d'erreurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

209

10.4Evaluation manuelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . .210

10.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

218

11 Conclusion et perspectives

221

11.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

221

11.2 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

222

Bibliographie

229

V Annexes

241

A Format du lexiqueLGLex243

A.1 Description of the content of theLGLexlexicon . . . . . . . . . . . . . .243 A.2 Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
10

Table des matieres

B Generation du lexiqueLGLexa l'aide deLGExtract253

C Format du lexiqueLGLex-Lefff257

C.1 Description of the intensional Lefffformat . . . . . . . . . . . . . . . . .257 C.2 Description of the extensional Lefffformat . . . . . . . . . . . . . . . . .258 C.3 Characteristics of theLGLex-Leffflexicon . . . . . . . . . . . . . . . . .259 D Generation du lexiqueLGLex-Lefffa l'aide deLGLex2ilex263 E Documentation des proprietes des tables de verbes distributionnels 265
F Formules denitoires des tables de verbes distributionnels 309
G Arbre de classication des verbes distributionnels 331
G.1 Conventions de lecture de l'arbre . . . . . . . . . . . . . . . . . . . . . . 331
G.2 Arbre de classication des verbes . . . . . . . . . . . . . . . . . . . . . . 334
11

Table des matieres

12 1

Introduction

1.1 Contexte

L'analyse syntaxique de textes a l'aide de lexiques syntaxiques est au centre de projets de recherche recents sur le francais : {Mosaque(2006-2007, INRIA) sur le developpement de modeles syntaxiques de haut niveau, en considerant, en particulier, la notion de meta-grammaire; {EVALDA-EASy(2003-2005, Technolangue) sur la mise en place d'une campagne d'evaluation d'analyseurs syntaxiques; {LexSynt(2005-2007, Institut de la Langue Francaise) sur le developpement de modeles linguistiques pour les lexiques syntaxiques et semantiques, ainsi que sur la constitution d'un lexique de reference pour le francais; {Passage(2007-2009, ANR) sur la construction automatique d'un tres gros corpus an- note en syntaxe par l'utilisation et l'evaluation de plusieurs analyseurs syntaxiques, ainsi que sur l'acquisition d'informations linguistiques et extra-linguistiques a partir de ce corpus; {Sequoa(2009-2011, ANR) sur les analyseurs syntaxiques probabilistes a large cou- verture pour le francais; {EDyLex(2010-2012, ANR) sur l'acquisition dynamique de nouvelles entrees dans des lexiques existants, utilises au sein de cha^nes d'analyse syntaxique et semantique completes. La construction de lexiques syntaxiques n'existe pas que pour le francais, des projets existent depuis les annees 1990 pour l'anglais. Le projetComLex Syntax(Grishmanet al.,1994 ) a pour objectif la creation d'un lexique syntaxique a large couverture pour l'anglais. La premiere version de ComLex Syntax a ete diusee par le Linguistic Data Consortium (LDC) en 1994 et la version 13

Chapitre 1 Introduction

nale en 1997. Il s'est poursuivi par la creation deNomLex(Macleodet al.,1997 ),un lexique sur les nominalisations de verbes avec une premiere version publiee en 1999, sa derniere version datant de 2001. FrameNet(Bakeret al.,1998 ) est un projet fonde sur la semantique des cadres. Il a pour objectif de documenter la combinatoire syntaxique et semantique pour chacun des sens d'une entree lexicale a travers une annotation manuelle d'exemples choisis dans des corpus sur des criteres de representativite lexicographique. Il a debute en 1997 et se poursuit actuellement. Citons pour terminer,VerbNet(Kipperet al.,2000 ), un lexique des classes de verbes anglais, qui est la ressource la plus proche du Lexique-Grammaire. VerbNet regroupe par classe les verbes partageant les m^emes comportements syntaxiques et semantiques.

C'est un prolongement des travaux de

Levin 1993
). De nouvelles versions sortent regulierement, la version actuelle datant de 2009.

Les tables du Lexique-Grammaire du francais (

Gross 1975
) constituent une base de donnees riche et detaillee contenant des informations lexicales, syntaxiques et semantiques. Elles couvrent diverses categories lexicales telles que les verbes, les noms, les adjectifs et les adverbes. Chaque table regroupe les elements lexicaux d'une categorie lexicale donnee, partageant certaines proprietes syntaxico-semantiques. Leur developpement a ete initie depuis plus de quarante ans par M. Gross, au sein du Laboratoire d'Automatique Documentaire et Linguistique (LADL), puis du Laboratoire d'Informatique Gaspard-Monge (LIGM) de l'Universite Paris-Est. Mais elles n'ont pas ete creees en un format permettant directement leur utilisation dans un programme informatique tel qu'un analyseur syntaxique.

1.2 Objectif

L'objectif de cette these est de permettre aux donnees linguistiques codees dans les tables du Lexique-Grammaire de servir de base de donnees lexicales pour diverses ap- plications de Traitement Automatique des Langues (TAL), notamment un analyseur syntaxique automatique du francais. Pour cela, nous avons converti les tables au format Alexina, qui est celui du lexique Lefff, un lexique syntaxique a large couverture pour le francais (

Sagot et Danlos

2 007 Sagotquotesdbs_dbs43.pdfusesText_43
[PDF] Aide pour un commentaire dun poème de Verlaine 1ère Français

[PDF] AIDE POUR UN COMMENTAIRE LITTERAIRE SVP !! 2nde Français

[PDF] Aide pour un compte-rendu de lecture 3ème Français

[PDF] Aide pour un concours de mathématiques 6ème Mathématiques

[PDF] Aide pour un contrôle 3ème Autre

[PDF] Aide pour un corpus de francais (2nde) 2nde Français

[PDF] Aide pour un devoir d'svt Terminale SVT

[PDF] Aide pour un devoir de Géometrie 6ème Mathématiques

[PDF] Aide pour un devoir de math ! 2nde Mathématiques

[PDF] Aide pour un devoir de maths 2nd svp 3ème Mathématiques

[PDF] Aide pour un devoir en section euro concernant le Moyen Age 2nde Anglais

[PDF] aide pour un devoir maison 3ème Mathématiques

[PDF] Aide pour un Devoir Maison ! 4ème Mathématiques

[PDF] Aide pour un Devoir Maison de Mathématiques 2nde Mathématiques

[PDF] Aide pour un devoir noter merci 2nde Mathématiques