[PDF] THÈSE Génération de phrases multilingues par apprentissage





Previous PDF Next PDF



Apprendre la guitare sur YouTube

2. Laboratoire Informatique d'Avignon. DOI : 10.25965/interfaces-numeriques.4288. < RÉSUMÉ >. Cet article présente la collecte et l'analyse — à l'aide les 



Combining Heterogeneous Information

computer science laboratory (LIA – Laboratoire Informatique d'Avignon) still on complex to attributed networks



Multivariate group analyses for functional neuroimaging: conceptual

Mar 23 2020 UMR 7289; Laboratoire d'Informatique et Systèmes UMR 7020



YEARBOOK / FAITS MARQUANTS

Jul 31 2022 ... les sciences de l'informatique (machine learning) avec le design ... de l'apprentissage machine. ... les interfaces cerveau-ordinateur.



La 20e édition de Semaine du Cerveau est placée sous le haut

Mar 12 2018 Titre : Le cerveau fait son show - Les laboratoires GRAP et GRAMFC ... TITRE : 'Des interfaces cerveau-machine au neurofeedback





THÈSE Génération de phrases multilingues par apprentissage

du Laboratoire Informatique d'Avignon et du CERI que j'ai côtoyé au cours de ces erating natural language from a machine representation system. In this ...



Traitement Automatique et Troubles de la Voix et de la Parole

Apr 17 2019 Laboratoire Informatique d'Avignon ... boîte crânienne et composé du cerveau



Expérience et recherche qualitative : appréhender « en complexité

une étude dans un laboratoire d'informatique – développant un intranet de partage Avignon Marseille



LEFFET ÉTS Faire de lÉTS lécole préférée des femmes en génie

Katherine D'Avignon. 14. Georges El-Saikaly. 14. LabVI. Une aide de 600 000 $ pour le Quartier de l'innovation. 15. RECHERCHE. Ismail Ben-Ayed.



Interfaces cerveau-machine (Les)

brain computer interface – ou interface cerveau-machine (ICM) – qui restera pour désigner tous types de communications directes entre une machine et un utilisateur passant uniquement par l’activité cérébrale cette dernière étant mesurée et analysée par le système



Rapport 20-06 Interfaces cerveau-machine: essais

L’interface cerveau-machine (ICM) est une technique permettant de recueillir l’activité du cortex et de la transformer grâce à un logiciel en commande d’activités motrices sensorielles dé?nies respectivement comme asynchrone et synchrone parce que dans ce cas lecortex est stimulé par un événement extérieur alors que dans

  • Les Enjeux de La Recherche

    Améliorer la biocompatibilité et l’intégration des implants dans le cerveau

Qu'est-ce que les interfaces cerveau-machine ?

En cours de développement dans différents laboratoires à travers le monde, les interfaces cerveau-machine (ICM) sont des dispositifs qui devraient permettre à des personnes souffrant de handicaps majeurs de retrouver une certaine autonomie.

Quel est le rôle du cerveau dans l’intégration d’informations multiples?

Activité 6 : L’intégration d’informations multiples par les cerveau Compétence à acquérir : Identifier le rôle du cerveau dans l’intégration d’informations provenant de plusieurs sources (externes et internes) et dans l’élaboration de messages en lien avec la tâche à effectuer.

Comment améliorer l’intégration des électrodes dans le cortex ?

Les chercheurs tentent d’améliorer l’intégration des électrodes dans le cortex. Un projet consiste ainsi à développer des électrodes souples qui seraient incorporées dans le cerveau à l’aide de micro aiguilles biodégradables. En parallèle, des équipes poursuivent le travail de miniaturisation des électrodes.

ACADÉMIE D"AIX-MARSEILLE

UNIVERSITÉ D"AVIGNON ET DES PAYS DE VAUCLUSE

THÈSE

présentée à l"Université d"Avignon et des Pays de Vaucluse pour obtenir le grade de Docteur

SPÉCIALITÉ : Sciences Informatiques

École Doctorale I2S "Information Structure Systèmes»

Laboratoire d"Informatique (EA 931)

Génération de phrases multilingues par

apprentissage automatique de modèles de phrases par

Eric Charton

Soutenue publiquement à l"Université d"Avignon le 12 Novembre 2010 devant un jury composé de : M meLaurence Danlos Professeur, Université Paris 7 (ALPAGE),

ParisRapporteur

M. Guy Lapalme Professeur, Université de Montréal (RALI),

MontréalRapporteur

M. Laurent Besacier Professeur, Université Joseph Fourier (IMAG), GrenobleExaminateur M. Jean-françois Bonastre Professeur, Université d"Avignon (LIA), Avi- gnonExaminateur M. Michel Gagnon Professeur, École Polytechnique de Montréal (GIGL), MontréalExaminateur M. Juan-Manuel Torres-Moreno MdC (HDR), Université d"Avignon et des

Pays de Vaucluse (LIA), AvignonDirecteur

Laboratoire d"Informatique d"Avignon

2

Remerciements

Mes plus chaleureux remerciements vont en premier lieu à Jean-François Bonastre. Sans ses encouragements et sa bienveillance, lors de toutes les étapes de cette aven- ture, c"est certain, rien n"aurait été possible. Ils vont ensuite au Dr Juan-Manuel Torres- Moreno qui a bien voulu m"accompagner dans la démarche complexe et prenante que constitue ce travail de recherche. Je suis particulièrement reconnaissant à tous ceux, membres ou non de la commu- nauté académique qui m"ont aidé sans autre revendication que celle de me rendre ser- vice. Merci à Georges Linares de m"avoir fourni tout le matériel dont j"avais besoin pour mes expériences et d"avoir pris en charge certains aspects logistiques, à Patricia Velazquez-Morales d"avoir contribué à la mise au point de mes expériences et active- ment aidé pour la finition d"aspects importants de ce travail, à Frédéric Béchet pour sa curiosité active envers mes travaux. Un remerciement très spécial va au Dr Nimaan Abdillahi qui m"a invité à mettre un peu d"Afrique dans ce travail (c"était un rêve). Je ne voudrais pas oublier de témoigner de ma sympathie envers tous les membres du Laboratoire Informatique d"Avignon et du CERI que j"ai côtoyé au cours de ces quelques années. Je n"en cite aucun pour n"en oublier aucun; ils habitent maintenant un peu partout sur la planète dans des maisons et même dans des cubicles (en particulier à Singapour, San Fransisco, Brisbane, Mexico, Montréal, Djibouti, Sao Polo, mais aussi à Marseille, au sud de Marseille, à Toulouse, Aix en Provence, au Mans, à Chateaurenard, à Caumont, Orange et en Avignon, évidemment) certain(e)s sont devenus des ami(e)s et ils se reconnaîtront. Et je n"oublie surtout pas la patience et l"affection de Antoine, Charles et surtout Marie-Jean, éminents membres de ma tribu de gens du voyage désormais devenue cos- mopolite! 3 4

Résumé

La Génération Automatique de Texte (GAT) est le champ de recherche de la lin- guistique informatique qui étudie la possibilité d"attribuer à une machine la faculté de produire du texte intelligible. Dans ce mémoire, nous présentons une proposition de système de GAT reposant exclusivement sur des méthodes statistiques. Son originalité est d"exploiter un corpus en tant que ressource de formation de phrases. Cette méth- ode offre plusieurs avantages : elle simplifie l"implémentation d"un système de GAT en

plusieurs langues et améliore les capacités d"adaptations d"un système de génération à

un domaine sémantique particulier. La production, d"après un corpus d"apprentissage,

des modèles de phrases finement étiquetées requises par notre générateur de texte nous

a conduit à mener des recherches approfondies dans le domaine de l"extraction d"infor- de contenus encyclopédique mis au point à cette fin. Dans les étapes finales du proces-

sus de génération, les modèles de phrases sont exploités par un module de génération

de texte multilingue. Ce module exploite des algorithmes de recherche d"information tique et syntaxique de l"intention à communiquer. Plusieurs méthodes sont proposées pour générer une phrase, choisies en fonction de la complexité du contenu sémantique à exprimer. Nous présentons notamment parmi ces méthodes une proposition origi- nale de génération de phrases complexes par agrégation de proto-phrases de typeSu- jet,Verbe,Objet. Nous envisageons dans nos conclusions que cette méthode particulière de génération puisse ouvrir des voies d"investigations prometteuses sur la nature du processus de formation de phrases.

Les travaux de recherche présentés dans ce mémoire ont été menés au Laboratoire Informa-

tique d"Avignon jusqu"en octobre 2009. Ils ont été complétés et mis en application à l"École

Polytechnique de Montréal à partir du 1er décembre 2009, dans le cadre des travaux du projet

Gitan, dirigé par les Professeurs Michel Gagnon et Benoit Ozell. L"ensemble de cette thèse à été

menée sous la direction scientifique du Dr Juan-Manuel Torres-Moreno (MdC HDR).

Mots clés

Génération Automatique de Texte, Génération de phrases, Apprentissage automa- tique, Syntaxe, Extraction d"information, Agrégation 5 6 AbstractMultilingualNaturalLanguageGenerationusingsentencemod-els learned from corpora Natural Language Generation (NLG) is the natural language processing task of gen- erating natural language from a machine representation system. In this thesis report, we present an architecture of NLG system relying on statistical methods. The original- ity of our proposition is its ability to use a corpus as a learning resource for sentences production. This method offers several advantages : it simplifies the implementation and design of a multilingual NLG system, capable of sentence production of the same meaning in several languages. Our method also improves the adaptability of a NLG system to a particular semantic field. In our proposal, sentence generation is achieved trough the use of sentence models, obtained from a training corpus. Extracted sentences are abstracted by a labelling step obtained from various information extraction and text mining methods like named entity recognition, co-reference resolution, semantic la- belling and part of speech tagging. The sentence generation process is achieved by a sentence realisation module. This module provide an adapted sentence model to fit a communicative intent, and then transform this model to generate a new sentence. Two methods are proposed to transform a sentence model into a generated sentence, ac- cording to the semantic content to express. In this document, we describe the complete labelling system applied to encyclopaedic content to obtain the sentence models. Then we present two models of sentence generation. The first generation model substitute the semantic content to an original sentence content. The second model is used to find numerous proto-sentences, structured asSubject, Verb, Object, able to fit by part a whole communicative intent, and then aggregate all the slected proto-sentences into a more complex one. Our experiments of sentence generation with various configurations of our system have shown that this new approach of NLG have an interesting potential. This research have been mainly conducted in the Computer Laboratory of Avignon Uni- versity, until October 2009. It was supplemented and applied at the École Polytechnique de Montreal starting from December 1st, 2009, within the framework of the Gitan project, directed by Professors Michel Gagnon and Benoit Ozell. The whole work described in this thesis has been conducted under the scientific supervision of Dr. Juan-Manuel Torres-Moreno (MdC HDR).

Keywords

Natural Language Generation, Sentence generation, Statistical learning, Syntax, In- formation extraction, Aggregation 7 8

Table des matières

I Théorie et génération19

1 Structures et méthodes des systèmes de Génération Automatique de Texte21

1.1 Formalisation de l"Intention de Communication. . . . . . . . . . . . . . . . 23

1.2 L"architecturepipelinedes systèmes de génération. . . . . . . . . . . . . 25

1.3 Composantsstratégiquesdeproductiondephrasedel"architecturepipeline27

1.3.1 Les générateurs à base de patrons. . . . . . . . . . . . . . . . . . 27

1.3.2 Les générateurs à composants à base de règles de production. . 29

1.3.3 Les générateurs à composants statistiques et apprentissage sur

corpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1.3.4 Représentativité des différentes approches. . . . . . . . . . . . . 30

1.4 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2 Générateurs à base de règles et de grammaires33

2.1 Théories linguistiques impliquées. . . . . . . . . . . . . . . . . . . . . . . 33

2.1.1 Grammaires génératives et transformationnelles. . . . . . . . . . 34

2.1.2 Implémentation dans les systèmes de GAT. . . . . . . . . . . . . 34

2.1.3 Théorie Sens-texte. . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.2 Composants autonomes de génération de surface. . . . . . . . . . . . . 37

2.3 Conclusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3 Méthodes statistiques appliquées à la génération automatique de texte41

3.1 Principes théoriques de base des approches statistiques. . . . . . . . . . 43

quotesdbs_dbs3.pdfusesText_6
[PDF] Interfaces Cerveau/Machine - Anciens Et Réunions

[PDF] Interfaces commandes au volant - Anciens Et Réunions

[PDF] interfaces commandes au volant 2015 - Anciens Et Réunions

[PDF] Interfaces Commandes Au Volant Sofare Fr - Anciens Et Réunions

[PDF] Interfaces Configuration de l`ordinateur

[PDF] Interfaces de Test mécaniques TESTEL

[PDF] Interfaces graphiques - Introduction Introduction

[PDF] Interfaces Graphiques : AWT - Espèces En Voie De Disparition

[PDF] Interfaces graphiques g p q

[PDF] Interfaces neuronale directe - Anciens Et Réunions

[PDF] Interfaces Non Visuelles et Accessibilité - France

[PDF] Interfaces n°55 - France

[PDF] Interfaces pour catalogues, prix et conditions clients

[PDF] Interfaces réseau ACE969TP et ACE969FO

[PDF] Interfaces sciences du vivant et sciences humaines et