[PDF] Extraction lexicale bilingue à partir de textes médicaux comparables





Previous PDF Next PDF



Références : Terminologie médicale en anglais

Lexique des termes médicaux :anglais-français français-anglais : guide lexical à l'usage des sciences de la santé. Paris: Ellipses. Carnet



Extraction bilingue de termes médicaux dans un corpus parallèle

deux corpus parallèles anglais/français du domaine médical. Après alignement 2– Repérage des couples amorces : influence du lexique bilingue utilisé.



Vocabulaire-médical-anglais.pdf

Vocabulaire médical anglais. Anglais => Français illness => la maladie to be in good/ bad health => être en bonne/mauvaise sante.



François Maniez (dir.) Dorland Dictionnaire médical bilingue

Mar 1 2009 Dorland Dictionnaire médical bilingue français-anglais/anglais- ... vocabulaire médical » (p. ix-xxxiii) et



Extraction lexicale bilingue à partir de textes médicaux comparables

Dec 9 2004 Il s'agit de l'extraction d'un lexique bilingue médical (français-anglais) et de la recherche d'information translangue.



Livret de santé bilingue (anglais/français)

In France everyone is entitled to health insurance to cover the cost of medical care. It is preferable to apply for it before becoming ill.



Discours de professionnels et discours pour professionnels : le

Mar 1 2017 l'anglais pour la médecine : principalement le lexique médical de base



Analyse morphosémantique des composés savants : transposition

Jun 8 2007 initialement dédié au français (DériF)



Lexique des services de santé Glossary of Health Services

Soins médicaux ) Terminologie. 3. Français (Langue) ) Dictionnaires anglais. 4. Anglais (Langue) ) Dictionnaires français. I. Entraide Traduction 



vocabulaire-chirurgie.pdf

associés plus de 1500 termes français et anglais et environ 200 équivalents constater que la terminologie médicale est d'une précision chirurgicale!

THÈSE DEDOCTORAT DE L"UNIVERSITÉPARIS6

Spécialité

Informatique Médicale

Présentée par

YUN-CHUANGCHIAO

Pour obtenir le grade de

DOCTEUR DE L"UNIVERSITÉPARIS6

Sujet de la thèse:

Extraction lexicale bilingue

à partir de textes médicaux comparables:

application à la recherche d"information translangue soutenue le 30 juin 2004 devant le jury composé de: Christian Fluhr Rapporteur Directeur de recherche, CEA et Professeur, INSTN Éric Gaussier Examinateur Ingénieur, Rank Xerox Center Europe Patrick Gallinari Examinateur Professeur, Université Paris VI Benoît Habert Rapporteur Professeur, Université Paris X et LIMSI-CNRS Pierre Le Beux Examinateur Professeur, Université de Rennes

Jean-David Sta Co-directeur Chercheur, EDF R&D

Pierre Zweigenbaum Directeur Ingénieur, AP-HP et Professeur, INaLCO

Résumé

L"accroissement explosif des connaissances dans le domaine médical et l"infla- tion textuelle et multilingue, notamment sur le Web, confèrent à l"accès, l"exploitation ou la traduction de ces informations un enjeu important. Ces traitements nécessitent des ressources lexicales multilingues qui font partiellement défaut. L"actualisation de ces ressources multilingues est donc une problématique clé dans l"accès à ces informa- tions.

Les travaux présentés ici ont été réalisés dans le cadre de l"extraction de lexique

bilingue spécialisé à partir de textes médicaux comparables. L"objectif est d"évaluer et de proposer un outil d"aide à l"actualisation de lexique bilingue spécialisé et à la recherche d"information translangue en s"appuyant sur l"exploitation de ressources bi- lingues provenant du Web dans le domaine médical. Nous présentons un modèle fondé sur l"analyse distributionnelle en introduisant à cette occasion une nouvelle notion que nous nommonssymétrie distributionnelle. En général, les modèles classiques d"extraction de lexique bilingue à partir de corpus comparables établissent la relation de traduction entre deux mots en calculant la res- semblance entre leurs distributions d"une langue vers l"autre (par exemple, du français vers l"anglais). L"hypothèse de symétrie distributionnelle postule que la ressemblance des distributions de deux mots dans les deux directions de langues est un critère fort du lien traductionnel entre ces mots. Deux grandes applications de ce modèle ont été expérimentées afin de le vali- der. Il s"agit de l"extraction d"un lexique bilingue médical (français-anglais) et de la recherche d"information translangue. Dans le cas de l"extraction lexicale bilingue, les résultats montrent que la prise en compte de la symétrie distributionnelle améliore la performance de manière significative par rapport aux modèles classiques. Dans le cas de la recherche d"information translangue, notre modèle a été appliqué pour traduire et étendre les requêtes. Les résultats montrent que lorsque les propositions de traduction ou d"extension sont supervisées par l"utilisateur, il améliore la recherche d"information par rapport à une traduction basée sur un dictionnaire initial.

Abstract

In recent years, with a rapid expansion of online information available on medical web sites in different languages, one of the issues that have to be addressed is that of the access and the processing of this online information. It generally assumes that large, multilingual lexicalresources are available foreach language pair. Howto update these multilingual resources becomes an important clue, especially in a rapidly evolving domain such as medicine. This thesis focuses on domain-specific bilingual lexicon extraction from online medical texts. Our goal is to develop a translation method for bilingual lexicon acqui- sition from comparable corpora and for query translation in cross-language informa- tion retrieval (CLIR). We present here a novel approach based onwords distribution symmetry. Traditional approaches to bilingual lexicon extraction from comparable corpora are based on the assumption that words that are translations of each other will have similar distributional profiles across languages. However, they proposed one direction extrac- tion, onlyfromthesourcetothetargetlanguage. Thebasicintuitionofthesymmetrical distribution is that the reciprocal distribution similarity between two words of differ- ent languages is an effective criterion for identifying the translational affinity between words. On the one hand, we evaluated our model for a French-English medical lexicon extraction. On the other hand, the extracted lexicon is used for query translation and expansion in CLIR. The results show that our approach exploring symmetrical distri- bution performs better than the traditional approach to bilingual lexicon extraction. For query translation and expansion tasks, our model improves the retrieval results only in a semi-supervised mode when compared with the dictionary-based method. 2 3

Table des matières

1 Introduction 5

1.1 Problématique générale . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2 Plan général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.3 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4 Le corpus comme source d"acquisition lexicale bilingue . . . . . . . . 8

1.5 Hypothèses et méthodologie . . . . . . . . . . . . . . . . . . . . . . 10

1.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2 Acquisition lexicale à partir de corpus 17

2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.2 Corpus comme ressource lexicale . . . . . . . . . . . . . . . . . . . 18

2.3 Acquisition terminologique monolingue . . . . . . . . . . . . . . . . 22

2.4 Acquisition terminologique bilingue . . . . . . . . . . . . . . . . . . 32

2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3 Acquisition lexicale bilingue à partir de corpus comparables: une nouvelle

approche 41

3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.2 Mise en évidence de la relation de traduction à partir des contextes . . 42

3.3 Un nouveau modèle d"extraction de lexique bilingue à partir de corpus

comparables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4 Expériences d"acquisition lexicale bilingue dans le domaine médical 67

4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

4.2 Constitution de ressources bilingues . . . . . . . . . . . . . . . . . . 67

4.3 Expériences d"extraction de lexique bilingue spécialisé . . . . . . . . 72

4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

5 Recherche d"information translangue 97

5.1 WWW et multilinguisme . . . . . . . . . . . . . . . . . . . . . . . . 97

5.2 Systèmes de recherche d"information sur le Web . . . . . . . . . . . . 99

5.3 Problématique du passage d"une langue à une autre . . . . . . . . . . 107

4

5.4 Approches en recherche d"information translangue . . . . . . . . . . 107

5.5 Reformulation d"une requête par extension . . . . . . . . . . . . . . . 111

5.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

6 Expériences de recherche d"information translangue 115

6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

6.2 Evaluation d"un système de recherche d"information . . . . . . . . . 116

6.3 Collection OHSUMED . . . . . . . . . . . . . . . . . . . . . . . . . 120

6.4 Expériences de recherche d"information translangue . . . . . . . . . . 122

6.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

7 Discussion et conclusion 133

7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

7.2 Synthèse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

7.3 Discussion et perspectives . . . . . . . . . . . . . . . . . . . . . . . 137

Bibliographie 145

Annexes 163

A Annexe: Expériences d"extraction lexicale bilingue spécialisée 163 A.1 Texte extrait du corpus CISMeF . . . . . . . . . . . . . . . . . . . . 164 A.2 Texte extrait du corpus CLINIWEB . . . . . . . . . . . . . . . . . . 165 A.3 Liste des mots vides français . . . . . . . . . . . . . . . . . . . . . . 166 A.4 Liste des mots vides anglais . . . . . . . . . . . . . . . . . . . . . . 169 A.5 Exemples de contextes . . . . . . . . . . . . . . . . . . . . . . . . . 172 A.6 Extrait des résultats numériques . . . . . . . . . . . . . . . . . . . . 173 B Annexe: Expériences de recherche d"information translangue 185quotesdbs_dbs3.pdfusesText_6
[PDF] lexique pharmaceutique

[PDF] lexique philosophie pdf

[PDF] lexique super héros

[PDF] lexique vocabulaire médical

[PDF] lexmark cx310 serveur smtp non configuré

[PDF] lexmark cx310n serveur smtp non configuré

[PDF] ley 100 de 1993 actualizada

[PDF] ley 100 de 1993 actualizada 2016

[PDF] ley 100 de 1993 libro 2 resumen

[PDF] ley 100 de 1993 libro 2 sgsss

[PDF] ley 100 de 1993 mapa conceptual

[PDF] ley 100 de 1993 pdf actualizada 2016

[PDF] ley 100 de 1993 pdf descargar

[PDF] ley 100 de 1993 resumen diapositivas

[PDF] ley 100 de 1993 resumen por libros