[PDF] [PDF] Traduction Automatique - Pages individuelles

Traduction anglais→français : exemple Bataille De la Grande-Bretagne J'ai toujours été un ventilateur de ce film et avais impatiemment attendu un



Previous PDF Next PDF





Rouleau, M (2001) : Initiation à la traduction générale Du - Érudit

Rouleau, M (2001) : Initiation à la traduction générale Du mot au texte, Brossard , Linguatech, 241 p Jean-Claude Gémar Volume 48, numéro 4, décembre 



[PDF] Les manuels de traduction : essai de classification - CORE

12 fév 2017 · peu plus vaste en ce qui concerne l'initiation à la traduction générale D'un point apprendre à traduire la langue Latine en langue Françoise



[PDF] La traductologie et les cours de traduction - Association française d

L'in- térêt est donc réel, et il est sans doute nécessaire de proposer une véritable initiation à la traduction professionnelle D'après notre expérience, les étudiants 



[PDF] Stratégies et techniques de traduction - 9h05 International

Le cours est destiné aux étudiants de la troisième année, ayant comme spécialité linguistique le français comme langue étrangère L'initiation à la traductologie 



[PDF] Traduction Spécialisée Multilingue (TSM) - Formation en traduction

Initiation à l'interprétariat d'entreprise et à la traduction à vue Langue A (anglais) Initiation à la traduction de documents de formats divers (Excel, Word, PDF, 



[PDF] Traduction professionnelle et enseignement de la traduction en france

17 mar 2011 · traduction qui visent, par l'enseignement, à conduire les étudiants vers une 26 Pour cette même raison, une initiation à des logiciels tels que 



[PDF] Traduction Automatique - Pages individuelles

Traduction anglais→français : exemple Bataille De la Grande-Bretagne J'ai toujours été un ventilateur de ce film et avais impatiemment attendu un



[PDF] TRADUCTION - Glendon Campus of York University

anglais/français et un BA spécialisé en traduction anglais/espagnol À ces diplômes, vous Initiation aux outils, aux principes et aux méthodes de la traduction

[PDF] initiation algorithmique seconde

[PDF] initiation au dessin technique pdf

[PDF] initiation au génie civil

[PDF] initiation au marketing pdf

[PDF] initiation biologie sous marine

[PDF] initiation comptabilité gratuit

[PDF] initiation elongation terminaison

[PDF] initiation excel 2010 pdf

[PDF] initiation outlook 2010 pdf

[PDF] initiation paniculaire

[PDF] initiation pratique ? la méthodologie des sciences humaines maurice angers pdf

[PDF] initiation windows 10 pdf

[PDF] initiation windows 8 pdf

[PDF] initiation word 2013 pdf

[PDF] initiative nationale pour le développement humain au maroc pdf

Introduction`a la Traduction Automatique

Traitement Automatique des Langues

Aur´elien Max

Universit

´e Paris-Sud 11, Orsay

Ann

´ee 2008-09

Traduction anglais→franc¸ais : exemple

Bataille De la Grande-Bretagne

J'ai toujours

´et´e un ventilateur de ce film et avais impatiemment attendu un d ´egagement de DVD pendant un certain temps. Quand j'ai d´ecouvert que MGM lib ´eraient ce film sur DVD, j'ai´et´e enchant´e ai suivi d'une certaine irritation quand j'ai d ´ecouvert le RRP 19,99, £ car le film´etait dehors aux USA pour $8. Encore un autre disque d' ´edition sp´eciale deuxi`emes des morceaux avec augment´e vers le haut de l'

´etiquette des prix.

Je fais des excuses par ceci

`a MGM pour de telles pens´ees d'unkind, parce que cette ´edition est superbe. La version des USA est dans mono, o`u ce d´egagement a 5,1 et DTS (il est excellent) et pour des ventilateurs de William Walton (ils ont seulement employ ´e environ 5 minutes de ses points dans le film original, Ron Goodwin assurant le repos), la bande sonore avec les pleins points de Walton comme alternative. L'image a ´et´e´egalement reconstitu´ee et a une pleine image anamorphic de 2.35 :1.

Traduction anglais→franc¸ais : exemple

Bataille

De la Grande-Bretagne

J'ai toujours´et´e un

ventilateur (fan ) de ce film et avais impatiemment attendu un d´egagement (release ) de DVD pendant un certain temps. Quand j'ai d´ecouvert que MGM lib´eraient (were releasing ) ce film sur DVD, j'ai´et´e enchant´e ai suivi d'une certaine irritation quand j'ai d

´ecouvert le RRP 19,99, £ (

the RRP (£19.99) car le film

´etait

dehors aux USA ( was out in the US ) pour $8. Encore un autre disque d' ´edition sp´eciale deuxi`emes des morceauxavec augment´e vers le haut de l'

´etiquette des prix

(with a hiked up price tag

Je fais des excuses par ceci

`a MGM pour de telles pens´ees d' unkind , parce que cette

´edition est superbe. La version des USA est

dans mono, o`u ce d´egagement a 5,1 et DTS (il est excellent) et pour des ventilateurs de William Walton (ils ont seulement employ

´e environ 5 minutes de ses

points (score ) dans le film original,

Ron Goodwin assurant le

repos ) (Ron Goodwin supplying the rest ), la bande sonore avec les pleins points de Walton comme alternative. L'image a´et´e egalement reconstitu´ee et a une pleine image anamorphic de 2.35 :1.

Introduction Traduction automatique Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation ConclusionsPlan du cours

1

Introduction

2

Traduction automatique

3

Approches bas´ees sur des r`egles

4

Approches bas´ees sur des donn´ees

5

´Evaluation de la traduction automatique

6

Quelques conclusions

Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Dotation des langues en moyens informatiques

Dotation minimale pour le traitement de la langue´ecrite (Berment, 2004) •saisie et visualisation: polices de caract`eres, saisie verticale, claviers virtuels, etc. •recherche et remplacement de texte: probl`eme pour les langues dont les mots peuvent

ˆetre´ecrits de diff´erentes mani`eres

(orthographe non fix ´ee ou probl`eme inh´erent au mode de saisie) •s´election de texte: probl`eme pour les syst`emes d'´ecriture non segment

´ee

•tri lexicographique: probl`eme pour les langues non segment´ees, et pour celles pour lesquelles il n'existe pas de tri lexicographique (ou plusieurs)

•correction orthographique

•(correction grammaticale, assistance stylistique) Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Identification automatique des langues

•Probl`eme

: d´eterminer automatiquement la langue d'un texte pour pouvoir lui faire subir le traitement appropri ´e •Informations fr´equemment utilis´ees en apprentissage supervis´e codes de caract`eres (ex :

˜n,c¸,oe)

caract´eristiques des syllables probabilit´e ind´ependante d'apparition de caract`eres probabilit´e jointe de combinaisons de plusieurs caract`eres pr´esence de mots outils/mots courts

•Difficult´es

N´ecessite une certaine taille de texte

Segmentation en langues lorsque plusieurs langues dans un mˆeme document

•Exemples de syst`emes

Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Exemple : trigrammes de lettres

•Segmentation de textes de 1 million de mots en 10 langues(Grefenstette, 1995) •Ajout de marqueurs de d´ebut et de fins de mots (ex : ck ,th •Obtention de 2500-3500 trigrammes par langue, et conservation de ceux apparaissant plus de 100 fois •Probabilit´e d'un trigramme : nombre d'occurrences de ce trigramme sur le nombre d'occurrences de trigrammes total •Probabilit´e qu'une phrase soit dans une langue donn´ee : calcul de la probabilit ´e de l'ensemble des tri-grammes constituant la phrase Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Exemple : mots courts fr´equents

•Les mots fr´equents (ex : conjonctions, d´eterminants, pr´epositions) peuvent

ˆetre caract´eristiques d'une langue

•Extraction des mots de cinq lettres ou moins sur le corpuspr´ec´edent (Grefenstette, 1995) •Obtention de 1000-2700 mots par langue (conservation de ceuxapparaissant plus de 3 fois) •Probabilit´e qu'une phrase soit dans une langue donn´ee : calcul de la probabilit ´e de l'ensemble des mots courts constituant la phrase Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

R´esultats sur l'identification des langues

•Les deux m´ethodes ont une tr`es bonne performance pour les phrases d'au moins 15 mots

•En dessous de 15 mots, l'approche par trigrammes de lettres estplus performante (les mots courts sont plus rares, par exemple dans

des titres) •Matrices de confusion pour les deux m´ethodes Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Corpus multilingues

•Fort besoin decorpus multilingues: concordanciers, extraction de terminologies, construction de syst `emes de traduction statistique, etc. •Lescorpus parall`elessont les plus utiles mais les plus rares : traductions de m

ˆemes textes

•Un des premiers corpus parall`eles multilingues connus (-196) : la pierre de Rosette (hi

´eroglyphes, d´emotique, grec)

•Alignement possible au niveau des phrases, des mots, dessyntagmes, des termes, etc. •Principales hypoth`eses pour l'alignement de phrases l'ordre des phrases dans deux traductions sera identique outr`es proche peu de suppressions ou d'ajout (alignements 1 :1 pr´epond´erants) corr´elation des longueurs de phrases (ex : rapport de 1,1 entre le franc¸ais et l'anglais) pr´esence de mots en relation de traduction entre eux (ancrage lexical) utilisation decognates(occurrences identiques ou qui se ressemblent graphiquement (ex : dates, symboles)) Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Exemples de corpus multilingues parall`eles

•Europarl : d´ebats parlementaires europ´eens en 11 langues (>30M mots) http://www.statmt.org/europarl/ •Hansards : d´ebats parlementaires canadiens anglais-franc¸ais (>20M mots) •Acquis Communautaire : textes de l´egislation dans les langues europ

´eennes (>50M mots)

http://langtech.jrc.it/JRC-Acquis.html

•Autres sources :

ELRA (European Language Resource Association)

(http://catalog.elra.info) LDC (Linguistic Data Consortium) (http://www.ldc.upenn.edu) NIST (National Institute of Standards and Technology) (http://www.nist.gov)

GigaWord corpus Fr-En, etc.

Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

La r´edaction`a vis´ee multilingue

•Langue de production des documents

dans une langue v´ehiculaire (essentiellement l'anglais) les r´edacteurs r´edigent souvent dans une langue´etrang`ere besoin d'uniformisation linguistique entre locuteurs de langues diff´erentes besoin de traduction vers les autres langues n´ecessit´e de modifier l'ensemble des traductions lors des mises`a jour dans la langue du r´edacteur documents maˆıtres de meilleur qualit´e besoin de traduction vers les autres langues n´ecessit´e de modifier l'ensemble des traductions lors des mises`a jour r´edaction technique parall`ele des r´edacteurs techniques de langues diff´erentes rec¸oivent l'information simultan

´ement

r´edaction ind´ependante (localisation) pour chaque langue n´ecessite de nombreux r´edacteurs n´ecessit´e de modifier l'ensemble des version lors des mises`a jour Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Contraintes sur la r´edaction

•Conventions de bonne r´edaction: assurer la bonne compr ´ehension des documents et l'homog´en´eit´e de documents r

´edig´es par plusieurs r´edacteurs

conventions d'´ecriture (ex : emplois des abr´eviations) pr´ef´erences terminologiques (ex : d´ecourager les abstractions inutiles (frequency selector Vs frequency channel selecting device pr´ef´erences stylistiques (ex : pr´ef´erer la r´ep´etition de mots plutˆot que l'emploi de synonymes, limiter la longueur des phrases) pr´ef´erences syntaxiques (ex : d´ecourager l'usage de la voix passive) •D´eveloppement deslangues contrˆol´ees: garantir la compr ´ehensibilit´e et la traductibilit´e des textes difficult´es de formalisation (d´efaut d'explicitation claire entre des relations entre les r `egles d'une langue contrˆol´ee et celles de la langue dont elle est issue) difficult´e`a faire´evoluer suffisamment rapidement la terminologie ainsi que pour anticiper toutes les utilisations des mots par les auteurs outils de v´erification de conformit´e`a une langue contrˆol´ee (probl`emes de propagation des corrections, probl `emes des corrections impossibles `a automatiser (ex : limiter la longueur des phrases)) Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Exemples de r`egles de langue contrˆol´ee

•use only approved terminology, e.g. windscreen rather than windshield •use only approved sense : follow only as 'come after', not 'obey' •avoid ambiguous words : replace, either (a) remove and put back, or (b) remove and put something else in place •only one 'topic' per sentence, e.g. one instruction, command •do not use pronouns instead of nouns if possible

•use short sentences, e.g. maximum 20 words

•avoid coordination of phrases and clauses

Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Aides`a la traduction

•Dictionnaires et terminologies multilingues

•M´emoires de traduction

base d'alignements de phrases d´ej`a traduites proposition de phrases candidates au traducteur puis post-´edition comparaisons au niveau de la phrase (fuzzy match ou exact match) : peu flexibles et non prise en compte du contexte outils tr`es r´epandus dans le domaine de la r´edaction technique •Recours`a des syst`emes deG´en´eration Automatique de Texte multilingue limit´es`a des domaines assez restreints (ex : bulletins m´et´eo) syst`emes coˆuteux`a construire et`a maintenir syst`emes de g´en´eration interactive multilingue : int´eressants pour des domaines tr `es contraints lorsque les donn´ees n'existent pas •Recours`a des syst`emes deTraduction Automatique traduction humaine assist´ee par ordinateur (

Machine-aided translation

traduction automatique interactive (

Human-aided machine translation)

traduction automatique r´evis´ee ou compl`etement automatique Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique

Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Plan du cours

1

Introduction

2

Traduction automatique

3

Approches bas´ees sur des r`egles

4

Approches bas´ees sur des donn´ees

5

´Evaluation de la traduction automatique

6

Quelques conclusions

Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay (pris de (Hutchins et Somers, 1992)

Introduction

Traduction automatique

Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Types de traduction

•Traduction (compl`etement) automatique :

r´evision ( post-editing ) importante sidiffusion r´evision minimale ou pas de r´evision pour lecture rapide (assimilation) pr´e-´edition du texte pour r´eduire les ambigu¨ıt´es et la complexit´e du texte `a l'extrˆeme, utilisation de langues contrˆol´ees

•Traduction interactive

r´esolution par un utilisateur d'ambigu¨ıt´es et plus g´en´eralement de probl `emes difficiles`a r´esoudre de fac¸on automatique Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique

Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Types de choix

Les choix li´es aux ambigu¨ıt´es interviennent`a tous les niveaux

•lors de l'analyse du texte source

ambigu¨ıt´e lexicale : analyse de to cry to weep /pleurer ou to shout /crier ambigu¨ıt´e structurale : he saw her shaking hands 1 he saw her welcoming somebody 2 he saw her suffering from the cold •lors du transfert lexical et structural entre langues choix lexical : to know connaˆıtre ou savoir choix structural : transformation d'une structure infinitive (

He likes to

swim ) en une structure adverbiale en allemand (

Er schwimmt gern

•lors de la g´en´eration du texte cible

choix lexical : grand big ,large ou great choix de l'ordre des mots : ses mains tremblantes her shaking hands Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique

Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Traduction assist´ee par ordinateur : hypoth`eses •Au moins une partie de la tˆache de traduction peutˆetre mod´elis´ee et r

´esolue en programmant un ordinateur

•Les diff´erences entre langues peuvent dans une certaine mesure etre r´egularis´ees •La recherche en traduction automatique doit donc : identifier les informations les plus utiles pour une situation donn´ee attribuer des poids relatifs aux diff´erents types d'informations

•Types de choix`a consid´erer

(Hutchins, 1991) groupes de mots particuliers informations morphologiques fonctions et relations syntaxiques traits et relations s´emantiques connaissances sur le domaine Traitement Automatique des LanguesUniversit´e Paris-Sud 11, Orsay

Introduction

Traduction automatique

Approches bas´ees sur des r`egles Approches bas´ees sur des donn´ees´Evaluation Conclusions

Traduction de groupes de mots

•Choix de traductions pour des groupes de mots particuliers : collocations, ex : pomme de terre idiomes, ex : ne pasˆetre aux pi`eces m´etaphores, ex : le pied de la montagne •L'identification des groupes de mots est un probl`eme plus g ´en´eralement pour l'ensemble des applications du Traitementquotesdbs_dbs8.pdfusesText_14