[PDF] Création dun outil daide linguistique pour la délivrance officinale et





Previous PDF Next PDF



Traduction assistée par ordinateur du français vers larabe

dlnformation Documentaire a 1'ENSSIB pour sa disponibilite



PARTIE I Traduction automatique et traduction assistée

environnements d'aide au traducteur ou au réviseur. minimale du système d'écriture de la langue source ici l'anglais. C'est le cas de tous.



Traduction non officielle le texte en anglais étant seul faisant

28 oct. 2020 Le 3 octobre 2017 le Bureau de l'Inspecteur général du HCR a reçu des allégations selon lesquelles la requérante aurait commis une faute.



DES PRIERES

Et nous sommes décidés avec l'aide de Dieu



Création dun outil daide linguistique pour la délivrance officinale et

23 nov. 2018 Illustration 37 : Tableau de traduction des chiffres de la page « Interrogation générale » langue anglaise sélectionnée.



Le recours à la traduction par les apprenants adultes dune langue

La troisième tâche était de traduire un article de journal court du japonais à l'anglais. L'enquêteur s'est assis à côté des participants en prenant des notes 



Bienvenue aux États-Unis : Un guide pour nouveaux immigrés

d'informatique et des cours d'anglais gratuits ainsi vous aider à mieux connaître votre communauté et les services disponibles pour.



Aides informatisées à la traduction collaborative bénévole sur le Web

18 janv. 2010 2.2 Aide à la traduction : couplage de références linguistiques . ... Figure 20 : Traduction anglais-arabe d'un document standard W3C .





VOLUME COMPLÉMENTAIRE AVEC DE NOUVEAUX

et de la traduction de feu John Trim des descripteurs pour le niveau C du Profile d'aider les apprenants les enseignants

1/270

UNIVERSITÉ JOSEPH FOURIER DE GRENOBLE

No attribué par la bibliothèque

/__/__/__/__/__/__/__/__/__/ THESE pour obtenir le grade de

DOCTEUR DE l"Université Joseph Fourier

Spécialité : "INFORMATIQUE : SYSTEMES ET COMMUNICATION" préparée au GETA (CLIPS, IMAG), puis au GETALP (LIG), ainsi qu"au NII (Japon) et à l"Université de Tokyo dans le cadre de l"École Doctorale "Mathématiques, Sciences et Technologie de l"Information" présentée et soutenue publiquement par

Youcef BEY

le 2 juin 2008

Aides informatisées à

la traduction collaborative bénévole sur le Web JURY

Marie-Christine Rousset , Président

Eric Wehrli , Rapporteur

Jacques Chauché , Rapporteur

Emmanuel Planas , Rapporteur

Françoise Létoublon , Examinateur

Mathieu Mangeot-Nagata , Examinateur

Kyo Kageura , Co-directeur de thèse

Christian Boitet , Directeur de thèse

2/270 3/270

Remerciements

Je tiens à remercier en tout premier lieu le Professeur Christian Boitet, mon directeur de

thèse, qui m"a conseillé scientifiquement et aidé pratiquement tout au long de cette thèse. Il

m"a fait apprendre les fondements de la recherche et m"a donné la volonté d"avancer dans les moments les plus difficiles. Je lui suis très reconnaissant du savoir qu"il m"a transmis que je

considère comme un trésor exploitable tout au long de ma future carrière de la recherche, en

particulier, dans le domaine de la traduction automatique. Je tiens à remercier le Prof. Kyo Kageura pour m"avoir accueilli au NII (National Institute of Informatics) en stage avec une bourse attribuée par l"association japonaise JASSO (Japan Student Services Organization), ainsi que pour son encadrement et soutien durant mon séjour à l"Université de Tokyo à la " Graduate School of Education » dans le cadre du programme CDFJ (Collège Doctoral Franco-Japonais). Son expérience dans le domaine de la traduction

des droits de l"homme a été pour moi le " pilier » à partir duquel j"ai identifié les problèmes

réels que rencontrent les traducteurs bénévoles. Je voudrais adresser un remerciement particulier au Professeur Akiko Aizawa (NII) pour son soutien scientifique et financier durant mon séjour au NII, et pour m"avoir accepté en deuxième stage de 6 mois dans le cadre du programme de stages internationaux offerts par le

NII aux étudiants étrangers.

J"ai eu également le plaisir de collaborer au projet DEMGOL avec deux équipes, une en

Italie et l"autre en France. En France, je tiens à remercier Mme le Professeur Françoise

Letoublon et le docteur Valérie Bellynck pour leur aide précieuse durant mes expériences. En

Italie, je tiens à remercier aussi dans le même groupe le docteur Francesca Marzari et

Giovanni Zorzetti, grâce à qui nous avons mené ensemble des expériences avec succès sur

notre environnement. Je remercie mes rapporteurs, les Professeurs Jacques Chauché et Eric Wehrli, ainsi que le

Dr. Emmanuel Planas, qui ont accepté d"être rapporteurs de ma thèse à une période très

4/270 chargée. Je voudrais adresser un remerciement particulier au professeur Marie-Christine Rousset pour avoir accepté de présider mon jury. 5/270

Table des matières

.9b9h[9 9b [LDb9 ͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵ ЊА

6/270 7/270

В͵Ќ͵Ћ L‘{[͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵ ЋЌЉ

/hb/[...{Lhb D9b9w![9 ͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵ ЋЌА

.L.[LhDw!tIL9 ͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵ ЋЍЊ

!bb9-9 ! ͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵ ЋЎЌ

!bb9-9 . ͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵ ЋЎЎ

8/270 9/270

Table des figures

Figure 1 : Interface en ligne de la base terminologique " IATE » ........................................... 27

Figure 2 : Interface de consultation du glossaire français de Mozilla ...................................... 36

Figure 3 : Traduction avec post-édition dans Yakushite.net .................................................... 38

Figure 4 : Éditeur de traduction de Translationwiki.net ........................................................... 41

Figure 5 : Gestion des versions de traduction à la Wiki ........................................................... 42

Figure 6 : Structure du dictionnaire Papillon (partie Papillon-NADIA) .................................. 43

Figure 7 : Structure des entrées dans un fichier " po » ............................................................ 49

Figure 8 : Pratique de la traduction bénévole ........................................................................... 50

Figure 9 : L"article " Shorten » du dictionnaire " Wiktionary » .............................................. 54

Figure 10 : Communication par courriel dans la communauté " Traduc » .............................. 58

Figure 11 : Présentation des bitextes " KDE » dans le corpus OPUS ...................................... 66

Figure 12 : Architecture générale du système QRLex ............................................................. 70

Figure 14 : Article de BABEL après récupération (objet LISP). ............................................. 76

Figure 15 : Guide de prononciation des noms propres en katakanas ....................................... 81

Figure 16 : Les métadonnées dans XLD .................................................................................. 84

Figure 17 : Définition de l"élément " source » dans XLD ....................................................... 84

Figure 18 : Définition de l"élément " cible » dans XLD .......................................................... 85

Figure 19 : Types des liens Wiki dans le Wiktionary .............................................................. 86

Figure 20 : Traduction anglais-arabe d"un document standard W3C ...................................... 94

Figure 21 : Méthode de détection de paires pertinentes ........................................................... 97

Figure 22 : Interface principale de configuration de QRselect ................................................ 98

Figure 23 : Interface de détection de documents anglais-japonais avec QRselect ................... 99

Figure 24 : Suggestions dictionnairiques dans QRedit .......................................................... 104

Figure 25 : Editeur de QRLex : interface de QRedit .............................................................. 106

Figure 26 : Méthode d"import et prétraitement ...................................................................... 118

Figure 27 : La traduction transitive ........................................................................................ 119

Figure 28 : Format XLD du dictionnaire technique arabe d"Arabeyes .................................. 120

Figure 29 : Interface de manipulation des dictionnaires ........................................................ 121

Figure 30 : Manipulation hiérarchique de ressources ............................................................ 122

Figure 31 : Mode " lecture » .................................................................................................. 123

Figure 32 : Problème de visualisation dû à une mauvaise détection du codage .................... 128

Figure 33 : Exemple de l"interface d"analyse d"un texte hétérogène par SANDOH ............. 129

Figure 34 : Structure d"un dans le compagnon de traduction (CT) ............................. 131

Figure 35 : Structuration des segments dans un compagnon de traduction ........................... 136

Figure 36 : Un code HTML source - à transformer en TMX ................................................ 137

Figure 37 : Transformation du code HTML ci-dessus en TMX ............................................ 138

Figure 38 : Processus d"import et de segmentation ................................................................ 139

Figure 39 : Structure des entrées du dictionnaire " Arabeyes » ............................................. 141

Figure 40 : Localisation de QRselect en Arabe (QRselect-2) ................................................ 145

Figure 41 : Liste extensible de mots réservés. ........................................................................ 145

Figure 42 : Nouvelle interface de QRselect ........................................................................... 146

Figure 43 : Nouvel algorithme de QRselect ........................................................................... 147

Figure 44 : Édition des mémoires de traduction dans BTedit ................................................ 157

Figure 45 : Augmentation de dictionnaires dans BEYTrans .................................................. 158

Figure 46 : Mode lecture à la Wiki de notices traduites dans BTdemgol .............................. 164

10/270

Figure 47 : Appel à la TA et post-édition ............................................................................... 166

Figure 48 : Suggestions synchrones de la MT ....................................................................... 166

Figure 49 : Suggestions dictionnairiques avec mise à jour directe ........................................ 167

Figure 50 : Temps dépensé pour les notices de la lettre L de DEMGOL .............................. 171

Figure 51 : Temps dépensé pour les notices de la lettre M avec BEYTrans .......................... 171

Figure 52 : Fichier de messages anglais-arabe du projet Tikiwiki (en PHP) ......................... 177

Figure 53 : Contenu de communications entre les trois sujets ............................................... 179

Figure 54 : Extrait des traductions collaboratives (3 bénévoles) ........................................... 180

Figure 55 : Exemple complet d"une S-SSTC ......................................................................... 190

Figure 56 : Exemple d"un document UNL XML-isé ............................................................. 191

Figure 57 : Interface d"évaluation de la fluidité ..................................................................... 193

Figure 58 : Interface de l"évaluation d"adéquation (phrase de référence visualisée) ............. 193

Figure 59 : Une instance du BTEC en TMX étendu .............................................................. 197

Figure 60 : Graphe UNL d"un énoncé espagnol déconverti en français et anglais ................ 200

Figure 61 : Visualisation de corpus parallèles ........................................................................ 204

Figure 62 : Visualisation d"une masse de données dans BEYTrans ...................................... 212

Figure 63 : Visualisation parallèle de corpus en HTML transcrit (Wiki) .............................. 213

Figure 64 : Transcription du HTML dans les Wiki ................................................................ 213

Figure 65 : Passage en mode lecture au mode édition ........................................................... 214

Figure 66 : Communication de BEYTrans avec le déconvertisseur UNL-russe .................... 218

Figure 67 : Exemple de filtrage de données avec masquage de ligne .................................... 219

Figure 68 : Structure XML interprétable par BTedit ............................................................. 227

Figure 69 : Navigation et visualisation parallèle dans un corpus multilingue ....................... 228

Figure 70 : Plusieurs sorties de TA avec post-édition ............................................................ 229

Figure 71 : Instance de l"éditeur d"évaluation ........................................................................ 232

Figure 72 : Interface d"évaluation objective ........................................................................... 235

11/270

Table des tables

Table 1 : Nature des documents à traduire dans le projet FrenchMozilla ................................ 34

Table 2 : Identification des besoins des traducteurs bénévoles ................................................ 45

Table 3 : Équivalents des éléments CDM dans le FeM, le DHO et le NODE ......................... 78

Table 4 : Ressources linguistiques du projet QRLex ............................................................... 80

Table 5 : Exemple d"entrées de référence dans QRLex ........................................................... 82

Table 6 : Quelques corpus obtenus par recyclage .................................................................... 91

Table 7 : Evaluation de la performance de SANDOH sur un texte hétérogène ..................... 130

Table 8 : Quelques entrées du dictionnaire " FrenchMozilla » .............................................. 142

Table 9 : Résultats d"évaluation du système QRselect avec 33 mots clés ............................. 150

Table 10 : Temps de traduction avec et sans BEYTrans ........................................................ 169

Table 11 : Conditions de l"expérience du deuxième protocole .............................................. 178

Table 12 : Comparaison entre méthode classique et la méthode collaborative ...................... 181

Table 13 : Quelques chiffres à propos du corpus JRC-Aquis ................................................ 188

Table 14 : Forme des énoncés et des propositions dans le BTEC .......................................... 195

Table 15 : Liste de corpus libres ............................................................................................ 226

Table 16 : Une fausse conversion Kana-Kanji ....................................................................... 233

Table 17 : Scores d"évaluation JA-EN - dialogues oraux (lecture) ....................................... 265

Table 18 : Scores d"évaluation CN-EN - dialogues oraux (spontanés) ................................. 266

Table 19 : Scores d"évaluation AR-EN - dialogues oraux (lecture) ...................................... 266

Table 20 : Scores d"évaluation CN-EN - dialogues oraux (lecture) ...................................... 267

Table 21 : Scores d"évaluation IT-EN - dialogues oraux (lecture) ........................................ 267

12/270

13/270

Introduction générale

Après un DEA consacré à la génération pseudo-aléatoire de très grands corpus plus au ou

moins richement étiquetés, dans le but de développer des méthodes " empiriques » (par

apprentissage) d"identification de relations sémantiques, j"ai recherché un sujet aussi

intéressant mais offrant aussi une perspective d"application rapide et utile.

Depuis près de 10 ans, le GETA

1 (GETALP depuis 2007) avait proposé l"idée de mettre à

disposition des traducteurs " occasionnels » (on pensait surtout à la communauté scientifique

francophone), via la Toile, des outils et ressources jusque là réservés aux traducteurs

professionnels. Une communauté aurait partagé une mémoire de traductions et des dictionnaires construits par elle-même et pour elle-même, en utilisant (chez soi, sur PC ou Mac) un outil gratuit dérivé d"un outil professionnel tel que TM2 (IBM), Trados, Déjà Vu (Atril), Eurolang Optimizer (Site/Eurolang), XMS (Xerox), ou Similis (Lingua & Machina). Parlant de cette idée avec le Professeur Kyo Kageura durant l"été 2004, il est apparu qu"il venait de lancer un projet de ce type, à titre de chercheur en informatique et de traducteur

bénévole de textes sur les droits de l"homme. De notre côté, nous avons proposé deux idées

nouvelles, rendues possibles par le développement du Web et des services de traduction

automatique (TA) gratuits :

1. Pourquoi ne pas proposer aux traducteurs des " prétraductions » par TA, à côté des

classiques " suggestions » des mémoires de traduction (MT) ?

2. Pourquoi ne pas proposer aux traducteurs de traduire " en ligne », comme avec

translationwiki.net (Translationwiki, 2006), mais avec en plus des " aides traductionnelles », et pas seulement " hors ligne », avec un simple partage de ressources via un serveur ? La première idée (utilisation de la TA) ne pose que des problèmes techniques simples, tant qu"on ne cherche pas à développer un système pour une communauté donnée.

1 En 1995, Ch. Boitet, B. Oudet et Y. Chiaramella proposèrent sur ce concept le projet " Montaigne » post-

Eurolang, qui ne put malheureusement pas être financé par le MRI de l"époque.

14/270

Par contre, la deuxième idée suppose un changement du mode de travail des traducteurs

bénévoles, et cela est apparu comme un problème majeur. C"est pourquoi le Professeur

Kageura nous a conseillé de commencer par participer à son projet QRLex, de façon à bien

comprendre les besoins (actuels et potentiels) des traducteurs bénévoles, et à résoudre les

problèmes indépendants du mode de travail (hors ligne ou en ligne), à savoir la réutilisation et

le partage de ressources traductionnelles (dictionnaires, lexiques, mémoires de traduction,

documents ou fragments déjà traduits), et la communication entre traducteurs. Cette première

étape de notre recherche a duré un peu plus d"un an et fait l"objet de la première partie de cette

thèse. Dans un second temps, commençant en parallèle avec la fin du travail précédent, nous

nous sommes concentré sur les problèmes posés par la traduction bénévole " en ligne », avec

3 axes principaux :

1. Comment concevoir et implémenter un " éditeur traductionnel » utilisable à travers

tout navigateur Web, en mode Wiki, i.e. en permettant à plusieurs contributeurs de participer en même temps à la traduction d"un même document, et ce de façon conviviale ?

2. Comment y intégrer des aides traductionnelles " proactives », i.e. comment

proposer des équivalents lexicaux et des suggestions de traduction pour des " segments » complets au moment où on veut les traduire ?

3. Comment offrir un " support » à la communauté et au travail coopératif entre

traducteurs d"une même communauté en utilisant au mieux les possibilités liées à la situation " en ligne », sans toutefois " forcer » des contacts immédiats de façon intrusive ? Ce travail fait l"objet de notre deuxième partie, dans laquelle nous décrivons la solution

des problèmes en question, telle qu"implémentée dans notre plate-forme Web BEYTrans

(Better Environment for Your Translation). Nous présentons en détail l"expérimentation faite

sur le projet DEMGOL en italien-français (traduction du Dictionnaire Étymologique de la Mythologie Grecque On Line), et un second protocole d"évaluation mesurant mieux l"apport spécifique de l"aspet communautaire et Wiki, et dont la mise en oeuvre va commencer sur la localisation de Tikiwiki.

Enfin, nous nous sommes demandé si BEYTrans ne pourrait pas être utilisé de façon

" réflexive », pour améliorer sa ou ses mémoires de traductions, en les assimilant à de très

15/270

gros documents. Cela nous a conduit à l"idée de l"étendre (du point de vue du " passage à

l"échelle ») aux très gros corpus parallèles multilingues utilisés pour la construction et

l"évaluation de systèmes de TAO statistiques (ou plutôt probabilistes). Nous décrivons dans la

troisième partie la solution des problèmes associés et plusieurs expérimentations sur des

corpus utilisés lors de diverses campagnes d"évaluation de systèmes de TA.

16/270

17/270

Partie I

Ressources linguistiques multilingues destinées àquotesdbs_dbs45.pdfusesText_45
[PDF] aide urgence sur histoire des arts (anne frank) 3ème Français

[PDF] AIDE URGENCE SVP 2nde Mathématiques

[PDF] aide urgent a remettre le 3 janvier 2012 ? 7h 3ème Français

[PDF] AIDE URGENT BREVET!!!! 3ème Autre

[PDF] Aide urgent fonction/intervalle 2nde Mathématiques

[PDF] AIDE URGENT MATHS EX7PAGE154 SESAMATHS 3EME SVP!!! 3ème Mathématiques

[PDF] aide urgent, les statistiques 1ère Mathématiques

[PDF] aide urgente 2nde Mathématiques

[PDF] AIDE URGENTE BREVET!! 3ème Autre

[PDF] AIDE URGENTE EXERCICE DE MATHS SUR LES FONCTION Bac +5 Mathématiques

[PDF] Aide urgente français 6ème Français

[PDF] aide urgente svp inequation 2nde Mathématiques

[PDF] Aide urgenteeeee 6ème Mathématiques

[PDF] AIDE! Devoir sur les fonctions pour le 7/05 3ème Mathématiques

[PDF] AIDE! Oral sur l'histoire de l'art 3ème Autre