Traduction assistée par ordinateur du français vers larabe
dlnformation Documentaire a 1'ENSSIB pour sa disponibilite
PARTIE I Traduction automatique et traduction assistée
environnements d'aide au traducteur ou au réviseur. minimale du système d'écriture de la langue source ici l'anglais. C'est le cas de tous.
Traduction non officielle le texte en anglais étant seul faisant
28 oct. 2020 Le 3 octobre 2017 le Bureau de l'Inspecteur général du HCR a reçu des allégations selon lesquelles la requérante aurait commis une faute.
DES PRIERES
Et nous sommes décidés avec l'aide de Dieu
Création dun outil daide linguistique pour la délivrance officinale et
23 nov. 2018 Illustration 37 : Tableau de traduction des chiffres de la page « Interrogation générale » langue anglaise sélectionnée.
Le recours à la traduction par les apprenants adultes dune langue
La troisième tâche était de traduire un article de journal court du japonais à l'anglais. L'enquêteur s'est assis à côté des participants en prenant des notes
Bienvenue aux États-Unis : Un guide pour nouveaux immigrés
d'informatique et des cours d'anglais gratuits ainsi vous aider à mieux connaître votre communauté et les services disponibles pour.
Aides informatisées à la traduction collaborative bénévole sur le Web
18 janv. 2010 2.2 Aide à la traduction : couplage de références linguistiques . ... Figure 20 : Traduction anglais-arabe d'un document standard W3C .
La traduction vers larabe des textes relatifs aux droits humains
Mme Parussa pour leur accueil
VOLUME COMPLÉMENTAIRE AVEC DE NOUVEAUX
et de la traduction de feu John Trim des descripteurs pour le niveau C du Profile d'aider les apprenants les enseignants
UNIVERSITÉ JOSEPH FOURIER DE GRENOBLE
No attribué par la bibliothèque
/__/__/__/__/__/__/__/__/__/ THESE pour obtenir le grade deDOCTEUR DE l"Université Joseph Fourier
Spécialité : "INFORMATIQUE : SYSTEMES ET COMMUNICATION" préparée au GETA (CLIPS, IMAG), puis au GETALP (LIG), ainsi qu"au NII (Japon) et à l"Université de Tokyo dans le cadre de l"École Doctorale "Mathématiques, Sciences et Technologie de l"Information" présentée et soutenue publiquement parYoucef BEY
le 2 juin 2008Aides informatisées à
la traduction collaborative bénévole sur le Web JURYMarie-Christine Rousset , Président
Eric Wehrli , Rapporteur
Jacques Chauché , Rapporteur
Emmanuel Planas , Rapporteur
Françoise Létoublon , Examinateur
Mathieu Mangeot-Nagata , Examinateur
Kyo Kageura , Co-directeur de thèse
Christian Boitet , Directeur de thèse
2/270 3/270Remerciements
Je tiens à remercier en tout premier lieu le Professeur Christian Boitet, mon directeur dethèse, qui m"a conseillé scientifiquement et aidé pratiquement tout au long de cette thèse. Il
m"a fait apprendre les fondements de la recherche et m"a donné la volonté d"avancer dans les moments les plus difficiles. Je lui suis très reconnaissant du savoir qu"il m"a transmis que jeconsidère comme un trésor exploitable tout au long de ma future carrière de la recherche, en
particulier, dans le domaine de la traduction automatique. Je tiens à remercier le Prof. Kyo Kageura pour m"avoir accueilli au NII (National Institute of Informatics) en stage avec une bourse attribuée par l"association japonaise JASSO (Japan Student Services Organization), ainsi que pour son encadrement et soutien durant mon séjour à l"Université de Tokyo à la " Graduate School of Education » dans le cadre du programme CDFJ (Collège Doctoral Franco-Japonais). Son expérience dans le domaine de la traductiondes droits de l"homme a été pour moi le " pilier » à partir duquel j"ai identifié les problèmes
réels que rencontrent les traducteurs bénévoles. Je voudrais adresser un remerciement particulier au Professeur Akiko Aizawa (NII) pour son soutien scientifique et financier durant mon séjour au NII, et pour m"avoir accepté en deuxième stage de 6 mois dans le cadre du programme de stages internationaux offerts par leNII aux étudiants étrangers.
J"ai eu également le plaisir de collaborer au projet DEMGOL avec deux équipes, une enItalie et l"autre en France. En France, je tiens à remercier Mme le Professeur Françoise
Letoublon et le docteur Valérie Bellynck pour leur aide précieuse durant mes expériences. En
Italie, je tiens à remercier aussi dans le même groupe le docteur Francesca Marzari et
Giovanni Zorzetti, grâce à qui nous avons mené ensemble des expériences avec succès sur
notre environnement. Je remercie mes rapporteurs, les Professeurs Jacques Chauché et Eric Wehrli, ainsi que leDr. Emmanuel Planas, qui ont accepté d"être rapporteurs de ma thèse à une période très
4/270 chargée. Je voudrais adresser un remerciement particulier au professeur Marie-Christine Rousset pour avoir accepté de présider mon jury. 5/270Table des matières
.9b9h[9 9b [LDb9 ͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵ ЊА
6/270 7/270В͵Ќ͵Ћ L{[͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵ ЋЌЉ
/hb/[...{Lhb D9b9w![9 ͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵ ЋЌА
.L.[LhDw!tIL9 ͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵ ЋЍЊ
!bb9-9 ! ͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵ ЋЎЌ
!bb9-9 . ͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵͵ ЋЎЎ
8/270 9/270Table des figures
Figure 1 : Interface en ligne de la base terminologique " IATE » ........................................... 27
Figure 2 : Interface de consultation du glossaire français de Mozilla ...................................... 36
Figure 3 : Traduction avec post-édition dans Yakushite.net .................................................... 38
Figure 4 : Éditeur de traduction de Translationwiki.net ........................................................... 41
Figure 5 : Gestion des versions de traduction à la Wiki ........................................................... 42
Figure 6 : Structure du dictionnaire Papillon (partie Papillon-NADIA) .................................. 43
Figure 7 : Structure des entrées dans un fichier " po » ............................................................ 49
Figure 8 : Pratique de la traduction bénévole ........................................................................... 50
Figure 9 : L"article " Shorten » du dictionnaire " Wiktionary » .............................................. 54
Figure 10 : Communication par courriel dans la communauté " Traduc » .............................. 58
Figure 11 : Présentation des bitextes " KDE » dans le corpus OPUS ...................................... 66
Figure 12 : Architecture générale du système QRLex ............................................................. 70
Figure 14 : Article de BABEL après récupération (objet LISP). ............................................. 76
Figure 15 : Guide de prononciation des noms propres en katakanas ....................................... 81
Figure 16 : Les métadonnées dans XLD .................................................................................. 84
Figure 17 : Définition de l"élément " source » dans XLD ....................................................... 84
Figure 18 : Définition de l"élément " cible » dans XLD .......................................................... 85
Figure 19 : Types des liens Wiki dans le Wiktionary .............................................................. 86
Figure 20 : Traduction anglais-arabe d"un document standard W3C ...................................... 94
Figure 21 : Méthode de détection de paires pertinentes ........................................................... 97
Figure 22 : Interface principale de configuration de QRselect ................................................ 98
Figure 23 : Interface de détection de documents anglais-japonais avec QRselect ................... 99
Figure 24 : Suggestions dictionnairiques dans QRedit .......................................................... 104
Figure 25 : Editeur de QRLex : interface de QRedit .............................................................. 106
Figure 26 : Méthode d"import et prétraitement ...................................................................... 118
Figure 27 : La traduction transitive ........................................................................................ 119
Figure 28 : Format XLD du dictionnaire technique arabe d"Arabeyes .................................. 120
Figure 29 : Interface de manipulation des dictionnaires ........................................................ 121
Figure 30 : Manipulation hiérarchique de ressources ............................................................ 122
Figure 31 : Mode " lecture » .................................................................................................. 123
Figure 32 : Problème de visualisation dû à une mauvaise détection du codage .................... 128
Figure 33 : Exemple de l"interface d"analyse d"un texte hétérogène par SANDOH ............. 129
Figure 34 : Structure d"un
Figure 35 : Structuration des segments dans un compagnon de traduction ........................... 136
Figure 36 : Un code HTML source - à transformer en TMX ................................................ 137
Figure 37 : Transformation du code HTML ci-dessus en TMX ............................................ 138
Figure 38 : Processus d"import et de segmentation ................................................................ 139
Figure 39 : Structure des entrées du dictionnaire " Arabeyes » ............................................. 141
Figure 40 : Localisation de QRselect en Arabe (QRselect-2) ................................................ 145
Figure 41 : Liste extensible de mots réservés. ........................................................................ 145
Figure 42 : Nouvelle interface de QRselect ........................................................................... 146
Figure 43 : Nouvel algorithme de QRselect ........................................................................... 147
Figure 44 : Édition des mémoires de traduction dans BTedit ................................................ 157
Figure 45 : Augmentation de dictionnaires dans BEYTrans .................................................. 158
Figure 46 : Mode lecture à la Wiki de notices traduites dans BTdemgol .............................. 164
10/270
Figure 47 : Appel à la TA et post-édition ............................................................................... 166
Figure 48 : Suggestions synchrones de la MT ....................................................................... 166
Figure 49 : Suggestions dictionnairiques avec mise à jour directe ........................................ 167
Figure 50 : Temps dépensé pour les notices de la lettre L de DEMGOL .............................. 171
Figure 51 : Temps dépensé pour les notices de la lettre M avec BEYTrans .......................... 171
Figure 52 : Fichier de messages anglais-arabe du projet Tikiwiki (en PHP) ......................... 177
Figure 53 : Contenu de communications entre les trois sujets ............................................... 179
Figure 54 : Extrait des traductions collaboratives (3 bénévoles) ........................................... 180
Figure 55 : Exemple complet d"une S-SSTC ......................................................................... 190
Figure 56 : Exemple d"un document UNL XML-isé ............................................................. 191
Figure 57 : Interface d"évaluation de la fluidité ..................................................................... 193
Figure 58 : Interface de l"évaluation d"adéquation (phrase de référence visualisée) ............. 193
Figure 59 : Une instance du BTEC en TMX étendu .............................................................. 197
Figure 60 : Graphe UNL d"un énoncé espagnol déconverti en français et anglais ................ 200
Figure 61 : Visualisation de corpus parallèles ........................................................................ 204
Figure 62 : Visualisation d"une masse de données dans BEYTrans ...................................... 212
Figure 63 : Visualisation parallèle de corpus en HTML transcrit (Wiki) .............................. 213
Figure 64 : Transcription du HTML dans les Wiki ................................................................ 213
Figure 65 : Passage en mode lecture au mode édition ........................................................... 214
Figure 66 : Communication de BEYTrans avec le déconvertisseur UNL-russe .................... 218Figure 67 : Exemple de filtrage de données avec masquage de ligne .................................... 219
Figure 68 : Structure XML interprétable par BTedit ............................................................. 227
Figure 69 : Navigation et visualisation parallèle dans un corpus multilingue ....................... 228
Figure 70 : Plusieurs sorties de TA avec post-édition ............................................................ 229
Figure 71 : Instance de l"éditeur d"évaluation ........................................................................ 232
Figure 72 : Interface d"évaluation objective ........................................................................... 235
11/270
Table des tables
Table 1 : Nature des documents à traduire dans le projet FrenchMozilla ................................ 34
Table 2 : Identification des besoins des traducteurs bénévoles ................................................ 45
Table 3 : Équivalents des éléments CDM dans le FeM, le DHO et le NODE ......................... 78
Table 4 : Ressources linguistiques du projet QRLex ............................................................... 80
Table 5 : Exemple d"entrées de référence dans QRLex ........................................................... 82
Table 6 : Quelques corpus obtenus par recyclage .................................................................... 91
Table 7 : Evaluation de la performance de SANDOH sur un texte hétérogène ..................... 130
Table 8 : Quelques entrées du dictionnaire " FrenchMozilla » .............................................. 142
Table 9 : Résultats d"évaluation du système QRselect avec 33 mots clés ............................. 150
Table 10 : Temps de traduction avec et sans BEYTrans ........................................................ 169
Table 11 : Conditions de l"expérience du deuxième protocole .............................................. 178
Table 12 : Comparaison entre méthode classique et la méthode collaborative ...................... 181
Table 13 : Quelques chiffres à propos du corpus JRC-Aquis ................................................ 188
Table 14 : Forme des énoncés et des propositions dans le BTEC .......................................... 195
Table 15 : Liste de corpus libres ............................................................................................ 226
Table 16 : Une fausse conversion Kana-Kanji ....................................................................... 233
Table 17 : Scores d"évaluation JA-EN - dialogues oraux (lecture) ....................................... 265
Table 18 : Scores d"évaluation CN-EN - dialogues oraux (spontanés) ................................. 266
Table 19 : Scores d"évaluation AR-EN - dialogues oraux (lecture) ...................................... 266
Table 20 : Scores d"évaluation CN-EN - dialogues oraux (lecture) ...................................... 267
Table 21 : Scores d"évaluation IT-EN - dialogues oraux (lecture) ........................................ 267
12/270
13/270
Introduction générale
Après un DEA consacré à la génération pseudo-aléatoire de très grands corpus plus au ou
moins richement étiquetés, dans le but de développer des méthodes " empiriques » (par
apprentissage) d"identification de relations sémantiques, j"ai recherché un sujet aussi
intéressant mais offrant aussi une perspective d"application rapide et utile.Depuis près de 10 ans, le GETA
1 (GETALP depuis 2007) avait proposé l"idée de mettre à
disposition des traducteurs " occasionnels » (on pensait surtout à la communauté scientifique
francophone), via la Toile, des outils et ressources jusque là réservés aux traducteurs
professionnels. Une communauté aurait partagé une mémoire de traductions et des dictionnaires construits par elle-même et pour elle-même, en utilisant (chez soi, sur PC ou Mac) un outil gratuit dérivé d"un outil professionnel tel que TM2 (IBM), Trados, Déjà Vu (Atril), Eurolang Optimizer (Site/Eurolang), XMS (Xerox), ou Similis (Lingua & Machina). Parlant de cette idée avec le Professeur Kyo Kageura durant l"été 2004, il est apparu qu"il venait de lancer un projet de ce type, à titre de chercheur en informatique et de traducteurbénévole de textes sur les droits de l"homme. De notre côté, nous avons proposé deux idées
nouvelles, rendues possibles par le développement du Web et des services de traduction
automatique (TA) gratuits :1. Pourquoi ne pas proposer aux traducteurs des " prétraductions » par TA, à côté des
classiques " suggestions » des mémoires de traduction (MT) ?2. Pourquoi ne pas proposer aux traducteurs de traduire " en ligne », comme avec
translationwiki.net (Translationwiki, 2006), mais avec en plus des " aides traductionnelles », et pas seulement " hors ligne », avec un simple partage de ressources via un serveur ? La première idée (utilisation de la TA) ne pose que des problèmes techniques simples, tant qu"on ne cherche pas à développer un système pour une communauté donnée.1 En 1995, Ch. Boitet, B. Oudet et Y. Chiaramella proposèrent sur ce concept le projet " Montaigne » post-
Eurolang, qui ne put malheureusement pas être financé par le MRI de l"époque.14/270
Par contre, la deuxième idée suppose un changement du mode de travail des traducteursbénévoles, et cela est apparu comme un problème majeur. C"est pourquoi le Professeur
Kageura nous a conseillé de commencer par participer à son projet QRLex, de façon à biencomprendre les besoins (actuels et potentiels) des traducteurs bénévoles, et à résoudre les
problèmes indépendants du mode de travail (hors ligne ou en ligne), à savoir la réutilisation et
le partage de ressources traductionnelles (dictionnaires, lexiques, mémoires de traduction,
documents ou fragments déjà traduits), et la communication entre traducteurs. Cette première
étape de notre recherche a duré un peu plus d"un an et fait l"objet de la première partie de cette
thèse. Dans un second temps, commençant en parallèle avec la fin du travail précédent, nousnous sommes concentré sur les problèmes posés par la traduction bénévole " en ligne », avec
3 axes principaux :
1. Comment concevoir et implémenter un " éditeur traductionnel » utilisable à travers
tout navigateur Web, en mode Wiki, i.e. en permettant à plusieurs contributeurs de participer en même temps à la traduction d"un même document, et ce de façon conviviale ?2. Comment y intégrer des aides traductionnelles " proactives », i.e. comment
proposer des équivalents lexicaux et des suggestions de traduction pour des " segments » complets au moment où on veut les traduire ?3. Comment offrir un " support » à la communauté et au travail coopératif entre
traducteurs d"une même communauté en utilisant au mieux les possibilités liées à la situation " en ligne », sans toutefois " forcer » des contacts immédiats de façon intrusive ? Ce travail fait l"objet de notre deuxième partie, dans laquelle nous décrivons la solutiondes problèmes en question, telle qu"implémentée dans notre plate-forme Web BEYTrans
(Better Environment for Your Translation). Nous présentons en détail l"expérimentation faite
sur le projet DEMGOL en italien-français (traduction du Dictionnaire Étymologique de la Mythologie Grecque On Line), et un second protocole d"évaluation mesurant mieux l"apport spécifique de l"aspet communautaire et Wiki, et dont la mise en oeuvre va commencer sur la localisation de Tikiwiki.Enfin, nous nous sommes demandé si BEYTrans ne pourrait pas être utilisé de façon
" réflexive », pour améliorer sa ou ses mémoires de traductions, en les assimilant à de très
15/270
gros documents. Cela nous a conduit à l"idée de l"étendre (du point de vue du " passage à
l"échelle ») aux très gros corpus parallèles multilingues utilisés pour la construction et
l"évaluation de systèmes de TAO statistiques (ou plutôt probabilistes). Nous décrivons dans la
troisième partie la solution des problèmes associés et plusieurs expérimentations sur des
corpus utilisés lors de diverses campagnes d"évaluation de systèmes de TA.16/270
17/270
Partie I
Ressources linguistiques multilingues destinées àquotesdbs_dbs45.pdfusesText_45[PDF] AIDE URGENCE SVP 2nde Mathématiques
[PDF] aide urgent a remettre le 3 janvier 2012 ? 7h 3ème Français
[PDF] AIDE URGENT BREVET!!!! 3ème Autre
[PDF] Aide urgent fonction/intervalle 2nde Mathématiques
[PDF] AIDE URGENT MATHS EX7PAGE154 SESAMATHS 3EME SVP!!! 3ème Mathématiques
[PDF] aide urgent, les statistiques 1ère Mathématiques
[PDF] aide urgente 2nde Mathématiques
[PDF] AIDE URGENTE BREVET!! 3ème Autre
[PDF] AIDE URGENTE EXERCICE DE MATHS SUR LES FONCTION Bac +5 Mathématiques
[PDF] Aide urgente français 6ème Français
[PDF] aide urgente svp inequation 2nde Mathématiques
[PDF] Aide urgenteeeee 6ème Mathématiques
[PDF] AIDE! Devoir sur les fonctions pour le 7/05 3ème Mathématiques
[PDF] AIDE! Oral sur l'histoire de l'art 3ème Autre