La traduction automatique : un outil pour les traducteurs ?

Caroline Champsaur, Unité de Références et Terminologie, OCDE

Utiliser l’ordinateur pour dépasser la barrière des langues est un rêve ancien. Depuis la Deuxième Guerre mondiale, des sommes colossales ont été investies pour élaborer une « machine à traduire » qui aiderait les humains à se comprendre sans se soucier de leurs langues respectives. Ces dernières années, la traduction automatique a resurgi sur le devant de la scène sous la forme de nouveaux projets de recherche mais aussi de produits commerciaux à destination du grand public et de services offerts sur Internet.

L’objet de cet article n’est pas de discuter la qualité des résultats obtenus par les logiciels de traduction automatique mais d’étudier de quelle manière les traducteurs s’approprient ces outils et en tirent un avantage.

La première palette des outils dans la sphère de la traduction

Les outils linguistiques touchant la sphère de la traduction se sont multipliés depuis l’utilisation massive des ordinateurs. Logiciels de traitement de texte, correcteurs orthographiques, dictionnaires électroniques sont venus depuis longtemps aider les rédacteurs et les traducteurs dans leur tâche. Différents outils se succèdent – dont ALPS, considéré par Kingscott (1999: 7) comme le « grand-père de tous les systèmes de mémoires de traduction » – et dans les années 80 apparaissent les deux logiciels d’aide à la traduction qui sont encore très largement utilisés de nos jours : Trados, créé en 1984 par Jochen Hummal et Iko Knyphausen en Allemagne, et Multitrans, créé plusieurs années plus tard par Gerry Gervais au Canada. D’autres outils analogues suivront. L’objectif de ces outils est d’assister les traducteurs lors du processus de traduction en retrouvant pour eux des passages préalablement traduits.

Chronologiquement, les logiciels de traduction automatique sont apparus avant les mémoires de traduction puisque les recherches dans ce domaine ont commencé dès la fin de la Deuxième Guerre mondiale. Réservée dans un premier temps au monde militaire, la traduction automatique devait garantir la compréhension (et éventuellement la rédaction) d’un texte rédigé dans une langue non maîtrisée par le locuteur. Ces logiciels étaient basés sur des règles linguistiques écrites par des linguistes qui analysaient la structure grammaticale de la phrase en langue source (arbre syntaxique), construisaient un arbre syntaxique équivalent en langue cible et remplaçaient les « feuilles » (mots) sources de l’arbre initial par des « feuilles » (mots) cibles. L’objectif des logiciels de traduction automatique était de donner un accès direct au contenu d’un message en langue tierce sans recours à un traducteur professionnel. Ils n’avaient pas pour but d’aider les traducteurs professionnels mais de s’en dispenser. À ce titre, ils ne faisaient pas partie à l’époque de la palette du traducteur.

Le rapport ALPAC (Automatic Language Processing Advisory Committee) (ALPAC 1966 ; Hutchins 1996), paru en 1966 aux États-Unis, estime que la traduction automatique n’est pas au point et qu’elle n’offre pas de perspectives. L’impact de ce rapport est décisif : les financements sont bloqués et les recherches dans le domaine de la traduction automatique suspendues.

La deuxième jeunesse de la traduction automatique : projets de recherches, logiciels grand public et sites en ligne

Ces dernières années, la traduction automatique a resurgi sous de nouvelles formes. Des projets de recherche ont vu le jour comme MOSES (Moses ; Koehn 2007) et PORTAGE (Conseil national de recherches Canada 2010 ; Foster et al. 2009). MOSES est un projet principalement financé par l’Union européenne lancé en 2005, alors que PORTAGE est un projet du Conseil national de recherches du Canada lancé en 2004. Ces projets reposent tous deux sur la « traduction automatique statistique » qui tire profit de la puissance de calcul des ordinateurs récents, de l’efficacité des algorithmes de « pattern matching » et d’apprentissage automatique et surtout de l’important volume de corpus bilingues disponibles électroniquement. En traduction automatique statistique, les corpus de texte sont analysés par le logiciel qui construit un « modèle statistique », la désambiguïsation lexicale étant effectuée à la fois par l’étude de la collocation au sein d’un texte monolingue et par la comparaison avec le texte cible aligné.

Le traducteur professionnel est à présent pris en compte comme utilisateur potentiel de ces projets. Ainsi, dans le projet PORTAGE, l’objectif affiché est de : « mettre au point une technologie qui permettra à un ordinateur de traduire d’une langue à une autre et d’appliquer cette technologie dans le but d’accroître la productivité des traducteurs humains » (Conseil national de recherches Canada 2010) (L’italique est de nous).

À côté de ces projets de recherche, différents logiciels à destination du grand public sont commercialisés depuis quelques années (ex. : Systran, Reverso de Softissimo, Personal Translator de Linguatec, Traduction Express de @Prompt) offrant un accès facile et peu coûteux à la technologie de la traduction automatique pour tous, et notamment pour les traducteurs. La société SDL, quant à elle, propose un portail de traduction automatique (SDL BeGlobal) d’accès payant. Certains de ces systèmes sont basés sur des règles linguistiques, d’autres sont des systèmes statistiques, et d’autres encore des systèmes « hybrides », mêlant règles linguistiques et calculs statistiques.

Enfin, la vraie démocratisation en matière de traduction automatique est l’apparition sur Internet d’une multitude de sites proposant des traductions en ligne immédiates et gratuites : Systran, Reverso, Yahoo ! BabelFish, SDL FreeTranslation.com, ProMT-Online, Babylon, WordLingo, Translator (http://translate.reference.com/), Frengly.com, Lexicool, notamment. Parmi eux, le plus populaire est celui de Google : Google Translate. Depuis fin avril 2006, ce site, basé lui aussi sur une approche statistique, propose de la traduction automatique dans plus de soixante-quatre langues. Franz Och, chercheur chez Google Translate, estime que l’équivalent du contenu d’un million de livres est traduit chaque jour en ligne sur ce site, ce qui ferait de Google Translate le plus important fournisseur de traductions de la planète (Och 2012)1.

Pour des raisons de confidentialité, l’utilisation de ces services en ligne n’est pas recommandée dans un cadre professionnel. Cependant, ces systèmes viennent répondre à un besoin toujours croissant de compréhension d’informations en langues étrangères. En paraphrasant Stig Dagerman (Dagerman 1952), nous affirmons que notre besoin de traduction est impossible à rassasier.

Mais comment le traducteur professionnel tirera-t-il concrètement parti de ces logiciels de traduction automatique ? Lui sont-ils utiles ? Si oui, à quel moment du processus de traduction les utiliser ?

 

Biographie

  Caroline Champsaur est titulaire d’un DEA d’informatique fondamentale et est l’auteure d’une thèse de doctorat en linguistique théorique et formelle (Paris VII). Elle a participé au projet européen EUROLANG ayant pour objectif de développer un système de traduction assistée par ordinateur puis a encadré les développements de logiciels linguistiques dans une société d’édition. Depuis 1998, elle travaille au sein de la Division de la traduction de l’OCDE où elle dirige l’Unité de Références et de Terminologie.

La traduction à l’ère du 2.0

Cat toolbox

L’avènement d’internet et surtout du web 2.0 a provoqué des changements dans divers secteurs d’activités dont celui de la traduction. Quels sont donc ces changements intervenus dans ce secteur d’activité ?

A bas la sténo, vive le clavier !

“J’espère que votre sténographe est assez rapide !”, me disait une cliente qui visiblement ignorait que le monde de la traduction avait évolué. Eh oui !, de nos jours l’ordinateur est présent dans (presque) tout le processus de traduction. Les documents physiques sont convertis en fichiers numériques en gardant la mise en forme d’origine.

Traducteur automatique ou mémoire de traduction ?

Les outils de traduction assistée par ordinateur ou TAO (computer-assisted translation ou CAT) permettent de réduire le temps de travail de près de 40% sur un projet, permettant ainsi le respect des délais de livraison qui sont de plus en plus serrés. La traduction automatique est une pré-traduction effectuée par un logiciel comme Systran, Babbel ou encore Google Translate. Elle est de plus en plus utilisée mais peut présenter des inconvénients lorsque les textes traduits comportent des phrases aux structure complexes. Une mémoire de traduction (translation memory ou TM en Anglais) est une “base de données linguistique qui enregistre la traduction en vue d’une future réutilisation” . La mémoire de traduction permet un gain de temps considérable pour les termes qui sont répétés dans plusieurs documents (outils de vente, communications marketing, guides d’assistance clientèle par exemple). Si SDL Trados Studio se taille la plus grande part du marché, d’autres TM, come Déjà Vu 2, Wordfast ou même OmegaT, sont tout aussi bons ou même meilleurs.

L’interactivité traducteur-client pour le suivi de la qualité

Les outils de traduction incluent de plus en plus des programmes de gestion de projet qui permettent une communication (presque) en temps réel entre le prestataire de services et le client. Cette interactivité facilite le suivi de l’évolution du projet et l’apport des mises à jour nécessaires (nouveaux termes, etc.), permettant ainsi la réduction du temps de traduction et donc le respect des délais de livraison.

Internet, contrairement à cette vieille pensée, n’a pas “tué’ le secteur d’activité de la traduction. Il permet plutôt d’améliorer la qualité des services offerts par les prestataires.

Armel Traoré

Responsable Projets, TrustWorthy associates