Définition de la TA

Définition, difficultés et approches de la traduction automatique

(source Wikipedia)

L’expression « traduction automatique » désigne au sens strict la traduction d’un texte (ou d’une conversation audio, en direct ou en différé) faite entièrement grâce à un ou plusieurs programmes informatiques, sans qu’un traducteur humain n’ait à intervenir.
On englobe parfois également sous ce terme la traduction assistée par ordinateur où la traduction peut se faire en partie manuellement ou de façon interactive avec la machine.

Malgré ses faiblesses, elle peut rendre des services dans des domaines tels que la veille internationale (Veille technologique y compris), où elle permet de prendre connaissance de façon superficielle, mais rapide, de grandes quantités de textes.

Depuis quelques années, elle connaît un essor considérable sur le Web, avec plusieurs systèmes en ligne pouvant traduire automatiquement et en quelques secondes des pages Web ou des textes de plus en plus longs. C’est une aide très appréciée du grand public car elle permet de déchiffrer – de façon grossière – le thème d’une page Web dans une langue totalement inconnue, et les principaux faits ou éléments d’information qu’elle contient. Pour simplifier la navigation, plusieurs moteurs de recherche comme Google, Altavista ou Yahoo! permettent de l’utiliser.

Difficultés de la traduction automatique

  • Ambiguïtés de la langue source
    • Ambiguïtés lexicales : polysémie. Dans Le défi des Langues, Claude Piron raconte que le 4 mai 1991 il avait demandé à une machine de traduire: In such a case, you can make a very good case for wooden cases, c’est-à-dire : « En pareil cas, on peut produire une argumentation très convaincante en faveur des caisses en bois », phrase qu’il avait déjà lue et simplement condensée. Au bout d’un instant vint la réponse: « Dans un tel cas vous pouvez faire un très bon cas pour des cas inexpressifs ».
    • Ambiguïtés grammaticales : un même mot peut relever de deux catégories grammaticales différentes. Toujours dans Le Défi des Langues l’auteur proposait à une machine, mise en mode interactif, He was sorting out food rations and chewing gum, phrase qui peut signifier soit « il triait des rations et du chewing gum », soit « il triait des rations tout en mâchant du chewing-gum ». Au lieu de poser une question sur la valeur grammaticale du –ing dans chewing, au lieu donc d’« interagir », la machine livra la phrase suivante: « Il triait dehors rations de nourriture et mastiquant la gencive.»
    • Ambiguïtés sémantiques : un même mot peut avoir plusieurs sens dans les contextes différents. Par exemple: «saw» qui peut signifier soit «voir», soit «scie».
    • Ambiguïté de référence des pronoms : pour la phrase « Elle l’aime » qui peut signifier soit « She likes him/it »,soit « It likes him/it », etc.
  • qu’il dispose, en plus de connaissances linguistiques, de connaissances factuelles sur l’état du monde (par exemple, il doit savoir que telle personne est de sexe féminin) ;
  • qu’il soit capable de réaliser une certaine interprétation du texte qui lui est soumis : s’il rencontre le mot « secrétaire », il a besoin de savoir, selon la langue-cible, le sexe de ce/cette secrétaire ou de son employeur. Il est facile de résoudre cette difficulté dans le cas d’une phrase simple comme « John Doe’s secretary » : une règle simple permet d’exprimer le fait que l’expression « X’s Y » implique que Y « appartient » à X. Mais si le programme rencontre la phrase « je suis allé au service de la comptabilité et j’ai parlé au secrétaire », il est plus difficile pour la machine de faire la relation entre les secrétaires et le service qui vient d’être mentionné ; la tâche est encore plus ardue dans un contexte comme « j’ai vu M. Tartempion, qui m’a donné un document ; je suis allé au service de la comptabilité pour qu’ils en fassent une photocopie et je suis revenu le donner à la secrétaire » : ici, on ne peut même pas s’appuyer sur la proximité entre le mot « secrétaire » et le nom du service, puisqu’il est en fait question de la secrétaire de Tartempion, mentionnée bien avant dans la phrase.

Approches de la traduction automatique

  • Approche directe :
  1. traduction mot à mot du texte source vers le texte cible
  2. reformulation de l’ordre des mots traduits dans le texte cible
  • Approche Interlangue :
  1. construction de la représentation interlangue du texte source
  2. construction du texte cible par la représentation
  • Approche par transfert :
  1. analyse lexicale et syntaxique du texte source
  2. transfert des lemmes traduits et structures en langue cible
  • Proposition : Approche séquentielle (ou progressive) :
  1. D’abord : Correction automatique du texte source (1 → 2)
  2. Ensuite : Détecter les expressions idiomatiques en LangueSource dans TexteSource > les interpréter en LCible > les retraduire mot-à-mot en LSource > les remplacer dans le TSource (2 → 3)
  3. Ensuite : Détection pour Interprétation (LSource → LCible + Trad-Mot-à-Mot → LSource) et remplacement des seuls noms propres dans le texte source (3 → 4)
  4. Ensuite : Réorganisation syntaxique dans le texte source (4 → 5)
  5. Enfin : Traduction mot à mot du texte source (5 → texte cible)

Malek Boualem