MENU Projets/Produits Logiciels Critiques Liens Evaluation

 

TRADUCTION AUTOMATIQUE

 

GENERALITES

La plupart des grands projets de traduction automatique sont nés entre 1958 et 1966 des besoins de traduction à partir du russe engendrés par la guerre froide. Le meilleur exemple est celui de l'utilisation du système Systran par la Foreign Technology Division de l'armée de l'air américaine. Ce système a été utilisé pendant plus de vingt ans pour traiter la totalité des textes en langue russe sur lesquels les services de renseignements pouvaient mettre la main. Il était doté d'énormes dictionnaires russe-anglais couvrant un grand nombre de domaines et le charabia produit par le système était examiné par des spécialistes qui étaient chargés d'isoler les textes ayant une valeur stratégique ou scientifique.

Cette application n'est pas sans rappeler Internet, mais s'agit-il de traduction automatique ou de filtrage en langue étrangère ? La réponse devient claire quand on sait que la plupart des textes retenus étaient ensuite traduits manuellement. La recherche en traduction automatique a connu un coup d'arrêt en 1966 avec la sortie du rapport ALPAC de la National Science Foundation qui concluait à l'impossibilité d'une traduction automatique de qualité. La plupart des chercheurs américains se sont alors tournés vers une science émergente : l'intelligence artificielle.

La technologie n'en a pas moins évolué au cours des ans. Les développeurs de la fin des années cinquante concevaient la traduction automatique comme un simple problème de décryptage. À chaque mot du texte incompréhensible correspondait un mot de la langue connue. Ils ont vite découvert que la traduction n'était pas biunivoque, qu'un même mot pouvait avoir plusieurs catégories grammaticales et qu'à chaque catégorie grammaticale pouvaient correspondre plusieurs sens.

Des tests de compréhension ont alors révélé que si un locuteur humain lisait un texte en déplaçant une feuille de carton avec un trou qui laissait paraître quelques mots contigus, beaucoup d'ambiguïtés pouvaient être levées. Ceci a donné naissance à l'analyse par micro-contexte, qui est le principe de fonctionnement des systèmes de traduction automatique dits de première génération.

Les chercheurs du GETA (Groupe d'étude pour la traduction automatique) à Grenoble ont été les premiers à jeter les bases d'une nouvelle génération. La traduction humaine peut se décomposer en trois étapes : la compréhension du message en langue source, la transposition de la teneur du message en langue cible et la formulation du message selon les règles de la langue cible. Parallèlement, un système de traduction automatique de deuxième génération opère au niveau de la phrase et la traite en trois étapes : l'analyse, le transfert et la génération.

Le premier système de traduction automatique de deuxième génération est entré en exploitation le 24 mai 1977 à Montréal; il s'agit du système METEO ®. Aussi raisonnable que puisse paraître cette approche, personne n'est parvenu à développer un système général de traduction automatique de deuxième génération, même en se limitant aux textes scientifiques et techniques.

La première étape suppose qu'on sache bâtir un analyseur d'une langue qui soit un tant soit peu exhaustif. Or ce n'est pas possible sans faire intervenir le sens et on ne sait toujours pas comment représenter et traiter le sens en dehors d'un domaine restreint.La seconde étape est plus ambitieuse encore car elle suppose une manipulation du sens dans la mesure où le transfert est la transposition d'idées et non simplement de structures syntaxiques. Paradoxalement, la troisième étape pose peu de problèmes car elle applique les règles syntaxiques et morphologiques d'une langue de manière déterministe. On sait déjà que même avec une composante syntaxique, le système de deuxième génération ne suffirait pas à la tâche. En particulier, la phrase n'est pas un contexte suffisant pour résoudre certains problèmes de traduction et d'autres ne peuvent être tranchés qu'avec une compréhension du texte et une connaissance du monde

À Montréal en 1990, la compagnie d'assurances Confédération-Vie prenait livraison d'un système dédié d'aide à la traduction qui lui permettait d'assembler la version française d'une police d'assurance-vie à partir de la version anglaise en vingt minutes au lieu de quatre heures. Le système Général TAO, utilisé aujourd'hui par ManuVie, remplace les clauses types d'un document par leur traduction tout en générant la mise en page désirée. Il ne s'agit pas à proprement parler de traduction automatique, mais d'une mémorisation des phrases répétitives. Depuis, des systèmes commerciaux de mémoire de traduction ont vu le jour comme Translation Manager 2 d'IBM ou Translator's Workbench de Trados qui mémorisent toutes les phrases au fur et à mesure de leur traduction.

On appelle sous-langage un sous-ensemble de la langue ayant ses propres règles syntaxiques et un vocabulaire limité dont les relations sémantiques sont cernables.L'exemple le plus connu de l'application de la traduction automatique à un sous-langage est le système METEO qui sert à traduire les prévisions publiques, agricoles et maritimes émises par Environnement Canada.

Les premières recherches sur les langages contrôlés ont porté sur l'anglais technique, le but étant d'obtenir des documentations non ambiguës tant pour des utilisateurs anglophones que pour des utilisateurs dont l'anglais n'est pas la langue maternelle. Un bon exemple est le « Simplified English » développé par l'AECMA (Association européenne de constructeurs de matériel aéronautique) et dont l'usage est recommandé par l'ATA (American Transport Association).Le GIFAS (Groupement des Industries Françaises Aéronautiques et Spatiales) mène depuis quelques années des travaux similaires sur le « français rationalisé ».

John Chandioux, président John Chandioux experts-conseils inc. (La Tour de Babel)