MENU Généralités Logiciels Critiques Liens

PROJETS/PRODUITS

INSTITUTION

PROJET

PRODUIT

DESCRIPTION

REMARQUES, MÉTHODE(S), BASES THÉORIQUES

GETA (IMAG)

 

ARIANE

Environnement de développement de systèmes de traduction.

 
 

NADIA

 

Le projet vise la mise au point d'une plateforme logicielle universelle pour la gestion de données lexicales multilingues. Dans le cadre de ce projet, une collaboration a été mise en place avec Igor Mel'cuk à l'université de Montréal pour l'informatisation du Dictionnaire Explicatif et Combinatoire du Français contemporain.

 

RALI

TRANSX

 

Famille d'outils d'aide à la traduction, basés sur des modèles probabilistes.

Ces outils sont tous fondés sur des modèles de traduction probabilistes qui calculent automatiquement les correspondances entre le texte produit par le traducteur et le texte en langue de départ.

 

TRANSSEARCH

Recherche multilingue contextuelle, par appariement entre le texte en langue de départ et des bases de données de traductions pré-existantes.

Système à base de mémoire de traduction : une mémoire de traduction est une base de données textuelle, constituée de groupes de documents qui sont des traductions les uns des autres, et dans laquelle les liens qui existent entre les traductions sont consignés de façon explicite. Dans le cas le plus simple, la base de données ne contient que des documents dans deux langues spécifiques, disont l'anglais et le français, et chaque document retrouve sa traduction dans la base de données. TransSearch permet de fouiller des mémoires de traduction, appelées TransBases, à l'intérieur desquelles les documents sont appariés phrase par phrase. Différentes méthodes permettent d'obtenir de tels appariements (cf. projet sur les appariement de textes).

 

TRANSTYPE

Accélère la saisie de la traduction en anticipant les choix du traducteur et, au besoin, en les critiquant. L'outil propose ses choix en tenant compte à la fois du texte en langue de départ, et de la traduction partielle déjà produite par le traducteur.

 
 

TRANSCHECK (prototype)

Détecte automatiquement certaines erreurs de traduction en vérifiant que les correspondances entre les segments du texte en langue de départ et les segments d'une ébauche de traduction respectent les propriétés souhaitées d'une bonne traduction.

Recherche de faux-amis, expressions, etc. par appariement dans une base de connaissances, et vérification d'une certaine cohérence terminologique(en particulier pour le vocabulaire technique).

LANDISCO

Pas de système, mais divers projets de recherches intéressants...

TALANA

EUROTRA

CAT2

(cf. plus bas)

Approche à transfert avec transducteur d'arbre et grammaires manipulant des structures de traits.

 

XTAG

Inclus un analyseur syntaxique qui implémente la grammaire TAG (Grammaire des Arbres Adjoints)

Produit pour chaque phrase grammaticale une structure de constituants (arbre dérivé) et une structure de dépendances (arbre de dérivation).

LSG (Large-Scale Grammars)

(en cours d'évaluation)

Inclus un analyseur basé sur les structures de traits typés.

proche de HPSG

LATL (Université de Genève)

ITS

?

Prototype de traduction interactive

 

CSTAR-II

 

Traduction de la parole dans un domaine restreint.

 

DFKI

 

MULINEX

Extensions multilingues d'indexation (conceptuelle), d'édition et de navigation pour le Web.

 
 

VERBMOBIL

Traduction simultanée de dialogues dans des domaines délimités (ie dans un contexte particulier), indépendamment du locuteur.

PAS DE FRANCAIS POUR L'INSTANT...

IAI (Université de Saarbrücken)

 

CAT2

Système multilingue de TA. Il est généralement adapté au domaine spécifique d'utilisation, ce qui donne lieu à plusieurs projets : le projet CAT2-EDS est utilisé pour la traduction (anglais, français, allemand) d'EMails à usage interne chez EDS (Electronic Data System) ;le projet ARAMED traduit des classifications médicales anglais<>arabe ; dans le projet ANTHEM une implémentation client-serveur intègre CAT2 dans un réseau d'informations médicales (anglais, français, néerlandais).

Basé sur l'unification et le transfert. Le système est implémenté en PROLOG, et peut fonctionner sur UNIX et sur PC.

WHO

       

ISSCO (Université de Genève), SRI Cambridge

 

SLT (prototype)

Spoken Language Translator. Système de TA vocal n temps réel depuis l'anglais, pour des requêtes dans le domaine des réservations pour le transport aérien (2000 mots de vocabulaire).

Développé avec le CLE (Core Language Engine) du SRI Cambridge, qui permet de produire une représentation sémantique pour une phrase exprimée en anglais (ou dans un autre langage). Cette interprétation est obtenue grâce à une analyse syntaxique qui donne lieu à une représentation indépendante du contexte sous une "forme quasi-logique" ('quasi-logical form'). La résolution des pronoms est ignorée dans cette structure résultante ; elle fait l'objet d'une étape spécifique (de résolution contextuelle).

EUREKA

GRAAL

GRAAL ToolBox

Grammars which are Re-usable to Automatically Analyze Languages. Ensemble de modules pour la programmation en langage naturel (Natural Language Processing), utilisés pour la réalisation d'applications NLP spécifiques. Des applications pilotes ont étés développées par certains partenaires du projet, notamment en TAO et TA.

Les bases théoriques du formalisme utilisé sont celles des structures de traits typés (Typed Features Structures) et des sytèmes à base d'unification (unification-based systems), augmentés d'un ensemble réduit de contraintes. Les grammaires exprimées peuvent ainsi être 'déclaratives', 'réversibles' et 'modulaires'.

 

 

ÉTABLISSEMENT

PRODUIT

DESCRIPTION

APPLICATIONS

COMMENTAIRES, BASE(S) THÉORIQUE(S)

MACHINA SAPIENS

LINGUA FRANCA

Progiciel de TAO français<>anglais pour pages Web, premier volet d'un progiciel plus ambitieux, BABEL,capable de traduire dans 6 langues.

TAO français<>anglais

Utilise la "théorie" grammaticale de Maurice Grevisse et André Goosse.

SYSTRAN

SYSTRAN

Le système principal est constitué d'un noyau, autour duquel gravitent plusieurs modules, qui dépendent notamment de la paire de langages concernée. Ce noyau assure la cohésion du tout, ainsi que l'interface utilisateur. Il contrôle les flots linguistiques entre modules, et crée la sortie au format souhaité. Divers outils sont disponibles sous forme de modules optionnels , tels que dictionnaires, manipulation de corpus, etc.

TA

Les sytèmes SYSTRAN utilisent une base théorique élaborée, qui tourne autour de plusieurs dictionnaires (racines, expressions, utilisateur), ainsi que d'un analyseur syntaxique déterministe qui produit une représentation pour chaque phrase. Associé à une approche modulaire, ce déterminisme permet d'obtenir une traduction y compris pour les phrases incomplètes ou mal formées, grâce à un système de propagation entre modules de la représentation d'une phrase. Cette même propagation peut cependant être génératrice d'erreurs dans le cas d'une mauvaise décision. Pour contourner ce problème, les probables décisions erronées sont repérées par un drapeau, qui sera utilisé par un analyseur final dont le but est de tenter de résoudre ces cas d'erreurs une fois l'analyse terminée.

GLOBALINK

Power Translator

Traduction automatique en ligne (au fur et à mesure).

TAO

 

Web Translator

S'utilise avec un navigateur (netscape 2.0 et Internet Explorer 3.0), et permet une traduction "en ligne" des pages sur lesquelles on se déplace. La mise en forme du texte original est conservée.

TA multilingue

 

TRADOS

       

J. CHANDIOUX Experts Conseils

LEXIUM

Traduit les descriptions de biens et services faisant l'objet de nouvelles marques de commerce. Il est utilisé pour traduire le journal des marques de commerce.

TA

 

Applications développées avec GrammR, un langage de développement pour applications linguistiques, qui fait appel à un interpréteur de règles Prolog. Son utilisation ne suppose aucune connaissance en informatique. Il suffit de formuler le problème en termes de règles de grammaire et de les saisir en format libre à l'aide d'un éditeur de texte ordinaire. GramR compile les règles et génère un programme exécutable sur un texte.

Le Général TAO

Utilisé pour produire des contrats d'assurance-groupe et divers autres documents de nature répétitive.La génération d'une police d'assurances avec le Général TAO requiert environ 20 minutes alors que le processus manuel de couper-coller utilisé auparavant exigeait un minimum de 4 heures de travail.

TAO anglais<>francais

Le système se rapproche des systèmes de mémoire de traduction.

METEO

Traduit toutes les prévisions météorologiques destinées aux grand public, émises par le service d'environnement atmosphérique du Canada. METEO fonctionne 24h par jour, 365 jours par an.

TA anglais<>francais

Le système est partie intégrante d'une chaîne de production de bulletins météorologiques. Il inclus notamment un module de traduction automatique et un autre de traduction partiellement automatique, accompagne d'un éditeur de texte pour la traduction manuelle et la révision.

ATAO

Atelier de prétraduction automatique développé par TRADUCTIX. Deux modes d'utilisation sont possibles :

  • La PTA intensive, qui cherche à traduire le maximum des mots sûrs dans le texte (y compris le vocabulaire général), à faire les accords élémentaires et autres traitements optimisant le travail subséquent de traduction en traitement de texte.
  • La PTA légère, qui ne traduit que les termes techniques et qui les présente en gras dans le texte. Ce mode de prétraduction permet la dictée à partir de l'écran ou d'un texte imprimé : il équivaut à une consultation automatique du dictionnaire.
  • Pré-TA

    La prétraduction automatique (PTA) est un traitement qui consiste à produire automatiquement une traduction partielle d'un texte, que le traducteur transforme ensuite en une traduction finale. La PTA, sans prétendre faire de la « vraie » traduction, conserve les avantages reconnus de la traduction automatique :

    • Équivalences terminologiques sûres;
    • Préservation des invariants (chiffres, codes, etc.);
    • Assurance contre les oublis et les fautes grossières.

    Les principaux éléments du système sont :

  • Le prééditeur, qui améliore l'uniformité orthographique et terminologique du texte traité.
  • Le dépouilleur, qui offre un point de vue privilégié sur le texte à traduire. Les chaînes de mots répétitives ressortent clairement et les chaînes apparentées sont regroupées. Le dépouillement est à la base de la création d'un dictionnaire de prétraduction.
  • Le concordancier, qui permet la consultation de contextes, complément indispensable au dépouillement. Il présente des contextes multiples en vue synoptique tout en donnant accès au contexte intégral.
  • Le dictionnaire de référence.
  • Le dictionnaire de prétraduction, qui accepte des entrées très longues (plus de 30 mots), des variables ainsi que des codes de caractères italiques ou gras. Les conventions de codage des entrées sont simples.
  • SOFTISSIMO

    Power Translator

     

    TA francais<>anglais

     

    Pour Wintel et Mac uniquement.

    Web Translator

    S'utilise en complément d'un navigateur. Produit une ébauche de traduction de la page web visitee, produit une nouvelle page ajoutee a l'historique.

    TA anglais>francais

    Utilise la technologie de traduction de GLOBALINK.

    STYLUS

     

    TA francais<>russe

     

    SONOVISION-ITEP / LANT

    EUROLANG Optimizer

    Une première phase de pré-traduction (effectuée par le serveur) consiste à parcourir la base de données, filtrée selon le langage cible, pour en extraire les phrases et expressions qui seront utiles durant la phase de traduction interactive. Ensuite, au cours de la phase eux, le document pré-traduit est ouvert avec un traitement de texte, pour être modifié et remanié à souhait. La phase trois consiste à mettre à jour la mémoire de traduction avec le texte cible final.

    TA

    Architecture client/serveur. Technologie de mémoire de traduction, recherche terminologique.

    TRANEXP

    WORD TRANSLATOR

     

    TA multilingue

     

    MAITS (Multilingual Application Interface for Telematic Services)

     

    Specs d'API pour applications multilingues.

       

    IBM

    TranslationManager

    S'utilise en complément d'un traitement de texte

    TA,TAO

    Mémoire de traduction, support réseau avec bases de données partagées. Support PC, Wintel uniquement.

    IBM Machine Translation

    Moteur de traduction automatique, utilisé principalement pour développer des interfaces multilingues (optimisé pour Lotus Notes Global Designer), et traduire les fichiers textes contenus dans les glossaires d'applications.

    TA anglais > français

    Nécessite un interpréteur Prolog.

     

    Retour à l'accueil