PROJETS/PRODUITS
INSTITUTION |
PROJET |
PRODUIT |
DESCRIPTION |
REMARQUES, MÉTHODE(S), BASES THÉORIQUES |
|
---|---|---|---|---|---|
ARIANE |
Environnement de développement de systèmes de traduction. |
||||
NADIA |
Le projet vise la mise au point d'une plateforme logicielle universelle pour la gestion de données lexicales multilingues. Dans le cadre de ce projet, une collaboration a été mise en place avec Igor Mel'cuk à l'université de Montréal pour l'informatisation du Dictionnaire Explicatif et Combinatoire du Français contemporain. |
||||
Famille d'outils d'aide à la traduction, basés sur des modèles probabilistes. |
Ces outils sont tous fondés sur des modèles de traduction probabilistes qui calculent automatiquement les correspondances entre le texte produit par le traducteur et le texte en langue de départ. |
||||
Recherche multilingue contextuelle, par appariement entre le texte en langue de départ et des bases de données de traductions pré-existantes. |
Système à base de mémoire de traduction : une mémoire de traduction est une base de données textuelle, constituée de groupes de documents qui sont des traductions les uns des autres, et dans laquelle les liens qui existent entre les traductions sont consignés de façon explicite. Dans le cas le plus simple, la base de données ne contient que des documents dans deux langues spécifiques, disont l'anglais et le français, et chaque document retrouve sa traduction dans la base de données. TransSearch permet de fouiller des mémoires de traduction, appelées TransBases, à l'intérieur desquelles les documents sont appariés phrase par phrase. Différentes méthodes permettent d'obtenir de tels appariements (cf. projet sur les appariement de textes). |
||||
TRANSTYPE |
Accélère la saisie de la traduction en anticipant les choix du traducteur et, au besoin, en les critiquant. L'outil propose ses choix en tenant compte à la fois du texte en langue de départ, et de la traduction partielle déjà produite par le traducteur. |
||||
TRANSCHECK (prototype) |
Détecte automatiquement certaines erreurs de traduction en vérifiant que les correspondances entre les segments du texte en langue de départ et les segments d'une ébauche de traduction respectent les propriétés souhaitées d'une bonne traduction. |
Recherche de faux-amis, expressions, etc. par appariement dans une base de connaissances, et vérification d'une certaine cohérence terminologique(en particulier pour le vocabulaire technique). | |||
Pas de système, mais divers projets de recherches intéressants... |
|||||
EUROTRA |
CAT2 |
(cf. plus bas) |
Approche à transfert avec transducteur d'arbre et grammaires manipulant des structures de traits. |
||
XTAG |
Inclus un analyseur syntaxique qui implémente la grammaire TAG (Grammaire des Arbres Adjoints) |
Produit pour chaque phrase grammaticale une structure de constituants (arbre dérivé) et une structure de dépendances (arbre de dérivation). |
|||
LSG (Large-Scale Grammars) |
(en cours d'évaluation) |
Inclus un analyseur basé sur les structures de traits typés. |
proche de HPSG |
||
ITS |
? |
Prototype de traduction interactive |
|||
CSTAR-II |
Traduction de la parole dans un domaine restreint. |
||||
Extensions multilingues d'indexation (conceptuelle), d'édition et de navigation pour le Web. |
|||||
Traduction simultanée de dialogues dans des domaines délimités (ie dans un contexte particulier), indépendamment du locuteur. |
PAS DE FRANCAIS POUR L'INSTANT... |
||||
Système multilingue de TA. Il est généralement adapté au domaine spécifique d'utilisation, ce qui donne lieu à plusieurs projets : le projet CAT2-EDS est utilisé pour la traduction (anglais, français, allemand) d'EMails à usage interne chez EDS (Electronic Data System) ;le projet ARAMED traduit des classifications médicales anglais<>arabe ; dans le projet ANTHEM une implémentation client-serveur intègre CAT2 dans un réseau d'informations médicales (anglais, français, néerlandais). |
Basé sur l'unification et le transfert. Le système est implémenté en PROLOG, et peut fonctionner sur UNIX et sur PC. |
||||
WHO |
|||||
Spoken Language Translator. Système de TA vocal n temps réel depuis l'anglais, pour des requêtes dans le domaine des réservations pour le transport aérien (2000 mots de vocabulaire). |
Développé avec le CLE (Core Language Engine) du SRI Cambridge, qui permet de produire une représentation sémantique pour une phrase exprimée en anglais (ou dans un autre langage). Cette interprétation est obtenue grâce à une analyse syntaxique qui donne lieu à une représentation indépendante du contexte sous une "forme quasi-logique" ('quasi-logical form'). La résolution des pronoms est ignorée dans cette structure résultante ; elle fait l'objet d'une étape spécifique (de résolution contextuelle). |
||||
EUREKA |
GRAAL ToolBox |
Grammars which are Re-usable to Automatically Analyze Languages. Ensemble de modules pour la programmation en langage naturel (Natural Language Processing), utilisés pour la réalisation d'applications NLP spécifiques. Des applications pilotes ont étés développées par certains partenaires du projet, notamment en TAO et TA. |
Les bases théoriques du formalisme utilisé sont celles des structures de traits typés (Typed Features Structures) et des sytèmes à base d'unification (unification-based systems), augmentés d'un ensemble réduit de contraintes. Les grammaires exprimées peuvent ainsi être 'déclaratives', 'réversibles' et 'modulaires'. |
ÉTABLISSEMENT |
PRODUIT |
DESCRIPTION |
APPLICATIONS |
COMMENTAIRES, BASE(S) THÉORIQUE(S) |
|
Progiciel de TAO français<>anglais pour pages Web, premier volet d'un progiciel plus ambitieux, BABEL,capable de traduire dans 6 langues. |
TAO français<>anglais |
Utilise la "théorie" grammaticale de Maurice Grevisse et André Goosse. |
|||
Le système principal est constitué d'un noyau, autour duquel gravitent plusieurs modules, qui dépendent notamment de la paire de langages concernée. Ce noyau assure la cohésion du tout, ainsi que l'interface utilisateur. Il contrôle les flots linguistiques entre modules, et crée la sortie au format souhaité. Divers outils sont disponibles sous forme de modules optionnels , tels que dictionnaires, manipulation de corpus, etc. |
TA |
Les sytèmes SYSTRAN utilisent une base théorique élaborée, qui tourne autour de plusieurs dictionnaires (racines, expressions, utilisateur), ainsi que d'un analyseur syntaxique déterministe qui produit une représentation pour chaque phrase. Associé à une approche modulaire, ce déterminisme permet d'obtenir une traduction y compris pour les phrases incomplètes ou mal formées, grâce à un système de propagation entre modules de la représentation d'une phrase. Cette même propagation peut cependant être génératrice d'erreurs dans le cas d'une mauvaise décision. Pour contourner ce problème, les probables décisions erronées sont repérées par un drapeau, qui sera utilisé par un analyseur final dont le but est de tenter de résoudre ces cas d'erreurs une fois l'analyse terminée. |
|||
Power Translator |
Traduction automatique en ligne (au fur et à mesure). |
TAO |
|||
Web Translator |
S'utilise avec un navigateur (netscape 2.0 et Internet Explorer 3.0), et permet une traduction "en ligne" des pages sur lesquelles on se déplace. La mise en forme du texte original est conservée. |
TA multilingue |
|||
Traduit les descriptions de biens et services faisant l'objet de nouvelles marques de commerce. Il est utilisé pour traduire le journal des marques de commerce. |
TA |
Applications développées avec GrammR, un langage de développement pour applications linguistiques, qui fait appel à un interpréteur de règles Prolog. Son utilisation ne suppose aucune connaissance en informatique. Il suffit de formuler le problème en termes de règles de grammaire et de les saisir en format libre à l'aide d'un éditeur de texte ordinaire. GramR compile les règles et génère un programme exécutable sur un texte. |
|||
Utilisé pour produire des contrats d'assurance-groupe et divers autres documents de nature répétitive.La génération d'une police d'assurances avec le Général TAO requiert environ 20 minutes alors que le processus manuel de couper-coller utilisé auparavant exigeait un minimum de 4 heures de travail. |
TAO anglais<>francais |
Le système se rapproche des systèmes de mémoire de traduction. |
|||
Traduit toutes les prévisions météorologiques destinées aux grand public, émises par le service d'environnement atmosphérique du Canada. METEO fonctionne 24h par jour, 365 jours par an. |
TA anglais<>francais |
Le système est partie intégrante d'une chaîne de production de bulletins météorologiques. Il inclus notamment un module de traduction automatique et un autre de traduction partiellement automatique, accompagne d'un éditeur de texte pour la traduction manuelle et la révision. |
|||
Atelier de prétraduction automatique développé par TRADUCTIX. Deux modes d'utilisation sont possibles : |
Pré-TA La prétraduction automatique (PTA) est un traitement qui consiste à produire automatiquement une traduction partielle d'un texte, que le traducteur transforme ensuite en une traduction finale. La PTA, sans prétendre faire de la « vraie » traduction, conserve les avantages reconnus de la traduction automatique :
|
Les principaux éléments du système sont : |
|||
TA francais<>anglais |
Pour Wintel et Mac uniquement. |
||||
S'utilise en complément d'un navigateur. Produit une ébauche de traduction de la page web visitee, produit une nouvelle page ajoutee a l'historique. |
TA anglais>francais |
Utilise la technologie de traduction de GLOBALINK. |
|||
TA francais<>russe |
|||||
Une première phase de pré-traduction (effectuée par le serveur) consiste à parcourir la base de données, filtrée selon le langage cible, pour en extraire les phrases et expressions qui seront utiles durant la phase de traduction interactive. Ensuite, au cours de la phase eux, le document pré-traduit est ouvert avec un traitement de texte, pour être modifié et remanié à souhait. La phase trois consiste à mettre à jour la mémoire de traduction avec le texte cible final. |
TA |
Architecture client/serveur. Technologie de mémoire de traduction, recherche terminologique. |
|||
WORD TRANSLATOR |
TA multilingue |
||||
MAITS (Multilingual Application Interface for Telematic Services) |
Specs d'API pour applications multilingues. |
||||
S'utilise en complément d'un traitement de texte |
TA,TAO |
Mémoire de traduction, support réseau avec bases de données partagées. Support PC, Wintel uniquement. |
|||
Moteur de traduction automatique, utilisé principalement pour développer des interfaces multilingues (optimisé pour Lotus Notes Global Designer), et traduire les fichiers textes contenus dans les glossaires d'applications. |
TA anglais > français |
Nécessite un interpréteur Prolog. |
Retour à l'accueil