“ML-TASC: système de traduction automatique multilingue” (SYSTEME DE CONVERSION DE FORMALISMES DE LANGAGES TECHNIQUES ET SCIENTIFIQUES DANS UN ENVIRONNEMENT A SYNTAXE CONTRÔLÉE ET A CONTEXTE LIMITE. TRADUCTION AUTOMATIQUE MULTILINGUE).
Thèse de doctorat en informatique, INRIA, Université de Nice, Novembre 1993.
Résumé
ENTRE LES PREMIERES APPROCHES DE W. WEAVER ET A. D. BOOTH DANS LES ANNEES QUARANTE ET LES TRAVAUX POUR LA CONCEPTION DES SYSTEMES ACTUELS, LES TECHNIQUES UTILISEES DANS LE DOMAINE DE LA TRADUCTION AUTOMATIQUE ET LA TRADUCTION ASSISTEE PAR ORDINATEUR ONT CONSIDERABLEMENT EVOLUE. SI CERTAINS SYSTEMES DE TRADUCTION SEMBLENT ACTUELLEMENT ETRE SATISFAISANTS POUR DES LANGUES A FORT DEGRE DE RESSEMBLANCE COMME LES LANGUES EUROPEENNES, LA REPRESENTATION, LA SAISIE, L’EDITION ET LA TRADUCTION DE LANGUES APPARTENANT A DES FAMILLES DIFFERENTES DEMEURENT FONDAMENTALEMENT COMPLEXES. EN OUTRE, LA PLUPART DES MODELES EXISTANTS POUR LA FORMALISATION DE SOUS-ENSEMBLES DU LANGAGE NATUREL, AU NIVEAU LEXICO-SYNTAXIQUE ET SEMANTIQUE, NE SONT PAS PARAMETRABLES; LES OUTILS DE FORMALISATION ET DE TRAITEMENT, SOUVENT DEDIES AUX LANGUES INDO-EUROPEENNES, SONT DIFFICILEMENT ADAPTABLES AUX LANGUES SEMITIQUES OU SINO-TIBETAINES. PAR AILLEURS, LE CONTEXTE ECONOMIQUE INTERNATIONAL ACTUEL CONDUIT A UN BESOIN DE PLUS EN PLUS CROISSANT EN OUTILS DE TRAITEMENT MULTILINGUE, D’ENTREES/SORTIES ET DE TRADUCTION DE DOCUMENTATIONS TECHNIQUES ET SCIENTIFIQUES. NOUS PRESENTONS DANS CETTE THESE LA DESCRIPTION D’UN ENVIRONNEMENT LOGICIEL QUE NOUS AVONS INTITULE: ML-TASC (TRADUCTION AUTOMATIQUE MULTILINGUE A SYNTAXE CONTROLEE ET A CONTEXTE LIMITE). NOUS PROPOSONS UN MODELE PARAMETRABLE POUR LA CONSTRUCTION ET LA MISE A JOUR DES FORMALISMES DE LANGAGES TECHNIQUES ET SCIENTIFIQUES ET UNE METHODE GENERALE (MULTILINGUE) POUR LA CONVERSION/TRADUCTION DES FORMALISMES CONSTRUITS. LES LEXIQUES, ELABORES SUR UN MODELE D’ENSEMBLES STRUCTURES, SONT ASSOCIES A DES ATTRIBUTS MORPHOLOGIQUES, SYNTAXIQUES ET SEMANTIQUES ET LES REGLES DE GRAMMAIRE SONT MODELISEES PAR DES AUTOMATES A ETATS FINIS NON DETERMINISTES. ML-TASC APPARTIENT A LA DEUXIEME GENERATION DES SYSTEMES DE TRADUCTION AUTOMATIQUE. IL REPOSE SUR LE MODELE DE TRADUCTION A STRUCTURE INTERMEDIAIRE QUI NOUS PARAIT ETRE LE MIEUX ADAPTE POUR LES TRADUCTIONS MULTILINGUES. EN OUTRE, L’INDEPENDANCE DES INFORMATIONS LINGUISTIQUES (LEXIQUES ET GRAMMAIRES) DES PROGRAMMES DE TRAITEMENT (COMPILATEURS ET PROGRAMMES DE CONVERSION) DU SYSTEME ML-TASC PERMET SON ADAPTATION A DES LANGUES DIFFERENTES. ENFIN, DES MODULES D’ENTREES/SORTIES POUR LA SAISIE ET L’EDITION DES TEXTES MULTILINGUES NOTAMMENT POUR LES LANGUES SEMITIQUES ET A BASE D’IDEOGRAMMES ONT ETE DEVELOPPES.