Travaux de recherche au CNRS par Malek Boualem
De 1995 à 1998, j’ai rejoint le laboratoire Parole et Langage du CNRS ESA 6057, où j’ai participé au sein de l’équipe “Traitement automatique des langues” à l’étude, la conception et la réalisation d’outils pour le traitement linguistique des documents multilingues. Une étude des avancées technologiques dans ce domaine m’a permis d’identifier des méthodes de codage des caractères et des documents, ainsi que des techniques de saisie et de translittération des caractères et qui étaient en phase de devenir des normes internationales (Unicode/ISO10646, SGML/HTML, TEI, etc.). J’ai étudié les travaux menés aux USA (laboratoire CRL, D.E.Knuth, P.MacKay, Accent, etc.), en Israël (D.Berry, U.Habusha sur l’écriture bi-directionnelle), au Canada (Labonté, etc.) et en Europe (GUTenberg, Omega, etc.) et j’ai travaillé sur la conception et la réalisation d’un éditeur multilingue (beaucoup plus efficace que celui réalisé à l’INRIA). Cet éditeur, appelé MtScript, présente un certain nombre de caractéristiques dont :
- compatibilité avec les normes de codages des caractères et des documents,
- utilisable pour le transfert de textes multilingues sur Internet (codage MIME 8 bits),
- mixage de textes à écriture en sens opposés, etc.
- Environnement portable: SUN, UNIX, Tcl/Tk, C, SGML, ISO-8859-*, Unicode.
MtScript a été bien accueilli et largement utilisé au sein de la communauté scientifique mondiale et a reçu le prix CNRS/ANVIE 96 de la valorisation de la recherche scientifique (URL: https://mtscript.malek-boualem.fr/).