I. Projets de recherche pilotés par Malek Boualem :
1. PRP TRANSAT (Translation of speech and text)
- Nom du Projet de Recherche Pluridisciplinaire : TRANSAT.
- Objet du projet : Traduction Automatique de l’écrit et de l’oral.
- Date de début / fin : Mai 2004 / Mai 2007.
- Chef de projet : Malek Boualem
- Partenaires du projet : Plusieurs équipes des laboratoires de la division R&D, partenaires universitaires, partenaires externes techniques.
Le projet TRANSAT avait pour objet l’étude et la mise en œuvre d’une approche, validée par des démonstrateurs, pour la traduction automatique de l’écrit et de l’oral, à travers le couplage des technologies du langage naturel écrit et oral, développées à la division R&D de France Télécom (traduction automatique linguistique et statistique, reconnaissance et synthèse de la parole). Le projet visait également la combinaison des approches symboliques et statistiques en traduction automatique. J’ai assuré la responsabilité de ce PRP et la coordination des travaux menés par les membres de six équipes de R&D appartenant à trois laboratoires de la division R&D de France Télécom. J’ai également assuré la coordination des partenariats avec des laboratoires universitaires (CRE avec l’université Joseph Fourier et CRE avec l’université de Provence) et avec des partenaires industriels (sociétés de consulting et prestataires de services).
2. OMTS (Orange Mobile Translation Service)
- Nom du Projet : OMTS
- Objet du projet : Traduction Automatique sur mobiles.
- Date de début / fin : Janvier 2008 (en cours)
- Chef de projet : Malek Boualem
Le projet TRANSAT a donné lieu à une piste de transfert opérationnel baptisée OMTS et qui est en cours d’instruction, sous ma coordination, dans le cadre du processus A-TTM et en partenariat avec le Marketing Stratégique. OMTS est proposé sous la forme d’un service d’ORANGE à destination de ses clients de téléphonie mobile en situation de déplacement à l’étranger. Il leur permet de soumettre, à partir d’un téléphone mobile, des requêtes de traduction par SMS ou par voie vocale. Une Unité d’Affaires a été identifiée et le dossier est en cours d’instruction pour un lancement éventuel du service. Il est à noter que OMTS a été candidat aux Orange Labs Awards en 2007 et 2008. Un représentant de l’Unité d’Affaires d’Orange et un représentant du Marketing Stratégique s’étaient associés à moi pour cette candidature, qui n’avait malheureusement pas été retenue.
3. Projet EURESCOM P923
- Nom du projet : Babelweb.
- Objet du projet : « Multi-lingual Web Sites: Best Practice Guidelines and Architectures ».
- Date de début / fin : Juin 1999 / Décembre 2000.
- Mon rôle dans le projet : PMC member ou chef de projet pour France Télécom.
- Partenaires du projet : Eurescom (superviseur), KPN (chef de projet), FT, BT, PT et TI.
Ce projet avait pour objet de définir une architecture globale, validée par un démonstrateur, pour l’élaboration des sites web multilingues. Les aspects liés à l’internationalisation et à la localisation des applications informatiques étaient fortement abordés dans ce projet. Outre ma contribution au projet, j’avais également encadré la contribution de plusieurs collègues à FTR&D, notamment dans la phase de réalisation et d’évaluation du démonstrateur. Ce qui est important à souligner est que nous (FTR&D) étions responsables de la tâche centrale du projet (Work-Package 4), qui consistait à concevoir l’architecture globale de la plate forme. Ce projet a produit des résultats très satisfaisants (brochures Eurescom, démonstrateur, présentation dans plusieurs congrès, etc.) et il a été évalué de façon très favorable. Une continuité sur le thème du multilinguisme a été fortement encouragée. Justement, un deuxième projet (Eurescom P1104) a été proposé par les mêmes partenaires pour 2001. Il a été accepté et a démarré en février 2001 pour une période de deux ans (voir ci-dessous).
4. Projet EURESCOM P1104
- Nom du projet : MUST.
- Objet du projet : « Multimodal, multilingual information services for small mobile terminals ».
- Date de début / fin : Février 2001 / Décembre 2002.
- Mon rôle dans le projet : PMC member ou chef de projet pour France Télécom.
- Partenaires du projet : Eurescom (superviseur), KPN (chef de projet), FT, BT, PT et Telenor.
Ce projet avait pour objet d’étudier et de mettre en œuvre une plateforme multimodale et multilingue, permettant à l’utilisateur d’accéder à des informations, dans sa propre langue, à travers des terminaux mobiles de type PDA et téléphones mobiles (UMTS était au premier plan au niveau applicatif). J’ai été le PMC member de France Télécom dans ce projet, dans lequel FTR&D avait une participation diversifiée. En effet, j’avais sollicité pour ce projet un certain nombre d’URDs appartenant à différentes laboratoires et CRDs de FTR&D. Le rôle de France Télécom dans le projet était relativement important en tant que fournisseur de technologies et d’expertise de haut niveau.
5. Contribution au programme national TECHNOLANGUE
J’ai contribué à la coordination de la participation de France Télécom aux deux projets :
- Nom du projet : EVALDA-EASY.
- Titre du projet : Evaluation des analyseurs syntaxiques.
- Date de début / fin : 2005/2006.
- Partenaires du projet : Nombreux acteurs universitaires et industriels du domaine du TALN.
- Nom du projet : EVALDA-EQUER.
- Titre du projet : Evaluation des systèmes de questions-réponses.
- Date de début / fin : 2005
- Partenaires du projet : Nombreux acteurs universitaires et industriels du domaine du TALN.
6. Pilotage du projet de développement TILT
- Nom du projet : Suite logicielle TILT 2010.
- Objet du projet : Industrialisation de la technologie TiLT et étude économique.
- Date de début / fin : Avril 2010 / Décembre 2010.
- Chef de Projet : Malek Boualem.
7. Pilotage du projet de développement TILT
- Nom du projet : TILT industrialisation des composants.
- Objet du projet : Industrialisation des composants de la technologie TiLT.
- Date de début / fin : Janvier 2011 / Décembre 2011.
- Chef de Projet : Malek Boualem.
8. Pilotage du projet de recherche NLP & Semantics 2011
- Nom du projet : Natural Language Processing & Semantics 2011.
- Objet du projet : Extraction d’informations.
- Date de début / fin : Janvier 2011 / Mars 2012.
- Chef de projet : Malek Boualem.
9. Pilotage du projet de recherche S&LP 2012
- Nom du projet : Semantic and Language Processing 2012.
- Objet du projet : Acquisition des connaissances et extraction d’informations sémantiques.
- Date de début / fin : Avril 2012 / Décembre 2012.
- Chef de projet : Malek Boualem.
10. Pilotage du projet de recherche S&LP 2013
- Nom du projet : Semantic and Language Processing 2013.
- Objet du projet : Acquisition des connaissances et extraction d’informations sémantiques.
- Date de début / fin : Janvier 2013 / Décembre 2013.
- Chef de projet : Malek Boualem.
11. Pilotage du projet d’anticipation « TiLT_Products » 2014
- Nom du projet : TiLT_Products.
- Objet du projet : Industrialisation et valorisation des produits issus de la technologie TiLT de traitement automatique des langues naturelles.
- Date de début / fin : Janvier 2014 / Décembre 2014.
- Chef de projet : Malek Boualem.
12. Pilotage du projet d’anticipation « Composants techniques pour l’accès aux contenus » 2015
- Nom du projet : Composants techniques pour l’accès aux contenus.
- Objet du projet : Industrialisation et valorisation des produits issus des technologie TiLT de traitement automatique des langues naturelles et REPERIO de recommandation.
- Date de début / fin : Janvier 2015 / Décembre 2015.
- Chef de projet : Malek Boualem.
II. Lots de projets de recherche pilotés par Malek Boualem :
11. Pilotage du WP5 du projet QUAERO-MSSE
- Nom du projet : QUAERO MSSE 2008-2013.
- Objet du projet : Mise en place d’un moteur de recherche multimédia et multilingue
- Objet du WP 5 : CLIR ou Crss-Language Information Retrieval
- Date de début / fin du lot : Mai 2008 / Mai 2013.
- Responsable du WP5 : Malek Boualem.
Le lot dont j’étais responsable concernait la recherche d’information cross-lingue. En effet, pour une requête en français, l’utilisateur pouvait accéder à des contenus multimédia (essentiellement vidéos) dans plusieurs autres langues (anglais, espagnol, allemand, portugais, arabe, russe, chinois, etc.). Un mécanisme de traduction automatique des métadonnées a été intégré au moteur de recherche.
12. Pilotage de lots des Pôles et Macro-pôles de Recherche
Depuis plusieurs années, je contribue de manière significative à la coordination des activités du Programme Vision, du Pôle ou du Macro-pôle de Recherche auxquels sont rattachées les activités de traitement automatique des langues naturelles (HyperArtLedge, DATALEDGE et Macro-Pôle Knowledge Sciences) :
- Responsabilité des lots et des tâches consacrés au thème de la traduction automatique ou du multilinguisme.
- Contribution aux évaluations WORLD-CLASS.
- Coordination des activités de valorisation des résultats de la recherche.
- Coordination d’actions de partenariat avec le monde de la recherche académique (CRE).
- Contribution aux orientations stratégiques du pôle de recherche.
- Contribution à la définition des objets de la recherche.
- Etc.
13. Pilotage de tâche du projet PAVIS
- Nom du projet : PAVIS 2008.
- Objet de la tâche : Valorisation, transfert et partenariats autour de la technologie TiLT
- Date de début / fin du lot : Janvier 2008 / Décembre 2008.
- Responsable de tâche : Malek Boualem.
La tâche dont j’étais responsable visait la coordination des activités suivantes :
- Documentation bilingue des manuels d’installation et d’intégration des logiciels d’application de TiLT.
- Mise en place de partenariats internes et externes autour des logiciels de TiLT.
- Coordination du déploiement de certains logiciels de TiLT sur les intranets de France Télécom.
14. Pilotage du lot OMTS du projet NEWCOM
- Nom du projet : NEWCOM 2007 et NEWCOM 2008.
- Objet du projet : Instruire, maquetter et expérimenter des idées de services.
- Titre du lot : OMTS (Orange Mobile Translation Service)
- Date de début / fin du lot : Septembre 2007 / Juin 2008.
- Responsable de lot : Malek Boualem.
Le lot OMTS du projet NewCom hébergeait l’instruction du dossier A-TTM OMTS en vue de la mise en place, par ORANGE, d’un service de traduction accessibles sur téléphones mobiles et à destination des clients en situation de mobilité.
15. Pilotage de tâche du projet REPERIO/QUAERO sur la traduction
- Nom du projet : REPERIO 2007.
- Objet du projet : Recherche d’information multimédia.
- Titre de la tâche : Traduction automatique pour la recherche de vidéos
- Date de début / fin du lot : Janvier 2007 / Décembre 2007.
- Responsable de tâche : Malek Boualem.
L’activité a consisté à coordonner la mise en place, l’évaluation et l’intégration d’un module de traduction statistique (technologie externe) au sein du moteur de recherche de vidéos. Cette tâche a été confrontée à la difficulté d’acquérir les corpus nécessaires pour la phase d’apprentissage du système de traduction.
16. Pilotage d’un lot du projet SERACH-05 sur un prototype de moteur arabe
- Nom du projet : SEARCH 2005.
- Objet du projet : Opération de Développement sur la recherche d’information.
- Titre du lot : Prototype de moteur de recherche en langue arabe
- Date de début / fin du lot : Septembre 2005 / Janvier 2006.
- Responsable de WP : Malek Boualem.
L’idée de mettre en place un moteur de recherche en langue arabe à France Télécom n’est pas récente. Cette réflexion a été lancée en 2000 et l’étude de faisabilité de ce projet m’a été confiée. Depuis, j’ai mené un certain nombre d’études sur l’existant, sur la faisabilité technique (en mettant l’accent sur l’apport du TALN en recherche d’information) et sur le potentiel de valorisation d’un tel moteur, en partenariat avec Wanadoo qui avait mis en place le portail trilingue HAHOOA (http://www.hahooa.com/ ). Le lot « moteur arabe » du projet Search 2005, mené avec le soutien d’un partenaire externe, a produit les résultats et les livrables suivants :
- Étude du marché de la recherche d’information dans le monde arabe.
- Analyse et évaluation de plusieurs moteurs de recherche en langue arabe.
- Analyse d’usage des moteurs arabes.
- Réalisation d’un démonstrateur de moteur de recherche en langue arabe.
17. Pilotage de tâche du projet STILTON
- Nom du projet : STILTON.
- Objet du projet : Valorisation et industrialisation des logiciels de la technologie TiLT.
- Titre du lot : Valorisation externe des logiciels de TALN
- Date de début / fin du lot : Janvier 2005 / Décembre 2005.
- Responsable de la tâche de valorisation externe : Malek Boualem.
Principaux résultat :
- Coordination de la commercialisation d’une licence de l’abrégeur de textes à THALES.
- Présentation de la technologie TILT au SMSI 2005 à Tunis (Sommet Mondial sur la Société de l’Information).
- Nombreuses actions de communication et de valorisation interne et externe au groupe France Télécom.
18. Pilotage de lot du projet TILT
- Nom du projet : TILT.
- Objet du projet : Valorisation des logiciels langues naturelles TiLT et du moteur Q2.
- Titre du lot : Valorisation des logiciels langues naturelles TiLT
- Date de début / fin du lot : Janvier 2004 / Décembre 2004.
- Responsable de lot : Malek Boualem.
Principaux résultat :
- Construction d’une offre de produits issus de la technologie TILT de traitement automatique des langues naturelles.
- Nombreuses actions de communication et de valorisation interne et externe au groupe France Télécom.
- Coordination d’un partenariat avec THALES.