| RETOUR ACCEUIL |
Jean-Michel |
Delorme |
Liste de liens utiles : |
| Le cadre : Le projet dont je vous décris ci-après les grandes lignes, fait l'objet d'un mémoire d'ingénieur sanctionnant le cycle ingéniérie en informatique du Conservatoire National des Arts et Métiers (Cnam). Au cours d'un travail de dix mois au LIRMM, je m'applique à mettre en place un cadre théorique et technique pour la réalisation du projet. Dans le même temps, j'exécute les tâches de conception et d'implémentation. |
| Le contenu : Il s'agit d'intervenir dans la réalisation d'un système de tranduction automatique basé sur l'analyseur morphosyntaxique -SYGMART-[Jacques Chauché]- du langage source (le français) et d'un transducteur grammatical vers le langage cible (en l'occurence l'anglais) développé par V. Prince. Ma part du travail consiste à produire un module de désambiguïsation lexicale et sémantique afin de choisir la meilleure traduction (acception) parmi les lexies candidates en langage cible. Ce choix se fait grâce à la distance de similarité définie sur les vecteurs conceptuels. |
| La problématique principale : Elle consiste à établir une représentation des lexies anglaises dans l'espace de représentation des lexies françaises (Larousse 873 concepts) sans effectuer d'apprentissage. Les lexicologues anglais ont eux défini une hiérarchie de 1043 concepts (Roget). La complexité de la tâche réside dans le fait d'établir dynamiquement (de manière non supervisée) une correspondance des concepts Roget vers les concepts Larousse que l'on représentra sous la forme d'une matrice (de dimension 1043x873) et que l'on nommera matrice de correspondance des concepts. Par la suite, la transposition des vecteurs de lexies anglaises donnés par le thésaurus Roget se fait par produit matriciel (du vecteur par la matrice). |