Alignements mot-à-mot et traduction automatique

Intervenant : Guillaume Wisniewski, LIMSI, Université d’Orsay

Résumé

Un alignement mot-à-mot entre une phrase et sa traduction consiste à associer à chaque mot de la phrase traduite le mot de la phrase source correspondant à sa traduction. La prédiction de ces relations de traduction joue un rôle centrale dans les systèmes de traduction. Ceux-ci reposent en effet sur une table de traduction, construite à partir des alignements mot-à-mot, qui décrit la probabilité de traduire un mot ou un groupe de mots de la langue source en un groupe de mots de la langue cible.

Aujourd'hui, le système d'alignement le plus utilisé est Giza++ qui met en œuvre une combinaison de modèles génératifs, les modèles IBM. Cependant, les performances de Giza++, aussi bien du point de vue de la qualité des alignements prédits que des temps de calcul, ne sont pas satisfaisantes et l'étape d'alignement mot-à-mot constitue, aujourd'hui, un facteur limitant dans de nombreux systèmes de traduction automatique.

Nous décrirons dans cette présentation les différents travaux menés au LIMSI visant à améliorer les performances des systèmes d'alignements. Dans une première partie, nous montrerons comment l'utilisation de modèles discriminants pour l'alignement (classifieurs à maximum d'entropie et champs conditionnels aléatoires) permet d'obtenir de bonne performances en prédiction tout en réduisant significativement la durée d'apprentissage et d'inférence.

Nous aborderons ensuite un second axe de recherche qui a pour objectif d'apprendre à combiner des alignements mot-à-mot. Ce problème de combinaison est traité comme un problème de prédiction : un classifieur binaire décide pour chaque lien présent dans un des alignements si celui-ci doit être inclus dans l'alignement final ou non. La motivation de ce travail est double : améliorer les performances des systèmes d'alignements en utilisant des caractéristiques plus riches et remplacer les heuristiques de symétrisation par une approche mieux fondée.

operations/intervention_wisniewski.txt · Dernière modification: 2009/10/22 15:48 par langlois
Haut de page