Gouvernement du Canada
Symbole du gouvernement du Canada

La traduction automatique : une corde à votre arc

Alexis Paquin Drouin
Centre de recherche en technologies langagières

2016-09-05

Les technologies langagières font désormais partie du quotidien des internautes. Ainsi, moteurs de recherche, systèmes de reconnaissance vocale et outils de traduction automatique façonnent de plus en plus notre relation à la linguistique. En effet, ces outils de traduction gagnent en popularité et s’intègrent même dans la plupart des fureteurs.

C’est en 1948 qu’Andrew Donald Booth présente le premier dictionnaire électronique. Il devient ainsi un pionnier dans le domaine de la traduction automatique (TA). À l’époque, on se sert même d’outils de TA, par exemple durant la guerre froide, pour traduire certaines communications russes. De nos jours, ces outils sont disponibles gratuitement sur l’Internet et sont souvent intégrés dans les outils d’aide à la traduction. Malgré ses 68 ans, la TA demeure souvent mal reçue dans le domaine de la traduction.

On associe généralement TA à mauvaise traduction, car elle offre rarement des traductions parfaites. Les résultats loufoques ou incompréhensibles s’expliquent toutefois très bien. En effet, il faut être conscient des limites de l’outil dont on se sert pour être capable de l’utiliser de façon optimale. L’outil est limité par sa base de connaissance qui est construite par les textes nourriciers pendant sa phase d’apprentissage. À titre d’exemple, il existe douze problèmes majeurs répertoriés qui peuvent faire obstacle à la TA. D’abord, la segmentation des phrases (mot à mot ou par groupes de mots), la morphologie (type et forme des mots), les expressions idiomatiques (locutions figées particulières à une langue, par exemple « il pleut des cordes »), les collocations (aussi appelées cooccurrences, qui sont des associations habituelles de mots avec d’autres, par exemple faim de loup, et non pas faim de dinosaure, qui n’évoque rien), les mots inconnus du logiciel (par exemple les nouveaux mots), les ambiguïtés lexicales (plusieurs sens pour un même mot), les ambiguïtés de coréférence (le logiciel n’arrive pas à identifier de quoi on parle dans la langue de départ), les différences structurelles entre les langues (structure différente d’une langue à l’autre, comme du japonais au français), les degrés d’explicitation variables d’une langue à une autre (manque ou excès de précision dans la langue d’arrivée), l’insertion et la suppression de mots par le logiciel, les problèmes de grammaire dans la langue d’arrivée et finalement, l’ordre des mots qui change.

Avec de tels pièges, on pourrait penser qu’une TA parfaite est impossible. Cela dit, les avancées technologiques dans ce domaine abondent. De plus, dans des domaines spécialisés où les corpus sont petits, la TA peut s’avérer très efficace. Citons en exemple le gouvernement du Canada qui l’utilise depuis le début des années 1970 pour les prévisions météorologiques.

On peut également grandement améliorer les résultats, notamment grâce aux mémoires de traduction, qui peuvent être intégrées aux outils de TA. Il est aussi possible d’utiliser un langage contrôlé plus restrictif ou se rapportant à des domaines précis pour faciliter la tâche de la machine. La qualité est aussi une notion subjective. Si l’on prend conscience des difficultés potentielles, on arrive déjà à réduire le nombre d’erreurs que pourrait causer l’emploi d’un logiciel de TA.

En bref, malgré les améliorations apportées à la technologie, les outils de TA produisent rarement des textes de qualité publiable. La TA est avantageuse dans certains cas précis. Par exemple, la TA utilisée les yeux fermés peut être pratique pour défricher un texte, en reconnaître les grandes lignes. Elle peut aussi être utilisée lors d’une recherche terminologique ponctuelle (traduction d’un mot ou d’un groupe de mots précis). La TA peut ainsi favoriser les communications bilingues à bien des égards. Toutefois, les erreurs les plus flagrantes surviennent surtout lorsque la connaissance de la langue d’arrivée est limitée et que les problèmes majeurs associés à la TA sont ignorés.

Il demeure prudent de faire réviser les textes soumis à la TA par un traducteur pour qu’il procède à la postédition (révision du texte prétraduit).

Certains renseignements sont tirés du cours TRA1353 – Traduction automatique et postédition, donné par Louise Brunette, professeure au Département d’études langagières de l’Université du Québec en Outaouais.