Acessibilidade / Reportar erro

Recherche cognitive et traduction automatique en jurilinguistique

Pesquisa cognitiva e tradução automática em jurilinguística

Cognitive research and automatic translation in jurilinguistics

Résumé

De par ses caractéristiques morpho-phonologiques, morphosyntaxiques, lexicales et autres systèmes et sous-systèmes de son fonctionnement, la langue arabe représente un système de non-concaténation (ou non-enchaînement des morphèmes). Elle diffère dans ce sens des langues Indo-européennes - à systèmes de concaténation - et demeure pour ainsi dire, une langue assez complexe à gérer dans le domaine du Traitement Automatique des Langues(TAL). Ceci, surtout lorsqu’il s’agit de traduire automatiquement des faits de langue porteurs d’éléments culturels propres à cette langue. Les données examinées dans cet article sont révélatrices de hiatus quant à la traduction automatique de textes juridiques arabes vers d’autres langues telles que le français ou l’anglais. L’apparentement génétique différent des langues en question pose non seulement des problèmes d’ordre linguistique dans le passage d’une langue vers une autre, mais aussi et surtout que les textes juridiques en langue arabe sont porteurs de poids sémantiques, culturels, religieux et civilisationnels qui ne reflètent pas toujours les mêmes référents ou gestalt des langues cibles. Il en est conclu que l’intervention humaine dans ce processus de traduction est plus que nécessaire comme le révèle l’étude des cas de textes juridiques en Arabie Saoudite.

Mots-clés:
Langue arabe; Langue française; Traduction automatique; Jurilinguistique; Textes juridiques

Resumo

Devido a seus sistemas e subsistemas morfofonológicos, morfossintáticos, lexicais e outros de seu funcionamento, a língua árabe representa um sistema de não-catenação (ou não-cadeia de morfemas). Difere-se nesse sentido das línguas indo-européias - com sistemas de concatenação - e permanece, por assim dizer, uma linguagem bastante complexa para se gerenciar no campo do Processamento Linguístico Automático (PNL). Isto se dá especialmente quando se trata da tradução automática de fatos linguísticos que carregam elementos culturais específicos daquela língua. Os dados examinados neste artigo são indicativos da lacuna resultante de uma tradução automática dos textos jurídicos árabes para outros idiomas, como o francês ou o inglês. A natureza geneticamente diferente das línguas em questão não só coloca problemas de natureza linguística na passagem de uma língua para outra, mas também - e sobretudo - dificulta o entendimento de textos jurídicos em árabe, que carregam cargas semânticas, culturais, religiosas e civilizacionais que nem sempre refletem os mesmos referentes ou gestalt das línguas-alvo. Conclui-se que a intervenção humana nesse processo de tradução é mais do que necessária, como revela o estudo de textos legais na Arábia Saudita.

Palavras-chave:
Língua árabe; Língua francesa; Tradução automática; Jurilinguística; Textos jurídicos

Abstract

Due to its morphophonological, morphosyntactic, lexical and other systems and subsystems of its functioning, the Arabic language represents a system of non-concatenation (or non-chaining of morphemes). It differs in this sense from Indo-European languages - with concatenation systems - and remains, so to speak, a fairly complex language to manage in the field of Automatic Language Processing (NLP). This happens especially when it comes to automatically translating language facts that carry cultural elements specific to that language. The data examined in this article is indicative of the gap resulting from an automatic translation of Arabic legal texts into other languages such as French or English. The genetically different nature of the languages in question not only poses problems of linguistic nature in the passage from one language to another, but also and above all it makes the comprehension of legal texts in Arabic diffcult, since they carry semantic, cultural, religious and civilizational loads that do not always reflect the same referents or gestalt of the target languages. It is concluded that human intervention in this translation process is more than necessary as revealed by the study of legal texts in Saudi Arabia.

Keywords:
Arabic language; French language; Machine translation; Jurilinguistics; Legal texts

Préambule

L’une des diffcultés premières dans l’automation et la numérisation de la langue arabe a été, à premier abord, l’instabilité de ses caractères graphiques, sa segmentation et sa modélisation. Ses diacritiques tels que l’allongement vocalique, l’allongement consonantique (gémination), l’emphase et surtout l’absence de vocalisation (voyellation) de ses consonnes (connue en Grammaire arabe sous le terme de ‘harakât’ ou‘mouvements consonantiques’ et ‘sukun’ ‘absence de mouvement consonantique’) représentaient autant de sources de difficltés dans sa programmation.

Cette question de la représentation graphique de la langue arabe sur ordinateur a été soulevée dès les années 70. Certaines de ces difficltés ont trouvé solution puisqu’il est tout à fait possible de nos jours de procéder au traitement automatique de textes arabes, de faire appel à des dictionnaires et vérificateurs électroniques d’orthographe en arabe, voire même d’envoyer des messages en arabe sur Internet et à travers la téléphonie mobile. Ceci est révélateur de grands pas franchis depuis les balbutiements des années 70 face à la complexité, voire même l’impossibilité - disait-on-de procéder au traitement de l’écrit arabe et plus tard de la reconnaissance de la parole par ordinateur.

Dans cet article, nous utilisons l’expression « texte juridique arabe » au lieu de « texte juridique en arabe » pour distinguer les textes juridiques rédigés en arabe selon la juridiction arabo-musulmane (voir infra) des textes juridiques d’origines diverses (français, anglais, espagnol, etc.) et traduits en langue arabe.

La recherche sur les origines et la filiation des langues à des fins de traduction de textes -anciens, surtout-est assez vaste. La philologie et la linguistique comparée ont relevé des similitudes et des différences entre plusieurs langues. Les langues d’origine Indo-européennes représentaient ainsi un domaine de prédilection où des comparaisons étaient établies à plusieurs niveaux d’analyse (phonétique, phonologique, morphologique, syntaxique, lexical, sémantique, etc.). Le but étant de classifier et de catégoriser les langues selon leurs origines et leurs (degré de) parentés. Les études actuelles dans la fouille de texte (datamining) semblent moins investies dans la traduction par ordinateur d’ensembles phraséologiques tels que les proverbes et les dictons ou bien les textes juridiques arabes.

Nous essayerons d’examiner le texte juridique arabe à travers des prototypes de jugements ou contrats rédigés en arabe et/ou en français en Arabie Saoudite, en France et en Algérie. Ceci pour essayer de comprendre comment le Traitement Automatique des Langues Naturelles (TALN) peut-il s’accaparer du sens de ces textes qui sont souvent porteurs de différences culturelles. De ce fait, la question serait de voir si la machine pourrait prendre en charge des faits culturels propres à chaque langue qui sont incorporés dans le texte juridique et qui se manifestent à travers le mot ou l’expression. A cet effet, deux notions nous serviront de base pour la compréhension de ces différences, à savoir:

  1. La relativité linguistique (ou « Linguistic Relativity ») (CASASANTO, 2008CASASANTO, Daniel. Who’s Afraid of the Big Bad Whorf ? Crosslinguistic Differences in Temporal Language and Thought. Language Learning, v. 58, p. 63-79, déc. 2008. DOI: 10.1111/j.1467-9922.2008.00462.x. Disp. à l’adr.:<:http://doi.wiley.com/10.1111/j.1467-9922.2008.00462.x >. Visité le: 5 juill. 2021.
    http://doi.wiley.com/10.1111/j.1467-9922...
    ; DRIVONIKOU et al., 2007DRIVONIKOU, G. V. et al. Further evidence that Whorfian effects are stronger in the right visual field than the left. Proceedings of the National Academy of Sciences, v. 104, n. 3, p. 1097-1102, jan. 2007. DOI: 10.1073/pnas.0610132104. Disp. à l’adr.: <: http://www.pnas.org/lookup/doi/10.1073/pnas.0610132104 >. Visité le: 5 juill. 2021.
    http://www.pnas.org/lookup/doi/10.1073/p...
    )1 1 Concept développé au 19ème siècle par des penseurs tels que W. Von Humbolt et selon lequel le langage est l’expression de ‘l’esprit d’une nation’, de sa vision du Monde et de sa perception de la réalité. Concept repris et développé au 20ème siècle à travers la fameuse Hypothèse de Sapir et Whorf et plus récemment par le courant cognitiviste selon lequel le langage influence des processus cognitifs. telle que développée chez W. Von Humbolt, reprise dans l’hypothèse de Sapir et Whorf2 2 Edward Sapir: Lauenburg, Allemagne, 1884 - New Haven, Connecticut, 1939 Linguiste américain. Il a dégagé la notion de phonème et proposé une nouvelle typologie des langues, fondée sur des critères formels (syntaxe et sémantique) et non plus historiques. C’est l’un des initiateurs du courant structuraliste. Benjamin Lee Whorf: Winthrop, Massachusetts, 1897 - Wethersfield, Connecticut, 1941. Linguiste américain. Disciple d’E. Sapir, il a émis l’hypothèse que le langage est en relation causale avec le système de représentation du monde. Le Petit Larousse, (2009). et selon laquelle la pensée est soumise à la vision du monde à travers le langage - languages hapesthought -. Cette vision du monde à travers le langage diffère d’une langue à une autre. Les natifs d’une langue donnée perçoivent donc la réalité selon leur culture ou « force propre » que véhicule leur langue.

  2. Les Universaux du langage tels que définis chez Chomsky (1964CHOMSKY, Noam. Current issues in linguistic theory. The Hague: De Gruyter Mouton, 1964. Disp. à l’adr.: <: http://VH7QX3XE2P.search.serialssolutions.com/?V=1.0&L=VH7QX3XE2P&S=JCs&C= TC0000594938&T=marc&tab=BOOKS >. Visité le: 5 juill. 2021.
    http://VH7QX3XE2P.search.serialssolution...
    , 1965CHOMSKY, Noam. Aspects of the theory of syntax. 20. print. Cambridge, Mass: MIT Press, 1965. (Special technical report / Massachusetts Institute of Technology, Research Laboratory of Electronics, 11).) en termes de « Language Universals »3 3 Dans le courant cognitiviste et la Théorie universaliste, Chomsky (1964, 1965) a développé le concept de « Language Universals » pour stimuler la recherche d’une Grammaire Universelle (Universal Grammar). pour expliquer que les langues partagent des traits communs tels que le genre et le nombre.

Ainsi, en mettant en relief les éléments universels du langage, on pourrait parvenir à une meilleure compréhension du fonctionnement du langage et par conséquent aboutir à une vision plus claire de la relation langage/pensée, langage/société. Ces deux visions du langage représentent deux tendances: les Relativistes et les Universalistes. Elles semblent, à premier abord, contradictoires. En fait, elles convergent en ce sens qu’elles ont comme dénominateur commun le langage et la pensée. Les Relativistes insistent sur les idiosyncrasies (irrégularités) que l’on retrouve dans les langues et les différents dispositifs qui les gouvernent alors que les Universalistes insistent sur les traits et systèmes communs aux langues. Ceci représente en fait le premier stade de l’acte traductif.

La traduction est basée, à notre sens, sur des hypothèses tirées implicitement de ces deux visions du langage humain. La genèse même de la traduction présuppose l’existence de certains paramètres universels qui rendent toutes les langues traduisibles. Certains éléments inhérents ou propres à chaque langue deviennent idiosyncratiques et posent le problème de l’intraduisibilité / l’intraductibilité. Par conséquent, une traduction totale, juste, fiable, ou parfaite ne semble pas, en fin de parcours, une opération possible et réalisable. Il existe par contre différentes stratégies de la traduction telles que la transposition culturelle pour gérer des cas d’exotisme ou de calque, la transplantation, l’emprunt culturel, la translitération, la compensation, la traduction par omission -comme pour le cas des doublets sémantiques en arabe-, l’addition, l’équivalence et toute une batterie de stratagèmes auxquels pourrait faire appel le traducteur humain -par opposition au traducteur machine4 4 Le terme ‘traducteur machine’ est utilisé pour désigner l’ensemble des opérations à des fins de traduction automatique et dictionnairique tels que les algorithmes, les systèmes filtres, les systèmes experts, la segmentation, la modélisation, etc. - pour aboutir à une représentation adéquate de l’intention de l’auteur du texte source sous forme d’intention du traducteur du texte cible. En effet, la machine assure seulement un passage d’un système de mots à un autre système de mots (AUBIN, 1995AUBIN, Marie-Christine. Splendeurs et Misères de la Traductique. Cahiers Franco-Canadiens de l’Ouest, v. 7, n. 2, p. 211-226, 1995., p. 213). Elle ne prend pas en considération tous les phénomènes des langues naturelles, des anaphores aux métaphores et métonymies, en passant par les ellipses, déictiques...) (SABAH, 2004SABAH, Gérard. Intelligence artificielle, linguistique et cognition. In: FUCHS, Catherine (Éd.). La linguistique cognitive. Paris: Éditions de la Maison des sciences de l’homme , 2004. p. 195-221., p. 215).

Selon Steiner, G. (1975, p. 149) la logique des relativistes sous-entend qu’aucun acte complet de traduction entre différents champs sémantiques n’est possible et que toute traduction n’est qu’approximative et ontologiquement réductrice du sens.

D’autre part, une grammaire universelle postulera que l’inter-traduisibilité dans les langues naturelles est possible de par la nature même de la Proto-Langue (Proto-language), source ou mère de toutes les langues. Catford (1965CATFORD, J. C. A Linguistic theory of translation. London: OUP, 1965.) met l’accent sur l’aspect situationnel et contextuel en présentant le concept d’équivalence en traduction. Par conséquent, le texte de la Langue Source (SL)5 5 SL renvoie à Source Language (en anglais) par opposition au TL (Target Language) ou Langue Cible (en français). et celui de la Langue Cible (TL) doivent être en rapport étroit avec les traits pertinents et fonctionnels d’une situation (contexte) donnée afin d’aboutir à l’équivalence en traduction. Nida (1964NIDA, Eugene Albert. Towards a science of translating. Leiden: E.J.Brill, 1964.) explique que la reproduction du message de la Langue Source (SL) doit être reflétée par l’équivalent le plus proche de la Langue Cible (TL). Ainsi, c’est la conservation du message plutôt que la conversion de la forme et de la structure du texte qui devrait être visée dans l’acte traductif.

1 La Traduction Automatique (TA)

Ce n’est qu’après la Seconde Guerre Mondiale que la TA s’est développée de manière observable. L’Université de Georgetown(USA) a réalisé une traduction entièrement automatique en 1954. Le projet portait sur une soixantaine de phrases figées en russe et traduites en anglais. Cette première expériencea déclenché une recherche accélérée grâce à des fonds de soutien pour la recherche en TA. Malgré de lourds investissements financiers, le progrès dans ce domaine restait limité.

Le rapport de 1966 du Comité Consultatif sur le Traitement Automatique du Langage, ALPAC (Automatic Language Processing Advisory Committee) a été plus que négatif quant aux progrès de la TA aux Etats-Unis. Ceci a réduit au maximum lessubventions allouées dans ce domaine. L’euphorie des années cinquante s’est alors transformée en désagrément amer et en de profondes illusions (fromeuphoria to bitter criticism).

Ce n’est que bien plus tard que les développements de l’informatique, des statistiques et de la linguistique computationnelle des années 80 ont permis la conception de plusieurs modèles de traduction automatique mis à la disposition du grand public sur le marché de l’informatique. Ces programmes et outils informatiques à des fins de TA présentaient des défaillances. Ils ont été raffinés et rendus plus performants au fil des ans et ils sont accessibles à divers utilisateurs et organismes tels que la CEE qui utilise une version adaptée (users-need) du système commercial SYSTRAN pour traduire un grand nombre de documents à usage interne. Microsoft a développé à son tour un système hybride de la TA dans l’élaboration d’une base de données de soutien technique Anglais-Espagnol. Le système a été conçu par le groupe de recherche « NaturalLanguage » de Microsoft (2003). Ceci a été suivi par l’élaboration d’un système de traduction automatique Anglais-Japonais sur la base de systèmes Anglais-Français et Anglais-Allemands développés auparavant (GHENIMI, 2007GHENIMI, A. Conception d’un modèle de traduction arabe-français appliqué au domaine des mathématiques. 2007. Thèse de Doctorat - Centre Lucien Tesnière, Université de Franche Comté, França., p. 18). On retrouve actuellement ces logiciels sur le marché de l’informatique sous forme de produits finis ou bien sous forme de prototypes de traducteurs et de dictionnaires mis en ligne au service du grand public. Il fait référence ici à des programmes formulateurs et générateurs de traduction (formulating translation) (FULFORD; Granell-Zafra, 2005FULFORD, Heather; GRANELL-ZAFRA, Joaquín. Translation and technology: a study of uk freelance translators. The Journal of Specialized Translation, p. 2-17, 2005.) marquant une époque de maturité sémantique basée sur um énorme travail d’analyse linguistique et de formalisation (ANIS, 1994ANIS, Jacques. Ordinateurs et traduction: survol d’un demi-siècle. Langages, v. 28, n. 116, p. 111-122, 1994. DOI: 10.3406/lgge.1994.1699. Disp. à l’adr.:<:https://www.persee.fr/doc/lgge_0458-726x_1994_num_28_116_1699 >. Visité le: 5 juill. 2021.
https://www.persee.fr/doc/lgge_0458-726x...
) qui a contribué pour donner naissance à une traduction automatique neuronale (TAN) en 2015, dont la qualité des traductions est nettement meilleure (BEDJAOUI et al., 2020BEDJAOUI, Wafa et al. Dictionnaires contextuels: pour une approche ergonomique de la biotraduction.Texto Livre: Linguagem e Tecnologia, v. 14, n. 1, e25577, sept. 2020. DOI: 10.35699/1983-3652.2021.25577. Disp. à l’adr.:<:https://periodicos.ufmg.br/index.php/textolivre/article/view/25577 >. Visité le: 5 juill. 2021.
https://periodicos.ufmg.br/index.php/tex...
).

2 La TA, le TAL, le TALN et le TALA

La Traduction Automatique (TA) est un terme englobant qui réfère à l’automation de la langue en général. Elle se ramifie en Traitement Automatique des Langues (TAL) et ce suite au développement des technologies des langues, puis en Traitement Automatique des Langues Naturelles (TALN) pour distinguer ces dernières des langues dites artificielles. TALA - une ramification récente du TAL/TALN-réfère au Traitement Automatique de la Langue Arabe. La TA, le TAL, le TALN et le TALA dérivent de la linguistique l’informatique (Computational Linguistics) à des fins de conception et d’élaboration de logiciels de traduction de textes et de reconnaissance vocale.

A l’origine, la TA se basait essentiellement sur la substitution de mots atomiques d’une langue par des mots ou cognats (équivalents) dans d’autres langues. En utilisant des techniques de fouille de textes grâce à la Linguistique de corpus (Corpus Linguistics) et aux Statistiques entre autres, des traductions plus complexes pouvaient être effectuées moyennant une meilleure manipulation et une bonne maîtrise des différences typologiques entre les langues naturelles, l’identification d’expressions et d’idiomes communs à deux ou plusieurs langues et en procédant à l’isolement des différences entre les langues. Cependant et malgré la rapidité de la traduction machine qui est le résultat de l’implication de compétences transversales et multidisciplinaires en linguistique, en informatique, en mathématiques et en statistiques, entre autres, les systèmes actuels ne peuvent offrir le même rendement avec la même qualité que le traducteur humain. Les traductions suggérées manquent de précision et sont erronées notamment quand il s’agit de traduire les adages et les proverbes de l’arabes vers le français par exemple (BEDJAOUI et al., 2020BEDJAOUI, Wafa et al. Dictionnaires contextuels: pour une approche ergonomique de la biotraduction.Texto Livre: Linguagem e Tecnologia, v. 14, n. 1, e25577, sept. 2020. DOI: 10.35699/1983-3652.2021.25577. Disp. à l’adr.:<:https://periodicos.ufmg.br/index.php/textolivre/article/view/25577 >. Visité le: 5 juill. 2021.
https://periodicos.ufmg.br/index.php/tex...
). Dépourvue de moyens de perception et d’action sur le monde réel, la TA considère la compréhension comme un ensemble de transformations successives d’un langage de représentation dans un autre (KE HU, 2020KE HU, Kevin. How MT errors correlate with postediting effort: a new ranking of error types. Asia Pacific Translation and Intercultural Studies, v. 7, n. 3, p. 299-309, sept. 2020. DOI: 10.1080/23306343.2020.1809763. Disp. à l’adr.: <: https://www.tandfonline.com/doi/full/10.1080/23306343.2020.1809763 >. Visité le: 5 juill. 2021.
https://www.tandfonline.com/doi/full/10....
). Ceci est d’autant plus évident lorsqu’il s’agit de traduire des documents spécifiques tels que le texte juridique. Il existe, certes, sur le marché de la programmation informatique (software) des dictionnaires spécialisés performants et des traducteurs automatiques très itératifs qui sont d’une aide précieuse pour le traducteur humain. Tout comme il existe des programmes de rédaction technique dans des domaines sensibles tels que celui de la santé et de la sécurité (publique, routière, industrielle, ferroviaire, aérienne, etc.) par exemple. Des logiciels de traduction automatique tels que le SYSTRAN, IBM, NASHQ, POWER TRANSLATOR et autres tiennent compte de la spécificité du domaine grâce à leurs dictionnaires par domaine et ils améliorent ainsi le rendement du traducteur humain en limitant au maximum le facteur temps nécessaire à l’opération de traduction. Des techniques nouvelles et particulièrement efficaces font appel aux décisions (sélections, instructions) de l’utilisateur. Cependant la machine manque toujours de cette compétence qui permet la mobilisation de plusieurs ressources cognitives (dont dispose le traducteur humain), car il s’agit d’un processus qui requiert une multitude de prises de décisions, en fonction des éléments contenus explicitement ou implicitement dans le texte à traduire, de la situation de communication dans laquelle s’insère l’acte traductionnel, du bagage cognitif du traducteur, etc (Politis, 2017POLITIS, Michel. Le traducteur en tant qu’entité cognitive. Mai 2017. Disp. à l’adr.: <: https://termcoord.eu/2017/05/le-traducteur-en-tant-quentite-cognitive/ >. Visité le: 6 juill. 2021.
https://termcoord.eu/2017/05/le-traducte...
).

En réalité, adopter une perspective cognitive (FUCHS, 2017FUCHS, Catherine. Pour introduire à la linguistique cognitive. In: FUCHS, Catherine (Éd.). La linguistique cognitive. Paris: Éditions de la Maison des sciences de l’homme, 2017. p. 1-24. DOI: 10.4000/books.editionsmsh.7055. Disp. à l’adr.: <: http://books.openedition.org/editionsmsh/7055 >. Visité le: 5 juill. 2021.
http://books.openedition.org/editionsmsh...
, p. 10) en traduction automatique semble être la seule solution. Il faudrait se demander comment les connaissances sont organisées pour pouvoir être acquises et mises en œuvre dans l’activité de langage automatique. En attendant, le rendement dans la traduction peut ainsi être amélioré qualitativement et quantitativement lorsque l’utilisateur agit sur le système (le logiciel) en identifiant les mots segments dans le texte qui ont la fonction de nom propres par exemple. Il s’agit dans ce cas de la Traduction Assistée par Ordinateur (TAO) où l’utilisateur intervient pour restreindre le champ lexical et limiter les structures possibles ou pour modifier ou corriger des structures ambiguës (pre-editing). Il peut intervenir aussi au cours du traitement, ou même à la fin pour révision (post-editing) décliner, adopter ou reformuler les combinaisons proposées (LAB, s. d.LAB, Frédérique. La traduction automatique. Le bulletin de l’epi, n. 52, p. 165-170.; ALCINA, 2008ALCINA, Amparo. Translation technologies: Scope, tools and resources. Target. International Journal of Translation Studies, v. 20, n. 1, p. 79-102, juin 2008. DOI: 10.1075/target.20.1.05alc. Disp. à l’adr.:<:https://benjamins.com/online/target/articles/target.20.1.05alc >. Visité le: 5 juill. 2021.
https://benjamins.com/online/target/arti...
; PAULSEN; SCHJOLDAGER, 2016PAULSEN, Christensen T.; SCHJOLDAGER, Anne. Computer-aided translation tools - the uptake and use by Danish translation service providers. The Journal of Specialized Translation, n. 25, p. 89-105, 2016. Disp. à l’adr.: <: https://www.semanticscholar.org/paper/Computer-aided-translation-tools-the-uptake-and-use-Christensen-Schjoldager/58545d82c793ede8330f6c0fcea77dec9efd9141 >. Visité le: 6 juill. 2021.
https://www.semanticscholar.org/paper/Co...
). Avec l’aide de ces techniques, la TA s’est révélée utile comme outil pour aider les traducteurs humains. Elle peut même, dans certains cas, produire le rendement escompté. Mais cela est très rare et dépend essentiellement des systèmes filtres et des systèmes experts du logiciel en question. Avant, pendant et/ou après, le traducteur intervient pour aider la machine et, en conséquence, récolte un temps précieux, un effort cher, des coûts inutiles et une qualité distinguée (ZEMNI; AWWAD; BOUNAAS, 2020ZEMNI, Bahia; AWWAD, Wiam; BOUNAAS, Chaouki. Audiovisual translation and contextual dictionaries: an exploratory comparative study of Reverso Context and Almaany uses. Asian EFL Journal Research Articles, v. 27, n. 5.1, p. 274-309, 2020. Disp. à l’adr.: <: https://www.asian-efl-journal.com/monthly-editions-new/2020-monthly-editions/volume-27-issue-5-1-december-2020/ >. Visité le: 5 juill. 2021.
https://www.asian-efl-journal.com/monthl...
, p. 279).

La Traduction Automatique (ou TAO) qui représentait initialement un objectif plutôt difficile à atteindre, offre de nos jours des programmes accessibles à tout un chacun et elle aboutit à des résultats de meilleure qualité qu’auparavant. Des traducteurs automatiques et dictionnaires électroniques (sous forme de produits finis ou en ligne) sont disponibles dans des domaines de spécialités aussi variés que celui de la santé, de la sécurité, du droit juridique, de la chimie, de l’architecture, etc (HUTCHINS; SOMERS, 1992HUTCHINS, William John; SOMERS, Harold L. Introduction to machine translation. London: Academic Press, 1992.). Ils permettent d’accélérer le processus, afin de pouvoir publier simultanément les versions traduites et les documents en langue source, tout en participant à la réduction des coûts (KE HU, 2020KE HU, Kevin. How MT errors correlate with postediting effort: a new ranking of error types. Asia Pacific Translation and Intercultural Studies, v. 7, n. 3, p. 299-309, sept. 2020. DOI: 10.1080/23306343.2020.1809763. Disp. à l’adr.: <: https://www.tandfonline.com/doi/full/10.1080/23306343.2020.1809763 >. Visité le: 5 juill. 2021.
https://www.tandfonline.com/doi/full/10....
).

De façon très générale, le processus de la reconnaissance textuelle en vue de la traduction se fait essentiellement sur la base d’un décodage de la signification du texte source et d’un encodage de cette signification dans la langue cible à travers une batterie d’algorithmes et de paramètres morphosyntaxiques et mathématiques. Ce procédé simple en apparence suscite des opérations cognitives très complexes. Ainsi, pour décoder la signification du texte source dans sa totalité, le traducteur doit interpréter et analyser tous les dispositifs du texte. Ceci exige une connaissance détaillée de la syntaxe des langues à traduire et de leur sémantique, entre autres, ainsi que la culture des langues en question avant de procéder au décodage et à l’encodage. C’est là, précisément que réside tout le défi dans la traduction automatique. Comment pourrait-on programmer un ordinateur pour ”saisir” ces données sous-jacentes d’un texte (tel que le fait le traducteur humain) et ”créer” un nouveau texte dans la langue cible avec la même signification. Comment pourrait-on surmonter les difficltés de la traduction des idiomaticités disparates et appréhender, par conséquent, des sens implicites qui imposent non seulement de prendre du recul à l’égard des unités lexicales prises indépendamment mais aussi de comprendre les différents modes de conceptualisation mis en œuvre et la façon dont ils se révèlent dans les langues source et cible (VANDAELE; LUBIN, 2005VANDAELE, Sylvie; LUBIN, Leslie. Approche cognitive de la traduction dans les langues de spécialité: vers une systématisation de la description de la conceptualisation métaphorique. META, Montréal, v. 50, n. 2, p. 415-431, 2005. Disp. à l’adr.: <: https://papyrus.bib.umontreal.ca/xmlui/handle/1866/1436 >. Visité le: 6 juill. 2021.
https://papyrus.bib.umontreal.ca/xmlui/h...
).

Il existe plusieurs systèmes pour aboutir à une automation des langues telle que la Traduction automatique à base de dictionnaires électroniques ou Dictionary-Based Machine Translation(DBMT).

Celle-ci utilise des bases d’entrées lexicales. Les mots sont traduits comme dans un dictionnaire au format papier. Ils sont présentés sous forme de mot-à-mot et sont généralement démunis de corrélation particulière quant à la signification des mots de la Langue Source par rapport à ceux de la Langue Cible.

La Traduction automatique par Statistiques ou Statistical Machine Translation (SMT) est un autre procédé d’automation des langues. Son but est de produire des traductions en utilisant des méthodes statistiques combinant des corpus bilingues conséquents (big data) et l’apprentissage automatique (machine learning) (ZEMNI; BEDJAOUI; ELSAADANY, 2021ZEMNI, Bahia; BEDJAOUI, Wafa; ELSAADANY, Marwa. Recherche terminologique et traduction automatique: pour une utilisation optimale du logiciel Reverso Context. Texto Livre: Linguagem e Tecnologia , v. 14, n. 1, e26501, jan. 2021. DOI: 10.35699/1983-3652.2021.26501. Disp. à l’adr.:<:https://periodicos.ufmg.br/index.php/textolivre/article/view/26501 >. Visité le: 6 juill. 2021.
https://periodicos.ufmg.br/index.php/tex...
, p. 2). Il s’agirait dans ce cas d’élaborer des corpus de textes spécifiques bilingues pour aboutir à des résultats probants.

La Traduction automatique à base d’exemples ou Example-Based Machine Translation (EBMT) se caractérise par l’utilisation d’un corpus bilingue en tant que base de données principale. C’est essentiellement une traduction par analogie et elle peut être considérée comme l’application de l’approche du raisonnement au cas par cas. Qu’elle soit par statistique ou à base d’exemples, ces deux types de traductions utilisent des mémoires de traduction permettant un stockage et une recherche très efficaces des textes existants sur support électronique, disponibles pour des langues variées, annotés avec des informations linguistiques, afin de permettre à la machine des interprétations conformes aux attentes des utilisateurs (KE HU, 2020KE HU, Kevin. How MT errors correlate with postediting effort: a new ranking of error types. Asia Pacific Translation and Intercultural Studies, v. 7, n. 3, p. 299-309, sept. 2020. DOI: 10.1080/23306343.2020.1809763. Disp. à l’adr.: <: https://www.tandfonline.com/doi/full/10.1080/23306343.2020.1809763 >. Visité le: 5 juill. 2021.
https://www.tandfonline.com/doi/full/10....
).

La Traduction automatique inter-langue ou Interlingual Machine Translation fonctionne à base de règles génératrices. Ainsi, le texte à traduire est transformé en une représentation qui est indépendante de la langue source et de langue cible. Letexte de la langue cible est alors généré à partir de cette représentation intermédiaire.

Il existe également des prototypes de traducteurs développés dans des universités et centres de recherche en TAL. Le Centre Lucien Tesnière de Besançon, par exemple, a développé des dictionnaires et traducteurs automatiques tels que le Multilingual Co-built Dictionnary (MultiCodict) ou le Labelgram.

Le système que nous essayons de développer actuellement est basé sur un composant instruit de génération de langue en utilisant des bases de données avec une mémoire de traduction d’un millier de phrases et ce dans les domaines des Hydrocarbures et du Tourisme (BOUHADIBA; ROUABHI, 2008BOUHADIBA, Farouk; ROUABHI, Miloud. A propos d’un Dictionnaire Electronique Arabe/Anglais/Français dans le Domaine des Hydrocarbures. Revue Maghrébine des Langues, v. 6, n. 1, p. 111-141, déc. 2008. Disp. à l’adr.: <: https://www.asjp.cerist.dz/en/article/133653 >. Visité le: 5 juill. 2021.
https://www.asjp.cerist.dz/en/article/13...
, p. 111, 141).

3 Quelques aspects de la segmentation en arabe

Nous essayerons dans ce qui suit de mentionner brièvement des phases que nous jugeons nécessaires à la segmentation et à la modélisation de la langue arabe et ce par rapport aux caractéristiques et fonctionnements d’autres langues. La comparaison lexicologique est l’une des bases qui permettent de mieux saisir les différences et similitudes de la langue arabe par rapport à d’autres langues. A titre d’exemple, l’anglais possède des unités lexicologiques pour les articles {a, an, the} ou bien l’ensemble vide {Ø} pour l’indéfini pluriel, des prépositions {in, on, out, and, about, ...},des pronoms non affixés {I, You, Him, Her, ...} et des auxiliaires et modaux {Be, Have, Can, May, ...} comme marqueurs du temps et de l’aspect. L’arabe génère certaines de ces fonctions soit en liant les mots et morphèmes affixés (préfixés, infixés, suffixés) et en les incorporant à d’autres formes telles que les noms et les verbes, soit en séparant ces derniers. Ceci étant gouverné par des règles morphosyntaxiques qui opèrent dans la langue. Nous optons pour une segmentation où les inflexions par exemple sont comptabilisées comme des unités lexicologiques indépendantes. Ainsi, l’article indéfini en arabe est représenté par l’ensemble vide {Ø}. Une forme arabe isolée telle que ٌ وَلدَ walad (un)/6 6 Les parenthèses à l’intérieur de la représentation phonologique indiquent la forme pausale en arabe et l’on entend [walad]. (vocalisée) que l’on retrouve dans un texte non vocalisé sous la forme graphique ولد et qui ne serait reconnue comme telle, c’est-à-dire ‘un garçon’ que si l’on insérait dans la chaine la structure {Ø + ولد } afin de ne pas confondre cette dernière avec d’autres formes isolées telles que le passif ‘َ وُل ِ il est / fut né’ ou le causatif وَلَدّ ‘générer’ par exemple. Il en est de même pour les pronoms personnels implicites7 7 En langue arabe, les pronoms personnels sujets sont implicites, c’est-à-dire qu’ils n’apparaissent pas généralement dans la forme verbale. En anglais il s’agit de ‘hidden pronouns’. comme dans كَتبَتْ ُ(أنا)/(anâ) katabt(u)/ ‘J’ai écrit’ que nous comptabilisons comme deux unités lexicales indépendantes (listemes) même si le pronom personnel أنا n’apparait pas dans le texte mais il est sous-entendu comme dans la phrase القصة كتبت/katabtu l qissa(ta) /‘J’ai écrit l’histoire (le conte)’8 8 Nous ne pouvons, dans le cadre de cet article, détailler les procédures qui nous permettent de comptabiliser des unités lexicologiques indépendantes. Ceci fera l’objet d’un prochain article dans ce sens. .

Une autre caractéristique de l’arabe par rapport à l’anglais c’est la profusion de noms pour désigner un concept alors que l’anglais contient un plus grand nombre d’adjectifs que l’arabe.

La comparaison syntaxique permet également de mieux saisir les différences et similitudes entre l’arabe et d’autres langues. Le nombre d’unités syntaxiques (grammaticales) est plus élevé en anglais. L’arabe a tendance à utiliser des coordinations syndétiques et asyndétiques là où l’anglais fait appel à des phrases mixtes et complexes avec divers procédés de coordination. La coordination en arabe représente un dispositif très productif alors que le système de ponctuation est employé de façon non fonctionnelle. Nous citerons, à titre d’exemples, des cas tels que celui du wāw (و) qui exprime la simultanéité en arabe là où le français et l’anglais utilisent d’autres constructions grammaticales sans le « et » ou le « and ». Ainsi, une phrase arabe telle que:

قاطعها وصاح {qâúaʢaha wa ȿaħa} (AL-MANFALUTI, 1952AL-MANFALUTI, Mustafa Lutfi. ،النظرات. القسم الثالث 12الطبعة. القاهرة ÔÑßÉ ÌæÇãÚ ÇáÝßÑ , 1952., p. 236)9 9 Traduit de l’arabe.

ne se traduit pas en français par « *Il l’a interrompue et il a crié » ou en anglais par « *He interrupted her and he shouted »mais par « Il l’a interrompue tout en criant » et « He interrupted her, shouting ... » respectivement. Nous remarquons que l’anglais utilise une virgule pour indiquer la simultanéité dans les actions là où le français a recours à la double préposition« tout en ».

4 Quelques aspects du texte juridique

La loi est une profession où chaque mot est supposé être porteur d’un sens bien particulier, voire même précis. Il s’agit d’un texte portant à la fois les deux notions mentionnées plus haut. Il possède des dispositifs généraux communs qui s’appliquent à toute les langues. A l’arabe, à l’anglais ou au français ces dispositifs sont résumés comme suit:

  • Le discours législatif est différent de la langue écrite sur le plan lexical et sur le plan de la construction de phrases qui sont généralement très longues. La différence entre l’arabe et le français ou l’anglais sur ce dispositif est que l’arabe utilise moins de ponctuation (non fonctionnelle en arabe) alors que les deux autres langues usent de la ponctuation comme mécanisme fonctionnel et producteur de sens dans la langue.

  • La profusion de phrases longues et complexes est due non seulement à l’archaïsme du discours juridique mais aussi et surtout dans un but d’éviter toute ambiguïté dans les textes du procès en plaçant le maximum d’information et de données sur une unité phraséologique particulière.

  • Un autre dispositif typique relie ensembles des mots ou des expressions par coordination: {et, ou, ...} en français {and, or, ...} en anglais et {waw} en arabe.

  • Une profusion dans l’utilisation de structures phrastiques peu communes ou très rarement utilisées par les natifs des deux langues.

  • La loi est toujours exprimée d’une façon impersonnelle afin de s’adresser à plusieurs instances (le législateur, l’exécutif, le mandatant, la sentence, la Cour, le Juge, l’Avocat, etc.

  • Le texte juridique évite en général toute allégorie, résonance, allitération, exotisme, synonymie, sens allusif, métaphore et autres aspects du langage humain pour éviter toute ambiguïté ou toute équivoque dans la lecture du procès.

  • Des sources religieuses en tant que sources bien fondées, sont généralement présentes dans le texte juridique. Il s’agirait d’instruire la machine en vue d’une traduction automatique dans ce sens.

  • Le texte juridique est, par définition, un texte conservateur, donc non susceptible de changement du fait que la phraséologie a déjà été testée, approuvée et appliquée dans la juridiction.

Le droit étant un phénomène social, le produit d’une culture, il acquiert dans chaque société un caractère unique tant au niveau de la microstructure (vocabulaire juridique), qu’au niveau de la macrostructure (la façon d’exprimer des situations juridiques dans chaque culture juridique (PETRŮ, 2016PETRŮ, Ivo. La traduction juridique: entre équivalence fonctionnelle et équivalence formelle. Études romanes de Brno, n. 2, p. 177-189, 2016. DOI: 10.5817/ERB2016-2-14. Disp. à l’adr.: <: http://digilib.phil.muni.cz/handle/11222.digilib/135898 >. Visité le: 6 juill. 2021.
http://digilib.phil.muni.cz/handle/11222...
, p. 179). En effet, Les cultures, au sein desquelles les systèmes juridiques sont apparus et se sont épanouis, sont le fruit d’une longue et tortueuse gestation au plus profond des groupements humains (GÉMAR, 2019GÉMAR, Jean-Claude. Jurilinguistic Analysis in Translation, Comparative Law Practice. Translate the Letter or “The Spirit of the Laws” ? The Case of the Code Napoléon. Comparative Legilinguistics, v. 37, n. 1, p. 9-61, déc. 2019. DOI: 10.14746/cl.2019.37.1. Disp. à l’adr.:<:https://www.sciendo.com/article/10.14746/cl.2019.37.1 >. Visité le: 5 juill. 2021.
https://www.sciendo.com/article/10.14746...
, p. 17). Une telle situation a fait du texte légal un champ riche en termes ayant des significations différentes d’une société à une autre et parfois au sein d’une même société (GÉMAR, 2019GÉMAR, Jean-Claude. Jurilinguistic Analysis in Translation, Comparative Law Practice. Translate the Letter or “The Spirit of the Laws” ? The Case of the Code Napoléon. Comparative Legilinguistics, v. 37, n. 1, p. 9-61, déc. 2019. DOI: 10.14746/cl.2019.37.1. Disp. à l’adr.:<:https://www.sciendo.com/article/10.14746/cl.2019.37.1 >. Visité le: 5 juill. 2021.
https://www.sciendo.com/article/10.14746...
, p. 20).

Sur le plan grammatical par exemple, l’une des particularités du texte juridique anglais est qu’il est basé sur des modaux tels que {can, could, maymight, will, ...} et dont les nuances en anglais sont parfois difficiles à traduire en arabe même pour un traducteur averti. La traduction du texte juridique de l’arabe vers le français (ou vice-versa) et encore plus de l’arabe vers l’anglais (ou vice-versa) doit surtout prendre en charge des problèmes étroite mentalités à la nature de la langue légale et aux dispositifs spécifiques des systèmes légaux des langues française et arabe ou anglaise et arabe. Ceci apparaît souvent dans des jugements arrêtés en France, aux Etats Unis ou en Grande Bretagne (divorces par exemple) à traduire en arabe et inversement.

A prime abord, ces spécificités du texte juridique de chaque langue en question se manifestent dans la traduction dite juridique. Partant du principe que cette dernière se concevrait comme la transposition d’une culture juridique A vers une culture juridique B (BOURDON, 2019BOURDON, Raphaël. La Traduction juridique - À la croisée des cultures juridiques et linguistiques. Fév. 2019. Disp. à l’adr.: <: https://mastertsmlille.wordpress.com/2019/02/19/la-traduction-juridique/ >. Visité le: 5 juill. 2021.
https://mastertsmlille.wordpress.com/201...
), et visant avant tout la clarté et la compréhension, comme tout autre texte pragmatique (KÜBLER, 2014KÜBLER, Natalie. Traduction pragmatique, linguistique de corpus, traducteur: un ménage à trois explosif ?. 2014. Disp. à l’adr.: <: http://lodel.irevues.inist.fr/tralogy/index.php?id=288&format=print >. Visité le: 5 juill. 2021.
http://lodel.irevues.inist.fr/tralogy/in...
), il s’agit d’un exercice de droit comparé requérant l’analyse comparative (GÉMAR, 2019GÉMAR, Jean-Claude. Jurilinguistic Analysis in Translation, Comparative Law Practice. Translate the Letter or “The Spirit of the Laws” ? The Case of the Code Napoléon. Comparative Legilinguistics, v. 37, n. 1, p. 9-61, déc. 2019. DOI: 10.14746/cl.2019.37.1. Disp. à l’adr.:<:https://www.sciendo.com/article/10.14746/cl.2019.37.1 >. Visité le: 5 juill. 2021.
https://www.sciendo.com/article/10.14746...
, p. 12). En fait, d’un point de vue juridique, un texte-pour être juridiquedoit produire des effets juridiques (DURR, 2017DURR, Margarete. La notion de pertinence en traduction juridique bidirectionnelle français-allemand. Nov. 2017. Theses - Université de Strasbourg. Disp. à l’adr.: <: https://tel.archives-ouvertes.fr/tel-01831568 >. Visité le: 5 juill. 2021.
https://tel.archives-ouvertes.fr/tel-018...
, p. 53). Donc, une telle analyse semble nécessaire pour surmonter l’absence partielle ou même totale d’équivalence entre les termes et trouver des structures adéquates qui rendraient les mêmes effets juridiques du texte source.

De ce fait et afin de donner plus de précisions, nous citons les exemples suivants : Des attendus et de la décision. Les faits sont généralement traduits en arabe par : الوقائع [al waqâʡiʢ]10 10 Pour éviter tout problème de représentation phonétique / phonologiques, nous utilisons parfois des representations image. , Les attendus par : ألحيثيات [al ħajθijât] du fait que la copule arabe حيث ħajθu et l’expression حيث أن ħajθu anna (Vu que, étant donné, etc.) sont très productives dans le corps d’un jugement donné حكم [ħukm] et la décision devient : المنطوق [al manʈûq] Parce qu’elle est produite oralement.

En voici quelques exemples :

Les faits:

بيان وقائع الدّعوة

: الوقائع

بعر يضة افتتاحية مذاعة لدى كتابة ضبط القسم المدني بتاريخ ..... رفع المدّعي ..... المباشر للخصام بوسيطة وكيله

الأستاذ ..... بدعوة ضدّ المدّعي عليه المباشر للخصام بنفسه موضوعها تثبيت حجز تحفظي هذا ملخّصها

Que nous transcrivons ci-dessous:

bajân waqâʡiʢ addaʢwa

Les faits : bi ʢariɖa iftitâɦijja mudâʢa ladâ kitâbat ɖabʈ al qism al madani bitarîχ .....rafaʢa al muddaʢi ..... al mubâʃir lil χiȿâm biwasîʈati wakîlihi al ustað bidaʢawa ɖidda al muddaʢi ʢalaih al mubâʃir lilχiȿâm bi nafsihi mawðuʢuha taθbît ɦadʒz taɦaffuði hâda mulaχχaȿuha

En donnant le texte arabe ci-dessous, ce dernier est traduit en français par des outils de traduction en ligne sur le NET de la façon suivante:

:الوقائع

بعر يضة افتتاحية مذاعة لدى كتابة ضبط القسم المدني بتاريخ ..... رفع المدّعي ..... المباشر للخصام بوسيطة وكيله

الأستاذ ..... بدعوة ضدّ المدّعي عليه المباشر للخصام بنفسه موضوعها تثبيت حجز تحفظي هذا ملخّصها

Exposé des faits en appel

Faits: Pétition écrit une section de contrôle éditorial diffusé sur civile. Le demandeur

..... Argument direct à l’argument et son agent, M. Contre le défendeur invité à diriger

son propre thème querelle de fixation de cette synthèse installée ...

Et que nous traduisons par:

Résumé des faits

Suite à une requête déposée auprès du Greffe de la Section Civile en date du sous le N° .... , le défendeur a déposé par son avocat le Professeur une plainte à l’encontre du défendant lui-même dont le sujet est la mise en conservation provisoire dont voici le contenu ...

En traduisant ce texte arabe en Anglais, ces outils nous produisent:

Statement of the facts of the call

Facts: Petition in writing an editorial broadcast control section on civil... The plaintiff.....

Direct argument for argument and his agent, Mr. Against the defendant invited to direct his own quarrel theme installed attachment summary of this...

SYSTRAN version 6 avec la sélection du dictionnaire juridique) nous produit la ‘traduction’ suivante:

Following a request deposited après of Greffe of Section Civile on....>. .> under N° , the defendant deposited by its lawyer the professor....>. .> a complaint with opposition of the defendant itself whose subject is the setting in provisional conservation of which here contents...

Les attendus:

: الحيثيات

..... بعدالمداولة قانونا حيث أنّ موضوع النزاع المطروح يدور حول تثبيث الحجز التحفظي الوارث على

Que nous transcrivons:

Les attendus: baʢda l mudâwala qânûnan ħayθu anna mawduʢ annizâʢ al maʈrûħjadûru ħawla taθbît al ħadʒz attaħaffuði al wâriθ ʢala .....

Traduit en français (par nous-mêmes) par:

Après avoir lu l’affaire en délibéré dont le sujet du conflit en présence tourne autour de la conservation provisoire concernant .....

Cet extrait de texte juridique arabe est traduit en français par des outils de traduction sur le Net comme suit:

Attendus

Ensuite après avoir lu les affaires dessus de délibéré au sujet des dont le sujet du conflit en présence tourne autour de la conservation temporaire...

SYSTRAN (version 6 avec dictionnaire juridique) le traduit en anglais comme suit:

Waited

Afterwards to have read the business in deliberated of which the subject of the involved conflict turn around the provisional conservation concerning...

La décision:

:المنطوق

..... حكمت المحكمة فصلا في المواد المدنية حكما علانيا حضور يا و ابتدائيا

قبول الدّعوة شكلا .1

2. ..... ألحكم بتثبيت الحجز التحفظي الوراث على

Que nous transcrivons:

La décision : ħakamat al maħkama faȿlan fil mawâd al madanijja ħukman ʢalânijjan ħudurijjan wab tidâʡijjan.....

ɨ. qabûl addaʢwa ʃaklan

ʌ. al ħukmu bi taθbît al ħadʒz attaħaffuði al wâriθ ʢala ..

Et que nous traduisons :

Le Tribunal a décidé en matière de droit civil et en procès publique et ce en présence des parties concernées et en premier ressort:

1. L’affaire recevable en la forme

2. Confirmation des mesures conservatoires provisoires concernant....

Cet extrait de texte juridique arabe est traduit en français par des outils de traduction sur le Net comme suit:

Parlé / Oral

La cour décidée en ce qui concerne la loi civile et dans le public de procès et ceci en présence des pièces concernées et dans la première ressource:

1. Les affaires admissibles sous la forme

2. Confirmation de C des mesures d’académies S temporaire au sujet de....

Traduit en Anglais par SYSTRAN version 6 avec dictionnaire juridique, cela nous donne:

Décision

The Court decided out of matter of civil law and in lawsuit public and this in the presence of the parts concerned and in the first resort:

1. The admissible business in the form

2. Confirmation of academies measurements concerning....

Ces exemples sont révélateurs, nous semble-t-il, non seulement des irrégularités dans les correspondances plus spécialement aux niveaux syntaxique et lexical entre les langues en question mais aussi de la difficulté dans la transposition d’un texte chargé de tout un poids culturel, traditionnel et civilisationnel vers un texte n’ayant pas nécessairement les mêmes références socioculturelles et autres que même l’humain trouve parfois difficiles à traduire. Qu’en serait-il alors pour la machine ? Nous remarquons, à titre d’exemple, que dans les traductions de l’arabe vers le français ou l’anglais, l’article défini de l’arabe est parfois omis et ce surtout lorsqu’il fait partie d’un mot isolé tel que الوقائع traduit en français par Faits et en Anglais par Facts (voir supra les exemples de الحيثيات et deالمنطوق ). Ceci n’empêche pas pour autant des tentatives de recherche dans ce domaine pour instruire la machine à procéder à des prototypes de traduction de textes juridiques.

Le système TACT (Traduction Automatique Centre Tesnière, France) par exemple est un système de traduction automatique français-arabe (ALSHARAF; CARDEY; GREENFIELD, 2004ALSHARAF, Haytham; CARDEY, Sylviane; GREENFIELD, Peter. French to Arabic machine translation: the specificity of language couples. In: p. 11-17. Disp. à l’adr.:<:https://aclanthology.org/2004.eamt-1.2 >. Visité le: 5 juill. 2021.
https://aclanthology.org/2004.eamt-1.2...
) de textes juridiques. Appliqué au domaine du droit, ce traducteur automatique arrive à générer le type de traduction suivante: l’ordre administratif connaît des litiges relatifs à l’organisation et au fonctionnement des services publics et aux contrats administratifs.

النظام الإداري يحكم في النزاعات المرتبطات بالتنظيم و آلية الخدمات العامة و بالعقود الإدار ية

Nous avons été à maintes fois surpris de constater que pour passer d’une langue à une autre certains systèmes empruntaient une 3ème langue qui est souvent l’anglais; ce qui fait que les résultats ne peuvent pas être nécessairement en adéquation entre SL et TL en passant par une langue intermédiaire (l’anglais). Par exemple, pour le mot « libre » en français ou « free » en anglais, nous avons trouvé dix neuf entrées lexicales dans la fouille de textes juridiques arabes. Ceci en plus du sens commun de حر. Il s’agirait donc de répertorier ces différentes entrées lexicales arabes, de situer ou de localiser les contextes dans lesquels elles sont susceptibles d’apparaitre et d’instruire la machine dans ce sens. Tâche tout à fait réalisable par une recherche lexicographique et sémantique dans ce domaine.

Dans les exemples suivants nous allons présenter 06 phrases, incluant des termes nécessitant une recherche extralinguistique, tirées d’un contrat de distribution établi entre une société saoudienne et une société française. Nous analyserons par la suite des traductions produites respectivement par le logiciel Reverso et/ou ALMAANY, SYSTRAN, et un traducteur humain (nous-même). Nous signalons ici que nous avons opté pour deux traductions automatiques puisque les logiciels choisis ne fonctionnent pas de la même manière. Reverso et ALMAANY ne prennent pas en charge des phrases entières. Contrairement à SYSTRAN, ils traitent des mots isolés, des expressions ou des mot-clés seulement qui se trouvent dans leurs bases de données. Nous pensons que ceci peut affecter la qualité des traductions fournies. A cet effet nous nous contenterons de garder la traduction du mot en question (souligné) produite par Reverso et/ ou ALMAANY et les traductions de la phrase entière fournies par SYSTRAN et par le traducteur humain. Enfin nous signalons que les autres erreurs ou spécificités (hors celles relatives aux mots choisis) ne seront pas prises en considération.

« Par conséquent, cette lettre d’engagement a pour but de certifier que... »

الرسالة

…ولذلك الغرض من هذه الرسالة التصديق على ما يلي

…بناء على ما سبق، يهدف هذا الخطاب إلى

Que nous transcrivons:

arrisæ ːla

wa liðalika al ɣaraɖ min ha ːðihi arrisæ ːla attaȿde ːq ʢala ma ː jali.....

bina ːan ʢala ma ː sabaqa, jahdif ha ːða l χiʈab ila ː......

Le logiciel Reverso Context a fourni رسالة التزام comme traduction, SYSTRAN aussi. Le traducteur humain quant à lui a donné خطاب après avoir consulté un expert saoudien lequel a confirmé qu’en Arabie Saoudite on utilise plutôt خطاب dans le domaine juridique. Nous signalons ici qu’au Maghreb le mot خطاب est souvent utilisé pour traduire « allocution ».

« Le statut de distributeur autorisé dans le domaine de la formation des conducteurs sur le ”Territoire” et pour la durée du ”Contrat” ».

تكوين

.حالة الموزع المسموح به في مجال تدريب السائقين في "الإقليم" وفترة "العقد

."صفة " موزع معتمد في مجال تدريب السائقين داخل "منطقة التوز يع" خلال مدة "العقد

Que nous transcrivons:

takwi ːn

ɦa ːlat almuwazzaʢ almasmu ːɦ bihi fi ː maʒa ːl tadri ːb assa ːʡiqain fi ː alʡiqli ːm wa fitrat alʢaqd ȿefat muwazzaʢmuʢtamid fi ː maʒa ːl tadri ːb assaʡiqain da ːχil minʈaqat attawzi ːʢ χila ːl muddat alʢaqd

Pour le mot « formation » ALMAANY nous a donné تكوين alors que SYSTRAN a produit تدريب. Pour le traducteur humain, une petite recherche documentaire sur Google a montré qu’en Arabie Saoudite le mot le plus fréquent est celui de تدريب. Nous précisons qu’au Maghreb le mot تدريب correspond en premier lieu à « entrainement ».

« Le concessionnaire s’engage à générer un chiffre d’affaires minimum de 350 000,00 €. »

رقم أعمال

.و يلتزم صاحب الامتياز بإنتاج حد أدنى قدره 350 000 000 يورو للأعمال التجار ية

.يلتزم الموزع بتحقيق حجم مبيعات إجمالي يعادل 350000.00 يورو على الأقل

Que nous transcrivons:

raqm aʢma ːl

wajaltazim ȿaheb alʡimtijja ːz biʡinta ːʒ ɦadd ʡadna ː qadruhu 350 000 000 ju ːro lilʡaʢma ːl attiʒa ːrijja.

jaltazim almuwazzaʢ bitaɦqi ːq haʒm mabi ːʢa ːt ʡiʒma ːli ː juʢadil 3500000.00 ju ːro ʢalal ʡaqal

Le terme chiffre d’affaire a été traduit de trois manières différentes: Reverso l’a traduit littéralement et a donné رقم أعمال SYSTRAN l’a remplacé par إنتاج ou production, le traducteur humain, après avoir consulté un expert en économie, a opté pour حجم مبيعات ou volume des ventes. Ce choix a été confirmé en consultant plusieurs articles économiques. Cependant, le choix de رقم أعمال n’est pas totalement erroné. Il est l’largement employé au pays du Maghreb.

« Un logiciel spécialement conçu pour la formation pédagogique des conducteurs et conductrices dans le Royaume. »

بيداغوجي

.برنامج خاص لتدريب السائقين والسائقين في المملكة المتحدة

.برمجيات صممت خصيصا من أجل التدريب التعليمي للسائقين و السائقات بالمملكة

Que nous transcrivons:

bi ːda ːɣu ːʒi ː

barnaː mʒ χa ːȿ litadri ːb assa ːʡiqi ːn wassa ːʡiqa ːt fi ː almamlaka almuttaɦida

barmaʒijja ːt ȿommimat χeȿe ːȿan min ʡajl attadri ːb attaʢli ːmi ː lissa ːʡiqi ːn wassa ːʡiqa ːt bilmamlaka

Pour le mot « pédagogique » ALMAANY a emprunté le mot français et a produit بيداغوجي SYSTRAN a omis le mot. Le traducteur humain a préféré تعليمي un choix validé par un expert saoudien. Il est à signaler encore une fois que le mot بيداغوجي est souvent utilisé au Maghreb où les sociétés sont influencées par la culture française.

« Une gamme complète de services d’assistance comprenant des mises à jour. »

التحيينات

مجموعة كاملة من خدمات الدعم تتضمن تحديثات

تشكيلة متكاملة من خدمات المساعدة بما في ذلك التحديثات

Que nous transcrivons:

attaɦji ːna ːt

maʒmu ːʢatun ka ːmilatun min χadama ːt addaʢm tataɖamman tahdi ːθa ːt

taʃki ːlatun mutaka ːmilatun min χadama ːt almusaʢadati bima ː fi ː ða ːlika attaɦdi ːθa ːt

Le logiciel ALMAANY a produit تحيينات drivé de الحـين ou maintenant. SYSTRAN a préféré تحديث dérivé de حديث ou actuel, nouveau... etc. le traducteur humain a opté pour le même choix. L’expert saoudien a confirmé d’ailleurs ne jamais avoir entendu le mot تحيين.

« Le ”Concédant” est un fabricant de simulateurs de conduite et une entreprise leader sur le marché européen de la simulation de conduite automobile. »

سياقة

.المرحل" هو شركة محاكاة السيارات وشركة رائدة في السوق الأوروبية لمحاكاة قيادة السيارات

المنتج" مصنع لأجهزة محاكاة قيادة المركبات ومؤسسة رائدة في السوق الأوروبية

Que nous transcrivons:

sijja ːqa

al marɦal huwwa ʃarikatu muha ːkaat assijjara ːt wa ʃarikatun ra ːʡidatun fi ː assu ːqi alʡuro ːbijjati limuha ːkaat qijja ːdat assijja ːra ːt

almuntiʒ muȿneʢli aʡaʒhizat muha ːka ːt qijja ːdati almarkaba ːt wa muʡassasatun ra ːʡidatun fi ː assu ːqi alʡurobijjati

Pour le dernier mot, Reverso a choisi سياقة (un choix totalement validé en Algérie par exemple). SYSTRAN a omis le mot alors que le traducteur humain a donné قيادة. Son premier choix portait lui aussi sur سياقة mais l’expert saoudien l’a rejeté et l’a remplacé par قيادة. Ce choix a été validé après avoir consulté plusieurs articles traitant le sujet de la conduite en Arabie Saoudite.

Les mots choisis peuvent paraître évidents, simples ou faciles, mais ils véhiculent des nuances culturelles importantes qui peuvent affecter l’acceptabilité de la traduction. D’ailleurs l’analyse cidessus nous a montré que le texte juridique arabe diffère d’une région à une autre (Pays du Golf et Maghreb). Ce qui est valable dans l’une ne l’est pas forcément dans l’autre. La machine n’a pas détecté ces différences et ne les a pas pris en considération sauf pour le logiciel SYSTRAN à quelques occasions seulement (on peut le justifier par la nature de la langue Arabe utilisé par le logiciel. Il se peut qu’elle soit celle de la région de l’Arabie Saoudite). Le traducteur humain, quant à lui, grâce à des opérations de pre-editing, de post-editing, et de recherche documentaire (source humaines ou textuelles), a pu appréhender et identifier le sens d’un message, puis le transférer dans d’autres schémas cognitifs et enfin le transposer dans un autre code linguistique (ROLLO, 2016ROLLO, Alessandra. Approche cognitive de la traduction économique: réflexion théorique et retombées pratiques. MonTi: Monografías de Traducción e Interpretación, n. 8, p. 61-94, 2016. DOI: 10.6035/MonTI.2016.8.2. Disp. à l’adr.: <: http://www.e-revistes.uji.es/index.php/monti/article/view/2399 >. Visité le: 6 juill. 2021.
http://www.e-revistes.uji.es/index.php/m...
, p. 63) et fournir des traductions plutôt satisfaisantes qui correspondent aux critères d’acceptabilité du texte juridique arabe en Arabie Saoudite.

En effet, il s’agit de ce qu’on appelle l’ergonomie cognitive (LAVAULT-OLLÉON; CARRÉ, 2012LAVAULT-OLLÉON, Élisabeth; CARRÉ, Alice. Traduction spécialisée: l’ergonomie cognitive au service de la formation. ASp, n. 62, p. 67-77, nov. 2012. DOI: 10.4000/asp.3117. Disp. à l’adr.: <: http://journals.openedition.org/asp/3117 >. Visité le: 5 juill. 2021.
http://journals.openedition.org/asp/3117...
, p. 2). Une compétence qui met en exergue la relation entre l’homme et son environnement, de manière à ce que le sujet traducteur devient une entité cognitive, c’est-à-dire un être humain qui met ses facultés cognitives au service de la communication multilingue (POLITIS, 2017POLITIS, Michel. Le traducteur en tant qu’entité cognitive. Mai 2017. Disp. à l’adr.: <: https://termcoord.eu/2017/05/le-traducteur-en-tant-quentite-cognitive/ >. Visité le: 6 juill. 2021.
https://termcoord.eu/2017/05/le-traducte...
).

En conclusion, nous dirons simplement, que si l’on veut de bonnes traductions automatiques, il faudrait se limiter à un domaine précis. De plus, notre expérience nous a montré que les systèmes doivent être conçus de façon unidirectionnelle dans un premier temps et seulement ensuite l’on pourrait envisager de travailler dans l’autre sens, ce qui nécessite inévitablement la création d’un nouveau système. Si l’on cherche des résultats de qualité, l’analyse de la langue source devrait se faire en fonction de la langue cible, en sachant que ces analyses ne sont pas forcément réversibles.

Ainsi, pouvons-nous dire que la machine a besoin de se doter de ce que Holmes (1988) appelle une carte du texte original et une autre du genre de texte à produire dans la langue cible (FARNOUD, 2014FARNOUD, Esmaeel. Processus de la traduction: charge cognitive du traducteur. Corela, n. 12-2, déc. 2014. DOI: 10.4000/corela.3615. Disp. à l’adr.: <: http://journals.openedition.org/corela/3615 >. Visité le: 5 juill. 2021.
http://journals.openedition.org/corela/3...
, p. 2) et non traduire à partir d’une présentation intermédiaire comme nous venant de l’explique plus haut. Autrement, toute traduction automatique sollicitera une intervention humaine puisque lui seul possède ce processus mental faisant passer le message du niveau verbo-linguistique de la langue-source au niveau logico-cognitif (FARNOUD, 2014FARNOUD, Esmaeel. Processus de la traduction: charge cognitive du traducteur. Corela, n. 12-2, déc. 2014. DOI: 10.4000/corela.3615. Disp. à l’adr.: <: http://journals.openedition.org/corela/3615 >. Visité le: 5 juill. 2021.
http://journals.openedition.org/corela/3...
, p. 2). Un tel processus se produit avant l’opération pour limiter et restreindre les champs lexicaux et le domaine auquel appartient le texte, pendant l’opération pour choisir les catégories des mots et faciliter la recherche et enfin après l’opération pour sélectionner les choix les plus pertinents en effectuant des recherches documentaires adéquates.

Acknowledgements

This research was funded by the Deanship of Scientific Research at Princess Nourah bint Abdulrahman University through the Fast-track Research Funding Program.

Références

  • 1
    Concept développé au 19ème siècle par des penseurs tels que W. Von Humbolt et selon lequel le langage est l’expression de ‘l’esprit d’une nation’, de sa vision du Monde et de sa perception de la réalité. Concept repris et développé au 20ème siècle à travers la fameuse Hypothèse de Sapir et Whorf et plus récemment par le courant cognitiviste selon lequel le langage influence des processus cognitifs.
  • 2
    Edward Sapir: Lauenburg, Allemagne, 1884 - New Haven, Connecticut, 1939 Linguiste américain. Il a dégagé la notion de phonème et proposé une nouvelle typologie des langues, fondée sur des critères formels (syntaxe et sémantique) et non plus historiques. C’est l’un des initiateurs du courant structuraliste. Benjamin Lee Whorf: Winthrop, Massachusetts, 1897 - Wethersfield, Connecticut, 1941. Linguiste américain. Disciple d’E. Sapir, il a émis l’hypothèse que le langage est en relation causale avec le système de représentation du monde. Le Petit Larousse, (2009).
  • 3
    Dans le courant cognitiviste et la Théorie universaliste, Chomsky (1964CHOMSKY, Noam. Current issues in linguistic theory. The Hague: De Gruyter Mouton, 1964. Disp. à l’adr.: <: http://VH7QX3XE2P.search.serialssolutions.com/?V=1.0&L=VH7QX3XE2P&S=JCs&C= TC0000594938&T=marc&tab=BOOKS >. Visité le: 5 juill. 2021.
    http://VH7QX3XE2P.search.serialssolution...
    , 1965CHOMSKY, Noam. Aspects of the theory of syntax. 20. print. Cambridge, Mass: MIT Press, 1965. (Special technical report / Massachusetts Institute of Technology, Research Laboratory of Electronics, 11).) a développé le concept de « Language Universals » pour stimuler la recherche d’une Grammaire Universelle (Universal Grammar).
  • 4
    Le terme ‘traducteur machine’ est utilisé pour désigner l’ensemble des opérations à des fins de traduction automatique et dictionnairique tels que les algorithmes, les systèmes filtres, les systèmes experts, la segmentation, la modélisation, etc.
  • 5
    SL renvoie à Source Language (en anglais) par opposition au TL (Target Language) ou Langue Cible (en français).
  • 6
    Les parenthèses à l’intérieur de la représentation phonologique indiquent la forme pausale en arabe et l’on entend [walad].
  • 7
    En langue arabe, les pronoms personnels sujets sont implicites, c’est-à-dire qu’ils n’apparaissent pas généralement dans la forme verbale. En anglais il s’agit de ‘hidden pronouns’.
  • 8
    Nous ne pouvons, dans le cadre de cet article, détailler les procédures qui nous permettent de comptabiliser des unités lexicologiques indépendantes. Ceci fera l’objet d’un prochain article dans ce sens.
  • 9
    Traduit de l’arabe.
  • 10
    Pour éviter tout problème de représentation phonétique / phonologiques, nous utilisons parfois des representations image.

Edited by

Editeur de section:

Daniervelin Pereira

Éditeur de mise en page:

Anna Izabella M. Pereira

Publication Dates

  • Publication in this collection
    20 Apr 2022
  • Date of issue
    2022

History

  • Received
    10 Jan 2021
  • Accepted
    15 Feb 2021
  • Published
    18 Oct 2021
Universidade Federal de Minas Gerais - UFMG Av. Antônio Carlos, 6627 - Pampulha, Cep: 31270-901, Belo Horizonte - Minas Gerais / Brasil, Tel: +55 (31) 3409-6009 - Belo Horizonte - MG - Brazil
E-mail: revistatextolivre@letras.ufmg.br