Jacques Poitou
Accueil
Plan du site
Langages | Ecritures | Ecritures latines | Ecriture chinoise | Numérique | Cryptographie | Typographie | Reproduction et transmission | Censure | Lexique | Jeux
Origine | Ecritures alphabétiques | Pictogrammes | Proto-élamite | Hiéroglyphes égyptiens | Ougaritique | Hiéroglyphes anatoliens | Cunéiforme | Grec | Etrusque | Arménien | Crétois | Arabe | Hébreu | Runique | Gotique | Cyrillique | Russe | Ukrainien | Serbo-croate | Vallée de l'Indus | Kharoshthi | Brahmi | Birman, khmer, lao, thaï | Indonésien | Orkhon | Mongol | Dongba | Transcription

Transcription et translittération



La multiplicité des écritures pose un problème qui est bien antérieur à la naissance de l'informatique : pour être utilisables à l'écrit dans une langue donnée, les mots écrits dans des écritures étrangères doivent être transcrits avec les signes utilisés dans la langue d'accueil. Par exemple, un locuteur compétent d'une langue à écriture latine ne peut pas lire, sans connaissances spéciales, un mot écrit en caractères chinois – et vice versa. D'où la nécessité de transcriptions et de systèmes de transcription.

Cette question vaut pour tous les couples de langues à écritures différentes, mais pour des raisons à la fois historiques et techniques, l'aspect le plus important concerne la transcription des langues d'autres écritures vers l'écriture latine, c'est-à-dire la romanisation.

Les raisons historiques tiennent aux politiques commerciales, colonialistes et impérialistes des puissances occidentales (Europe et Etats-Unis). Pour mener à bien ces politiques, l'Occident a eu très tôt besoin de communiquer avec les peuples avec lesquels il entrait en contact et aussi bien la communication écrite que l'apprentissage des langues de ces peuples nécessitaient l'élaboration de systèmes de transcription.

Les raisons techniques sont liées au fonctionnement de l'informatique : si le calcul informatique repose sur des suites de 0 et de 1, ces deux chiffres permettent l'encodage de signes correspondant au standard ASCII (l'alphabet latin, les chiffres et des signes particuliers), avec lequel peuvent être encodés à leur tour des centaines de milliers de caractères et de signes et dans lequel sont écrits les programmes informatiques.

voirASCII, ISO 8859, Unicode


Comment transcrire ?

Deux méthodes sont envisageables :

1. On part de la forme phonique de la langue-source et on établit un système de correspondances entre les phonèmes de la langue-source et les graphèmes de la langue d'accueil.

2. On part de la forme graphique de la langue-source et on établit un système de correspondances entre les graphèmes de la langue-source et les graphèmes de la langue d'accueil. Il s'agit alors d'une translittération.

Il est assez évident que le choix est d'abord conditionné par les systèmes d'écriture utilisés pour la langue-source et la langue-cible. La translittération ne peut valoir qu'entre langues à écritures alphabétiques.

Les systèmes de transcription ou de translittération peuvent se définir par rapport à deux finalités différentes.

1. On peut élaborer un système de transcription tel que l'output permette aux locuteurs d'une langue d'accueil donnée de prononcer les mots au mieux (c'est-à-dire au plus près de l'original ou... au moins mal). Un tel système doit impérativement tenir compte des conventions orthographiques de la langue d'accueil. Conséquence : pour une même langue-source, il y aura autant de systèmes différents que de langues d'accueil différentes. Un exemple : un même prénom russe s'écrit Youri en français – ce qui permet sans aucune connaissance du russe la prononciation [juri] – et Juri en allemand – ce qui permet une prononciation similaire.

2. On peut élaborer un système de transcription indépendant de la langue d'accueil, voire des spécificités des langues-sources utilisant la même écriture. Ce type de transcription est simplement un transcodage des signes d'une écriture à l'aide des signes d'une autre écriture. Dans le cas idéal, s'il y a biunivocité entre les deux écritures en jeu, on aboutit à une translittération réversible.

Ce second système a un avantage évident, qui découle directement de son indépendance par rapport aux langues : son unicité (un seul système de transcription pour un même type d'écriture). Ainsi, pour le cyrillique, on a, selon ce principe, un seul système de transcodage, que la langue-source soit le russe, l'ukrainien ou le serbe, que la langue d'accueil soit le français, l'anglais ou l'islandais. Par exemple, le prénom susmentionné s'écrit Ûri (selon la norme ISO de translittération) et le nom d'un ancien dirigeant soviétique s'écrit Hruŝëv (avec s + accent circonflexe) – et non Khrushtchev, Chruschtschow et Khrouchtchev, pour reprendre les orthographes usuelles du même mot respectivement en anglais, en allemand et en français. Et la graphie cyrillique d'origine pourra être restituée sans ambiguïté à partir de la graphie latine.

Mais ce système a, par rapport aux systèmes spécifiques à chaque langue, deux inconvénients :

1. Il ne donne pas toujours une idée même approximative de la prononciation. Comment un francophone qui ne connaît pas les conventions de translittération peut-il lire Ûri autrement que [yri] et Hruŝëv [avec s + accent circonflexe] autrement que [rysEv] ? Le même inconvénient vaut pour tous les systèmes de transcription indépendants de la langue d'accueil (comme le pinyin pour le chinois). Mais une transcription adaptée au système orthographique de la langue d'accueil ne permet elle-même qu'une prononciation très approximative.

2. Quand l'écriture-source compte plus de signes que l'écriture d'accueil – c'est le cas du rapport entre l'alphabet cyrillique (33 signes pour le seul russe) et l'alphabet latin (26 signes) –, on est obligé de recourir soit à des digrammes ou des trigrammes (ainsi, ce qui s'écrit selon la norme usuelle française <chtch> ou <schtsch> selon la norme usuelle allemande correspond à une seule lettre cyrillique), soit à des signes diacritiques non usuels – c'est-à-dire à la fois plus difficiles à saisir avec un clavier d'ordinateur et surtout dont la valeur phonique peut difficilement être devinée.

La situation se complique encore du fait de la multiplicité des standards de transcription qui ont été définis au fil des temps.


Principales normes de diffusion internationale

Outre les systèmes définis dans les pays des langues-source ou les pays des langues d'accueil, des systèmes de transcription ou translittération assez répandus sont définis par deux institutions internationales :

– l'International Organization for Standardization (ISO), domiciliée à Genève ; les normes définies par l'ISO sont disponibles sur son site moyennant finances (et elles ne sont pas données) ;

– l'United Nations Group of Experts on Geographical Names (UNGEGN), Working Group on Romanization Systems ; ses normes sont disponibles dans un document intitulé Technical reference manual for the standardization of geographical names :
http://unstats.un.org/unsd/geoinfo/ungegn/docs/ungegn-tech-ref-manual_M87_combined.pdf.

Deux autres normes ont une large diffusion du fait du poids dans le monde des autorités qui les ont formulées :

– les normes définies par l'American Library Association et la Library of Congress (ALA/LC) ; elles sont disponibles sur
http://www.loc.gov/catdir/cpso/roman.html ;

– les normes définies conjointement par le U.S. Board on Geographic Names et le Permanent Committee on Geographical Names for British Official Use (BGN/PCGN) ; elles sont disponibles sur
http://earth-info.nga.mil/gns/html/romanization.html.

Les normes internationales ou à diffusion internationale (comme ces deux dernières normes) diffèrent essentiellement sur deux points : l'utilisation plus ou moins grande des signes diacritiques et les possibilités de réversibilité.

Ecritures latines

A priori, pas de problème, puisque la langue à transcrire utilise la même écriture que la langue dans laquelle on transcrit. Ce serait le cas sans une multiplicité de signes diacritiques, qui ne sont pas nécessairement les mêmes dans les deux langues.

Un exemple : transcrire du vietnamien en français. En tenant compte de tous les diacritiques, il y a en vietnamien plus de deux fois plus de signes qu'en français. Comment faire ? On peut faire l'effort de respecter tous les signes diacritiques de la langue-source. C'est louable, mais difficile à réaliser parce que cela demande le recours à de nombreuses combinaisons de touches et aussi parce que si l'on ne connaît pas la langue-source, il est très difficile de respecter scrupuleusement des signes que l'on ne connaît pas et que l'on ne comprend pas. La seconde solution consiste à n'utiliser aucun des signes diacritiques de la langue-source.

voirEcritures du vietnamien

Autres écritures alphabétiques et écritures indiennes

Arab
Cyrl
Deva
Grek
Hebr
arabe
cyrillique
devanagari
grec
hébreu
ISO 233-2:1993
ISO 9:1995
ISO 15919:2001
ISO 843:1997
ISO 259-2:1994

voirEcriture cyrillique

Ecriture du chinois

voirPinyin

Ecriture du coréen (hangul)

voirEcritures du coréen

Il existe plusieurs normes pour la transcription du coréen en caractères latins – ou plus exactement pour sa translittération (à chaque signe du coréen correspond un signe de l'alphabet latin).

Le système le plus utilisé a été longtemps le système McCune-Reischauer (défini par George M. McCune et Edwin O. Reischauer en 1939). Un système légèrement modifié a été adopté par la Corée du Nord en 1996. Un autre système révisé a été mis au point par la Corée du Sud en 2000, il se caractérise par l'absence de diacritiques.

– Tableau établi par l'United Nations Group of Experts on Geographical Names (UNGEGN), Working Group on Romanization Systems, présentant les correspondances entre le système ISO/TR 11941:1996, les systèmes officiels de Corée du Nord et de Corée du Sud, le système McCune-Reischauer et le système de l'université de Yale :
http://www.eki.ee/wgrs/rom2_ko.htm (une version pdf est également disponible).

– Présentation du système révisé (Revised Romanization of Korean) adopté par la Corée du Sud, sur le site du Centre culturel coréen, dépendant de l'ambassade de la république de Corée en France :
http://www.coree-culture.org/popup/newkorean2.html.

Ecriture du japonais (katakana, hiragana)

Malgré l'existence d'une norme ISO (ISO 3602:1989), deux systèmes de transcription sont actuellement utilisés : le système Kunrei défini en 1954 par les autorités japonaises (et sur lequel s'appuie la norme ISO) et, surtout, le système Hepburn modifié, défini initialement par James Curtis Hepburn en 1867 et le plus utilisé au moins à l'extérieur du Japon.

voirEcritures du japonais

– Des tableaux de correspondance figurent entre autres sur un site de l'Unesco :
http://portal.unesco.org/culture/fr/ev.php-URL_ID=32315&URL_DO=DO_TOPIC&URL_SECTION=201.html.


© Jacques Poitou 2017.