Jacques Poitou
Accueil
Plan du site
Langages | Ecritures | Ecritures latines | Ecriture chinoise | Numérique | Cryptographie | Typographie | Reproduction et transmission | Censure | Lexique | Jeux
Généralités | Signe | Code | Transcription phonétique | Types de textes | Morphème | Flexion | Sens et référence | Sémantique lexicale | Relations sémantiques | Catégorisation | Typologie

Transcription de l'oral


Alphabet phonétique international

L'alphabet phonétique international (API, IPA en anglais – International Phonetic Alphabet) est né dans le cadre de la didactique des langues étrangères : il a été créé en 1886 par une association de professeurs de langues (Association Phonétique internationale). Régulièrement révisé, sa dernière mouture date de 2005. L'objectif est clair : transcrire dans un même code de signes la prononciation de langues diverses (et de plus en plus diverses au fur et à mesure de l'élargissement des recherches et des connaissances).

voirForme phonique

Il comprend des signes pour la représentation des voyelles et des consonnes, des tons, des accents et des ruptures mélodiques et un ensemble de signes diacritiques nécessaires pour la représentation de certaines particularités des sons (aspiration, arrondissement, valeur syllabique, etc.).

– Voir la liste des signes de l'API sur le site de l'International Phonetic Association (IPA) :
http://www.langsci.ucl.ac.uk/ipa/IPA_chart_(C)2005.pdf.

– Ecouter la prononciation des sons (consonnes et voyelles) représentés dans l'API sur le site de l'université de Victoria (Canada) :
http://web.uvic.ca/ling/resources/phonlab/ipatut/.

Vu les évolutions qu'a connues cet alphabet, on trouve souvent pour un même mot des transcriptions différentes dans des ouvrages différents. A ceci s'ajoute le fait qu'en fonction de leurs besoins spécifiques, les transcripteurs ne recourent pas toujours à tous les détails du système de transcription – assez complexe parce que précis. Il y a aussi des usages conventionnels. Ainsi, le <r> du français (<roule>) ou de l'anglais (<rule>) est souvent transcrit [r], alors qu'il correspond dans les deux langues à des sons très différents (rien qu'en français, il peut donner lieu à des réalisations très différentes)... mais leur transcription nécessite des caractères spéciaux... et est aussi, de ce fait, moins immédiatement lisible. – Ecrire avec l'alphabet phonétique n'est jamais une fin en soi, mais un moyen pour indiquer les faits phoniques pertinents (souvent dans le cas de discordances avec la représentation graphique standard).


Utilisation de l'alphabet phonétique sur ordinateur

Documents destinés à l'impression, y compris en PDF

On peut utiliser n'importe quelle police phonétique.

Le principe des polices anciennes est simple : les codes correspondant à des lettres ou signes inutiles dans l'écriture phonétique sont affectés à des signes phonétiques spéciaux. Par exemple, aux codes des lettres capitales I U Y correspondent, dans certaines polices, les signes des voyelles écrites en API avec des petites capitales.

Documents destinés à la diffusion sous forme numérique

Si l'on diffuse un document de type "texte" réalisé avec une police phonétique quelconque, le résultat peut être une petite catastrophe, car dans des polices phonétiques anciennes, les mêmes codes ne sont pas attribués aux mêmes signes.

Juste un exemple : comment obtenir le signe phonétique correspondant au Schwa (Unicode 0103, correspondant à <e> dans <venu>, p. ex.) ? J'essaie quatre polices différentes. Il faut taper  :
– "@" avec la première,
– MAJ + ALT + "&" puis espace avec la seconde et la troisième,
– MAJ + ALT + ":" avec la quatrième.
A la lecture, le résultat dépendra de la police utilisée.

Si quelqu'un reçoit par mail, en document attaché, un texte contenant des signes phonétiques, il ne pourra le lire que s'il dispose sur son ordinateur de la même police que l'auteur, Le même problème existe, décuplé, pour des textes installés sur Internet, vu la diversité du public.

Il existe trois solutions à ce problème.

Signes phonétiques transformés en images

La première solution consiste à transformer le texte contenant des signes phonétiques en image, avec tous les inconvénients que cela peut avoir (le texte n'étant qu'une image, il n'est pas possible de le traiter), ou de transformer le texte en document PDF (avec police incorporée).

SAMPA

La deuxième solution consiste en un codage des signes phonétiques en caractères ASCII : c'est le système SAMPA (Speech Assessment Methods Phonetic Alphabet), conçu à la fin des années quatre-vingt pour les principales langues de la Communauté européenne dans ses frontières d'alors (anglais, français, allemand, néerlandais, etc.) et étendu à d'autres langues ensuite.

Ainsi, pour le français :

– signes identiques à ceux de l'API : a b d e f g h i j k l m n o p r s t u v x y z
– majuscules : E (tête), O (porte), A (pâte), S (chat), Z (jeu), J (oignon), N (camping), H (linguiste),
– chiffres : 2 (deux), 9 (neuf),
– signe + tilde : E~ (brin), 9~ (brun), O~ (on), A~ (an)
– @ (chemin)

[s@.sis.tEm.a.la.va~.taZ.dE.tr@.sE~pl.e.li.zibl.par.tu.lE.zOr.di.na.t9r;ME;Ma~~sjE]

Pour l'allemand :

– signes identiques à ceux de l'API : a b d e f g h i j k l m n o p r s t u v x y z
– majuscules : E (Kette), O (doch), A (lahm – prononcé plus souvent [la:m]), I (ist), Y (Hütte), U (und) S (Schein), Z (Ingenieur), C (ich), N (singen)
– chiffres : 2 (Höhle), 9 (Hölle), 6 (Lehrer)
– @ (bitte), ? (coup de glotte)

[IC.vaIs.nICt.vas.zOl.?es.b@.dOY.t@n.das.?IC.zo.traU.rIC.bIn]

Pour l'anglais :

– signes identiques à ceux de l'API : a b d e f g h i j k l m n o p r s t u v z
– majuscules : I (tick), E (pet), V (cut), U (put), O (cause), Q (pot) A (cars), D (there), T (thick), S (shoe), Z (pleasure),tS (child), dZ (juce), N (sing)
– chiffre : 3 (furs)
– { (cat), @ (pleasure)

– Pour plus de précisions et pour la transcription d'autres langues, voir sur le site du département de linguistique et de phonétique de l'University College London :
http://www.phon.ucl.ac.uk/home/sampa/home.htm.

Unicode

voirPrincipes d'Unicode

La troisième solution est le standard Unicode, développé comme système unique de codage pour transcrire les différentes langues du monde. Voir à ce sujet, sur ce site, la page Traitement des écritures sur ordinateur.

Les signes phonétiques spécifiques sont contenus dans plusieurs blocs, dont le principal est "IPA Extensions" (codes 0250 à 02AF). Indispensables aussi : les signes diacritiques (codes 0300-036F).

– Les blocs correspondants peuvent être téléchargés sur le site d'Unicode à partir de :
http://www.unicode.org/charts/.

– La page http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm fournit aussi une liste des signes phonétiques avec leurs codes décimal et hexadécimal.

Le fait qu'il s'agisse d'un standard unique pour tous les signes des écritures connues a un avantage décisif : pour un code donné, on obtient le même signe quelle que soit la police utilisée. Mais il faut disposer d'une police Unicode qui comprenne les caractères requis. Il en existe plusieurs en téléchargement libre et gratuit. La plus complète semble être Doulos SIL

http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&item_id=DoulosSIL_download#FontsDownload

N.B. Comme les logiciels et les standards Unicode, les polices évoluent. Il est prudent de vérifier que l'on dispose des dernières versions.

Pour saisir les caractères phonétiques non disponibles à partir du clavier standard, on peut soit recourir à une palette de caractères, soit saisir le code de chaque caractère – à condition de le connaître ! Ces deux solutions ne sont pas vraiment rapides. La plus rapide est d'utiliser une configuration de clavier spécifique (keyboard layout), ce qui implique de la créer, de la configurer à son goût, de l'installer et de la sélectionner. Une fois cela fait, la saisie des caractères phonétiques est aisée.


Transcription de l'oral spontané

La transcription de l'oral spontané autrement que par l'écriture (avec les transformations que cela implique) répond exclusivement à des objectifs d'analyse scientifique. Aussi est-elle conditionnée par les objectifs spécifiques que le chercheur se fixe. D'où différents systèmes de transcription et une attention variable portée aux différents aspects spécifiques de l'oral.

voirCaractéristiques de l'oral

En ce qui concerne les réalisations segmentales elles-mêmes, le transcripteur a le choix entre une transcription en API et en orthographe standard. La première peut être plus précise, mais a) elle peut dans certains cas être difficile à établir (difficulté, p. ex., de trancher entre [e] et [E] pour certaines réalisations (C'est difficile), b) elle est plus longue à écrire et à lire que la seconde et surtout c) elle n'est pas nécessairement utile en fonction des objectifs de l'analyse linguistique. Une transcription orthographique pose aussi quelques problèmes et doit parfois être précisée (segments non réalisés p.ex. "I(l) faut pas êt(re) difficile.")

En revanche, d'autres phénomènes non transcrits dans l'écrit standard peuvent (et souvent doivent) être l'objet d'un marquage spécifique :

– les séquences incompréhensibles ;
– les hésitations, les reprises, les corrections (un logiciel qui soit plus [plys] plus [plys] plus [ply] convivial) ;
– la prosodie (qui peut être marquée avec les signes de l'API, mais nécessite parfois plus de précision) – accentuation et intonation ;
– la longueur des pauses, très variable ;
– dans les dialogues, les chevauchements.

Les conventions de transcription n'ont pas encore été l'objet d'une standardisation comme l'a été la réalisation phonétique.


© Jacques Poitou 2017.