Jacques Poitou
Accueil
Plan du site
Langages | Ecritures | Ecritures latines | Ecriture chinoise | Numérique | Cryptographie | Typographie | Reproduction et transmission | Censure | Lexique | Jeux
Réseau | Partage et diffusion | Plagiat | ASCII, Unicode | Traitement de texte | Traitement de la voix | Types de textes numériques

Numérique, multimédia, hypertexte


Généralités

Un texte numérique est un texte produit par un locuteur, encodé par une machine en suite de 0 et de 1, transmissible par différents moyens sous cette forme, stockable également sous cette forme sur différents supports et lu par l'interlocuteur après décodage à l'aide d'une machine.

Les textes numériques ne sont ni productibles ni lisibles sans une machine, qui constitue une sorte de prothèse obligatoire de l'auteur et du lecteur. C'est là une différence avec l'oral, mais aussi avec l'écrit : si la production de l'écrit nécessite lui aussi l'utilisation d'un instrument et d'un support, il est lisible sans aucun instrument particulier. Conséquence : la production et la lecture du numérique sont conditionnées par l'utilisation la machine. Et celle-ci est plus complexe, plus lourde (donc moins facilement transportable et utilisable) et plus coûteuse que les instruments nécessaires pour la production de l'écrit. De plus, elle rend l'utilisateur (auteur ou lecteur) dépendant.

Ces trois caractéristiques – coût, lourdeur et complexité – constituent autant de freins, voire d'obstacles, au développement du numérique

Le coût d'abord, avec ce que l'on appelle la "fracture numérique" entre riches et pauvres, fracture qui tend à s'accroître par un effet de polarisation : au niveau mondial, le contraste est frappant entre le monde occidental (bien équipé), l'Extrême Orient (en plein essor) et l'Afrique (peu équipée).

La lourdeur fait que les équipements (au moins les ordinateurs de bureau) peuvent difficilement être transportés. Pour les utiliser, il faut aller là où ils sont : on ne les a pas partout à portée de main comme on peut avoir un crayon ou un stylo.

Les évolutions technologiques rendent les machines de plus en plus propices à une utilisation nomade et les rapprochent ainsi, de ce point de vue, des conditions de la production de l'écrit :
miniaturisation et diversification des équipements (ordinateurs de bureau, ordinateurs portables, assistants personnels, téléphones mobiles, livre électronique, etc.) ;
autonomie croissante des batteries des ordinateurs portables (jusqu'à huit heures) ;
– développement des systèmes de communication sans fil : Bluetooth pour la connexion des périphériques à l'ordinateur, wifi pour la connexion au réseau sur de petites distances, wimax pour des connexions à 70 Mbs dans un rayon de 50 kilomètres et connexion par satellite.

Enfin, la complexité peut susciter de multiples appréhensions de la part des utilisateurs : il faut apprendre à s'en servir, on ne sait pas bien ce qui se passe à l'intérieur de la machine et on peut craindre d'être désemparé face à une éventuelle panne (plantage, bogue, etc.)

Le numérique permet l'enregistrement, le stockage et la transmission de plusieurs types sémiotiques : le texte, l'image fixe ou animée, le son. Mis à part le prix de la machine elle-même et des logiciels nécessaires, le coût du stockage et de la transmission est minime.


Acquisition et restitution du texte

L'acquisition du texte destiné à être encodé par la machine se fait le plus souvent à l'aide du clavier. Mais deux autres sources sont possibles :

– un fichier contenant l'image du texte écrit, qui est numérisé et d'où le texte est extrait à l'aide d'un logiciel de reconnaissance des caractères (OCR) ;
– un fichier son contenant le texte oral, qui est numérisé et d'où le texte est extrait à l'aide d'un logiciel de reconnaissance vocale.

A l'heure actuelle, cependant, les procédés d'extraction du texte ne sont pas encore parfaitement fiables ; ils nécessitent un contrôle, qui peut être automatique ou manuel. Ils sont plus performants pour les textes imprimés que pour la voix, plus performants aussi pour la voix que pour l'écriture manuscrite.

Ainsi, pour la numérisation du dictionnaire allemand de Grimm (33 volumes), réalisée sous l'égide de l'université de Trèves, la saisie au clavier de l'intégralité du texte a été préférée au scanner. L'opération a été réalisée en Chine, en double, par des employés ne connaissant pas l'allemand. La confrontation entre les deux versions a permis de faire apparaître des erreurs qu'il était ensuite possible de corriger manuellement par confrontation avec l'original papier.

La production du texte une fois décodé est un texte écrit. Mais, de façon exactement inverse de l'acquisition, il peut être transformé :

– en un fichier image ; l'intérêt est d'imposer la conservation des attributs typographiques (polices spéciales, etc.), mais dans ce cas, le texte lui-même disparaît. Les fichiers pdf sont des fichiers images dans lesquels le texte est conservé comme tel (et donc aussi copiable) ;
– en un fichier son, à l'aide d'un programme de synthèse vocale.

voirReconnaissance et synthèse vocales

Voici les grandes lignes de ces processus :

num


Multimédia

Jusqu'au début du XIXe siècle, les moyens de reproduction de documents étaient limités : outre la copie manuelle d'un texte ou d'une image fixe, seule l'imprimerie permettait la reproduction, et donc la diffusion, de textes et d'images fixes dessinées à la main.

voirEstampage
voirXylographie
voirInvention de l'imprimerie en Chine
voirTechniques d'impression de Gutenberg

Le XIXe siècle a été marqué par trois inventions importantes :

– la photographie, qui permet la production d'images par des procédés optiques et chimiques, et donc aussi leur reproduction et leur diffusion ;
– la possibilité d'enregistrer le son, de le sauvegarder et de le reproduire – qu'il s'agisse de la parole ou de tout autre type de son (musique, chant, etc.) ;

voirSauvegarde et transport de l'oral

– le cinéma, avec la possibilité de produire et d'enregistrer des séquences d'images animées, qui ont été ensuite synchronisées avec le son.

Alors que jusqu'au XIXe siècle, seul le texte était facile à reproduire et donc à diffuser grâce à l'imprimerie (d'où l'importance de la littérature parmi les formes de culture), les inventions du XIXe siècle, leur amélioration et leur diffusion au XXe siècle modifient la donne. L'acquisition du matériel nécessaire (de moins en moins onéreux) permet à chacun de produire des images, des films, des enregistrements sonores. Mais chacun de ces documents nécessite des supports différents : papier standard pour le texte et une partie des images, papier spécial pour une partie des images, films et différents supports pour le son (cylindre, disque, bande, K7, etc.).

Tout change avec la révolution numérique. Le numérique permet en effet l'enregistrement et le stockage de ces données de types différents sur un même support, et donc leur combinaison les uns avec les autres. Un document multimédia est un document incluant et combinant des media différents (texte, image, son). Ces données de type différents peuvent aussi être restituées avec une seule et même machine, grâce à l'écran et aux haut-parleurs. Ils peuvent être pareillement transmis par le réseau.

La seule différence subsistant entre fichiers texte, image (y compris vidéo) et son est liée à leur taille respective : le traitement des fichiers vidéo et son (les plus volumineux) nécessite des processeurs plus puissants et leur transfert par le réseau nécessite des connexions plus rapides. Mais cette différence ne peut que s'atténuer avec à la fois le perfectionnement des procédés de compression (MP3 pour le son, MPEG4 pour la vidéo), la puissance croissante des ordinateurs et le développement des connexions rapides (ADSL, câble, réseaux).

voirRéseau


Hypertexte

Un hypertexte est un ensemble de textes reliés par des liens.

Structure de l'hypertexte

La structure de l'hypertexte peuvent être de différents types :

linéaire : du texte A, un lien pointe vers le texte B, qui pointe vers le texte C, etc. ;
arborescente (hiérarchique) : du texte A, des liens pointent vers les textes B et C, du texte B partent des liens vers les textes D et E, du texte C partent des liens vers les textes F et G, etc. ;
– en "toile d'araignée" : les textes de l'hypertexte ou des segments du même texte ou de textes différents sont reliés par des liens hors de toute structure linéaire ou hiérarchique.

Les liens peuvent être internes à un même document (d'un endroit à un autre), interne à un même site (donc externes par rapport à un même document et internes par rapport à un même serveur) ou pointer vers tout autre fichier situé ailleurs sur le réseau. La distance physique entre les serveurs sur lesquels sont stockés les fichiers ne constitue pas un inconvénient vu la rapidité, c'est-à-dire la quasi-instantanéité, des connexions : ainsi, accéder à partir de cette page à une autre page du même site (qui se trouve physiquement sur le même serveur) ne demande guère moins de temps que d'accéder à une page qui serait installée quelque part au Japon ou en Californie.

Les liens d'un hypertexte sont tous unidirectionnels (de A vers B). Mais des liens inverses peuvent être créés (de B vers A).

Tout lien se compose d'un appel de lien et de la cible du lien. L'appel de lien peut être une portion de texte, une image ou une portion d'une image (zone cliquable) sur laquelle l'internaute doit cliquer pour atteindre la cible du lien. L'appel de lien peut être ou non marqué spécialement dans le texte (couleur différente, soulignement, changement de forme d'une image au passage de la souris, etc.). La cible du lien peut être soit un autre endroit dans la même page, soit un document extérieur à la page (texte, image, son, vidéo). Ce document peut s'ouvrir dans la même fenêtre que celle où se trouve la page, soit dans une autre fenêtre qui s'ouvre en se superposant à la première.

Des documents nouveaux peuvent également s'ouvrir sans que l'internaute ait à cliquer sur un appel de lien : des liens peuvent être activés soit à l'ouverture ou à la fermeture d'une fenêtre déterminée, soit au bout d'un certain laps de temps, soit en fonction des mouvements de la souris. Procédé abondamment utilisé par la publicité (fenêtres pop-up ou pop-under), que l'internaute peut désactiver grâce aux fonctions avancées des navigateurs.

Le principe des liens fait que l'hypertexte peut être infini. Il n'est limité que par les limites des connexions possibles. Des documents réunis sur un CD-ROM constituent un ensemble fini, sauf si des liens externes pointent vers des documents installés sur d'autres supports et que la connexion avec ces supports est possible. L'ensemble des documents stockés sur des supports différents interreliés par le réseau constitue un seul hypertexte, hétéroclite. De ce point de vue, Internet est (tendanciellement) un gigantesque hypertexte produit par une multitude d'auteurs.

Les liens d'un hypertexte dépendent de l'organisation des fichiers sur le (ou les) serveur(s) sur le(s)quel(s) ils sont installés. Sur un serveur, les fichiers sont installés dans des dossiers, les dossiers peuvent être éventuellement installés eux-mêmes dans d'autres dossiers. L'emplacement des fichiers sur les serveurs est indiqué par l'URL de la page web concernée.

Ainsi, l'adresse de cette page "http://j.poitou.free.fr/pro/html/num/num-intro.html" signifie que le fichier nommé "num-intro" (de type "html") est installé dans un dossier intitulé "num", lui-même installé dans un dossier "html", lui-même dans un dossier "pro", installé sur un serveur dans un dossier intitulé "j.poitou.free.fr".

Les liens d'un hypertexte conditionnent la façon dont les internautes peuvent naviguer dans l'hypertexte.

Réception de l'hypertexte

Cette multistructuration possible du texte implique une délinéarisation du texte et de sa lecture. Alors qu'un texte traditionnel (p. ex. un texte littéraire) est conçu pour avoir une seule lecture linéaire, l'hypertexte n'impose pas un type de lecture particulier. C'est le lecteur qui choisit lui-même le chemin qu'il veut suivre. Deux lecteurs ne lisent donc pas le même hypertexte (même si les parties constitutives consultables en sont les mêmes pour tous). Le lecteur construit son texte à partir des éléments qui lui sont fournis. Il décide où il commence, où il va et où il s'arrête. Un même lecteur peut ne pas lire deux fois le même hypertexte en fonction des liens qu'il suit. Chaque hypertexte construit par un lecteur n'est qu'une construction momentanée et éphémère. Et elle est d'autant plus éphémère que les conditions de production des textes sur Internet (les pages web) permettent de les modifier rapidement.

La conséquence en est que le rôle du producteur change : il ne produit pas le texte qui sera lu par tous ses lecteurs, mais seulement les ingrédients à partir desquels chaque lecteur construit son propre hypertexte. Le lecteur devient d'une certaine façon co-auteur. Il doit être actif, car c'est à lui de choisir la façon dont il va avancer dans sa lecture. La responsabilité de ce que lit le lecteur est partagée : l'auteur propose et le lecteur dispose, il choisit parmi les possibilités que lui offre l'auteur.

La lecture d'un hypertexte a un caractère magique. Le lecteur chemine au travers de l'hypertexte en cliquant simplement sur un lien (soit un segment de texte, soit une icône), c'est-à-dire sans autre effort qu'un léger mouvement de l'index, et il se trouve ainsi transporté en un rien de temps d'un texte à l'autre. Mais peut-être ce caractère magique est-il lié aussi à la nouveauté de l'instrument. Après tout, appuyer sur un bouton encastré dans un mur et voir aussitôt la lumière s'allumer dans la pièce est tout aussi magique, mais quel adulte s'en émeut aujourd'hui dans nos pays ?


Stockage et transmission du numérique

Depuis l'apparition des logiciels de traitement de texte, le texte numérique peut être stocké sur des disquettes, des disques durs, des CD (les CD Audio existent à partir de 1982, les CD-ROM à partir de 1985), des DVD, etc.

Le texte numérique peut être transmis en un temps-record par le réseau.


Références bibliographiques

Christin, Anne-Marie (ed.), 2001. Histoire de l'écriture du pictogramme au multimédia. Paris : Flammarion.

Guédon, Jean-Claude, 2000. La force de l'intelligence distribuée. La Recherche 2000, 328 : 16-22.

La Recherche 328 (2000). Numéro consacré à Internet.

Leslé, François & Macarez, Nicolas, 1999. Le multimédia. 2e édition. Paris : PUF. Que sais-je ? 3390.

Mercier, Alain (ed.), 2002. Les trois révolutions du livre. Catalogue de l'exposition du musée des Arts et Métiers. Paris : Imprimerie nationale.

Vandendorge, Christian, 1999. Du papyrus à l'hypertexte. Essai sur les mutations du texte et de la lecture. Paris : La découverte.


© Jacques Poitou 2017.