Module 1 - La diffusion des travaux de recherche
à l'heure de l'information numérique

 

1.1. Ecrire à l’heure de l’information numérique

C’est avec l’apparition de la microinformatique qu’apparaissent les applications liées à la bureautique et notamment le traitement de texte.

Actuellement, la plupart des documents de recherche sont électroniques : ils sont rédigés à l’aide de logiciels de traitement de texte, donc directement en format numérique.

Le traitement de texte, définition :

Ensemble des techniques informatiques permettant la saisie, la mémorisation, la correction, l’actualisation, la mise en forme et la diffusion d’un texte quelconque. Le traitement de texte permet également un niveau sophistiqué du document : vérification automatique de l’orthographe, coupure automatique des phrases et de mots, mise en page, génération automatique des tables des matières.

Schéma - Ecrire à l’heure de l’information numérique

En résumé un logiciel de traitement de texte permet de :

 

L'enrichissement par le multimédia

D’autre part, l’apparition des réseaux de communication électronique et des outils de traitement en mode multimédia et interactif, permet un enrichissement considérable de ces travaux de recherche : possibilité d’y joindre des fichiers images, des fichiers son, en 3 dimensions, d’insérer des éléments de marquage qui permettent d’établir des liens vers d’autres sources d’information, des balises de structuration du document lui-même.

Schéma - enrichissement par le multimédia

 

 

1.2. Les limites et les contradictions des traitements de texte propriétaires

Il faut bien comprendre que les logiciels de traitement de texte ont chacun leur mode de fonctionnement propre en terme de format informatique. Ils sont codés sur 8 bits et 256 caractères ce qui permet à chaque éditeur de logiciels (Word, Wordperfect, StarOffice), d’intégrer ses propres spécificités : caractères latins, en gras, etc...

Résultat

Chaque type de logiciel de traitement de texte a ses règles, ses capacités propres et ses impossibilités à être transposable directement dans le format concurrent de Word à Works, de Word à Wordperfect, ou même dans des versions différentes à l’intérieur d’un même produit comme c’est le cas chez Microsoft.

Schéma : Non-interopérabilité -> Captation

De cet état de choses découlent deux conséquences importantes :

 

Le cas du document de recherche

Les outils de traitement de texte modifient la nature et l’usage que l’on peut faire d’un document rédigé sous forme électronique. Un document électronique de type universitaire a vocation à être utilisé, en lecture, sans limite de temps : il doit pouvoir être relu dans cinquante ans, quel que soit le support matériel ou logiciel.

Schéma - Document de recherche = document évolutif

Actuellement, les caractéristiques des logiciels de traitement de texte "propriétaires" ne le permettent pas. Il est donc important et nécessaire de trouver une réponse technique satisfaisante à ce problème : il faut pouvoir proposer des outils logiciels qui permettent d’assurer la pérennité de consultation et de traitement d’un document électronique que ce soit par son auteur (lecture et traitement) ou par le lecteur, en conservant tout ce qui en fait son originalité, en matière de présentation typographique par exemple.

 

1.3. De l'utilité des normes

Il faut comprendre que la "construction" d’un tel document doit obéir à des règles, mais pas n’importe lesquelles. Des règles qui soient reconnues par tous les types de matériel, de logiciel de visualisation, en un mot des normes de codage. Ces normes doivent être ouvertes, c’est à dire reconnues et transposables par tous et partout, et dépassent les systèmes d'exploitation, les applications associées (traitement de texte, tableur, visualiseur HTML) et les formats propres à chaque application.

La norme doit être considérée par l’utilisateur comme une facilité qui permet d’utiliser un langage universel et non pas comme une contrainte.

Quelle est la différence ?

Nous avons tous été confrontés à des résultats aberrants après des transferts de fichiers d'un système à un autre.

Pourquoi ? Parce que les caractères ont été mal transcrits en utilisant un codage qui ne correspondait pas à une norme. Ces normes de codage de caractères existent : ce sont les caractères ASCII 7 ou 8 bits.

L’ASCII est une table de codification des caractères alphanumériques. Le format 7 bits correspond à la première version et s’applique à l’alphabet anglophone non accentué. Le codage en 8 bits avec des tables de 256 caractères permet de coder les accents et les caractères diacritiques. D’autres normes comme ISO Latin 8859 permettent de retranscrire les caractères européens non cyrilliques. Une nouvelle norme ISO10646 ou Unicode prévoit un codage universel de tous les alphabets en 16 ou 32 bits.

Schéma : Transcriptions hasardeuses

Les exemples de translation de document d’un support sur un autre et qui comporte des aberrations de caractères ou de formats sont nombreux. Ils justifient que dans le monde académique, monde ouvert d’échange et de confrontation des idées, les auteurs utilisent le plus possible des applications (traitement de texte, tableurs, visualiseurs) qui respectent les normes définies et adoptées par la communauté.

Les normes, leurs avantages et les conséquences