Le traitement de texte

Écrire

Écrire est une démarche complexe qui nécessite de se poser la question du format et des outils. Écrire, rédiger, c’est bien évidemment respecter un certain nombre de règles syntaxiques, orthographiques, lexicales mais c’est aussi organiser et structurer ses idées, prendre le temps qu’il faut et l’organiser.

Sauf exceptions, l’écriture est maintenant numérique et suppose des compétences nouvelles (Fauchié, 2020; Ruiz, 2020). Il est important, à ce stade, de se poser la question du choix des outils.

Traditionnellement et à cause du monopole de son éditeur, c’est le logiciel Word qui est majoritairement utilisé pour la rédaction de textes.

Word est techniquement orienté vers le formatage et la mise en page de textes. Alors que les journalistes, les enseignants et même les poètes ne se soucient pas des polices de caractères, des guillemets et des marges. Ils ont été contraints de l’utiliser non pas parce que c’est la meilleure application pour écrire mais parce que les universités, les rédacteurs en chef, les éditeurs proposent et attendent le format .docx. Pour l’essentiel, les allers-retours entre les auteurs et les éditeurs se font toujours par le biais de la fonction « Suivi des modifications » de Word (Reichenstein, 2025).

Du côté des traitements de texte, il y a aussi la suite bureautique LibreOffice[1], une alternative libre. Cette suite propose des outils comparables, fonctionnant sur toutes les plateformes (Windows, Mac ou Linux).

On peut aussi faire le choix du travail en ligne et utiliser, par exemple, Google docs, traitement de texte relativement complet.

Les traitements de texte sont cependant des programmes complexes avec de multiples fonctions dont certaines sont mal, rarement, voire jamais utilisées.

À l’origine, le traitement de texte avait pour objectif de remplacer la machine à écrire afin de produire des pages imprimées. Les traitements de texte comme WordStar ou WordPerfect permettaient d’accéder au code et de contrôler la mise en page.

L’orientation WYSIWYG (What You See Is What You Get, autrement dit, ce que vous voyez à l’écran est ce que vous aurez comme résultat imprimé) est gourmande en ressources informatiques et souvent source de lenteur. Elle donne un sentiment d’autonomie alors que le système est totalement opaque et que l’accès au code a progressivement disparu (Vitali-Rosati, 2024b). Il est dès lors souvent ardu de comprendre et modifier certaines options de mise en page imposées par le logiciel. De plus, les documents qu’ils produisent maintenant sont lourds et ne sont plus adaptés aux consultations les plus courantes, à l’écran (Dehut, 2018).

Par ailleurs, le traitement de texte n’est pas un outil sémantique, “la qualification des différents types de texte n’est pas mise en avant, comme les niveaux de titre (titre principal, sous-titres, etc.).

C’est le rendu graphique de ces éléments qui prime” (Fauchié, 2018). Pour le traitement de texte, la dimension de l’architecture du texte d’un document, sauf à utiliser correctement les “styles” proposés par ces outils, est accessoire. C’est ce que l’on voit qui compte (Titre en gras, en italique, dans une taille de caractère plus grande…).

Il n’est pas possible d’imaginer que la “numérisation” de l’écriture pour rédiger un courrier, écrire un texte ou préparer un diaporama ne transforme pas profondément les pratiques d’écriture (Crouzet, 2016).

Logiciels propriétaires

Le format propriétaire des traitements de texte (comme Word de Microsoft ou Page de Apple), basé sur la stratégie du profit[2], est aussi un problème.

Nous n’avons aucune garantie de pouvoir ouvrir un document sans la licence d’utilisation ou avec une version plus récente (tout particulièrement pour Word, même avec le nouveau format docx qui donne théoriquement la possibilité d’ouvrir les fichiers xml qui constituent le document).

Plus spécifiquement pour Microsoft, en lisant attentivement les conditions générales (Microsoft Privacy Statement), on découvre que :

  • les clés de chiffrement (BitLocker) sont envoyées à Microsoft ;
  • un document docx/pptx ouvert envoie son contenu aux serveurs Microsoft ;
  • avec le nouvel Outook, Microsoft a tous vos mails et tous vos mots de passe ;
  • Edge envoie les URLs visitées à Microsoft ;
  • OneDrive récupère par défaut tous vos fichiers ;
  • Recall (Windows 11) enregistre l’écran (plusieurs fois par minute) pour alimenter l’IA de Microsoft.

Microsoft propose un écosystème très complet (Word, Outlook, Teams, PowerPoint, OneDrive…) qui explique en partie sont succès mais aussi les difficultés à s’en passer. Vitali-Rosati (2024b) parle de “La glu Microsoft” !

Google propose aussi un écosystème bureautique complet et gratuit[3]. Disponible via Google Drive, avec un logiciel de traitement de texte (Docs), un tableur (Sheets), un logiciel de présentation (Slides) et un tableur (Forms), cet ensemble permet de travailler à plusieurs sur un même document. Le document est enregistré en ligne et est accessible à partir de n’importe quel ordinateur équipé d’un navigateur Web.

Néanmoins, Google Docs (le traitement de texte) intègre Markdown dans ses formats, ce qui suppose une tentative de réappropriation de Markdown par les grandes entreprises du numérique. Dans le même registre, Microsoft est, depuis 2018, propriétaire de Github[4], l’outil utilisé par la majorité des développeurs de logiciel et qui utilise Markdown pour tous ses fichiers texte.

Écriture numérique

L’écriture numérique doit être structurée, elle doit à la fois organiser la pensée et permettre d’exprimer cette organisation. Elle doit aussi respecter les standards ouverts pour la diffusion et le partage de cette écriture.

Le principe de base est de séparer l’écriture et la mise en forme pour ensuite exporter son texte dans n’importe quel format, pouvoir l’éditer avec n’importe quel outil et sur n’importe quelle plateforme (Windows, OSX, Linux…), avec une garantie de pérennité.

Avec les nouveaux modes de consultation (à l’écran), le travail doit reposer sur les principes de l’édition numérique (voir plus haut) pour produire des documents numériques. Le balisage graphique (pseudo-structuration esthétique) produit par un traitement de texte ne convient donc pas pour la production de textes numériques structurés. Ces formats nécessitent une structure (sémantique) stricte pour un résultat de qualité.

Ces documents numériques doivent aussi contenir la description du document. On parle de métadonnées. La structure de ces métadonnées fait l’objet de normes et permet le partage d’informations entre les outils et l’alimentation automatique des bases de données.

Il faut revenir aux fondamentaux et donc ne pas nécessairement essayer de reproduire coûte que coûte tout ce qui est possible avec un traitement de texte classique (dont on peut souvent se passer).

En proposant une issue simple, en termes d’usage, à l’écriture numérique, les traitements de texte et les modes WYSIWYG masquent d’autres solutions possibles pour l’écriture numérique, des solutions intégrant une véritable structuration sémantique visible par l’utilisateur (Fauchié, 2018).


  1. Attention à ne plus utiliser OpenOffice qui n’est plus mis à jour depuis 2015.
  2. Voir : https://ploum.net/lhistoire-du-logiciel-entre-collaboration-et-confiscation-des-libertes/
  3. L'adage habituel est "si c'est gratuit, c'est toi le produit", il faut néanmoins le nuancer et plutôt dire : "c'est toi qui produis" voir : https://www.librealire.org/si-c-est-gratuit-c-est-toi-qui-produis
  4. https://fr.wikipedia.org/wiki/GitHub

Licence

Symbole de Licence Creative Commons Attribution 4.0 International

L’écriture académique au format texte avec Markdown et Pandoc Droit d'auteur © par Bernard Pochet est sous licence Licence Creative Commons Attribution 4.0 International, sauf indication contraire.

Partagez ce livre