Habiter les formats d'écriture: ce que pensent docx, TEI et ekdosis

ekdosis, TEI, Word, docx, formats, Luca Paltrinieri, Franco Farinelli, Robert Alessi, Margot Mellet, Melissa Terras, Julianne Nyhan

Je publie ici des notes en vue de mon intervention au colloque Gouverner le numérique dans un monde en transition, organisé par Luca Paltrinieri à Rennes, le 24 mai 2023.

Espace et lieux #

Dans la suite d’une discussion avec Luca Paltrinieri qui dure depuis quelques années (cf. en particulier sa conférence au CRIHN le 25 avril 2023), je voudrais m’interroger sur l’habitabilité du numérique, ou plutôt “des numériques”. J’ai beaucoup insisté dans le passé sur la dimension spatiale du numérique: le numérique est un espace, un espace réel, un espace matériel. J’ai insisté souvent – notamment dans le cadre de la théorie de l’éditorialisation – sur le fait que le numérique est un espace architectural, non pas dans un sens métaphorique (“comme” un espace) mais dans un sens propre: c’est un véritable espace. C’est notre espace principal de vie.

Je disais, par exemple:

Il est important de souligner que si nous comprenons le mot « numérique » dans un sens culturel, l’espace numérique est notre espace principal, l’espace dans lequel nous vivons, et pas seulement l’espace du Web ou des objets en ligne.

Dans sa conférence à l’UdeM, Luca partait de cette réflexion pour souligner que oui, le numérique – au singulier – peut être considéré comme un espace, justement parce que l’espace n’est pas un lieu. D’une part nous avons des lieux qui sont particuliers, hétérogènes, singuliers, avec des caractéristiques propres et de l’autre l’espace qui est homogène, unique, mesurable. L’espace est ce qui permet de créer des relations entre des lieux différents en les reliant et en les rendant commensurables.

Affirme Luca:

l’avenément du capitalisme est caractérisé, au moins à niveau cognitif voire imaginaire, par une abstraction ultérieure, qui est le passage de la notion de territoire national à celle d’espace commercial, ou si vous voulez, par l’invention du marché. Le marché, nous le verrons, ce n’est pas seulement un espace abstrait permettant de considérer tous les échangistes comme des sujets connectés et calculants, c’est aussi un rapport de force qui permet d’externaliser le couts des circulations commerciales vers les colonies et plus généralement vers les espaces non-éuropéens.

Luca continuait son analyse en s’appuyant sur le livre Blinding Pholiphemus de Franco Farinelli qui cite justement le fameux épisode de l’Odyssée où Ulysse rencontre Polyphème: Ulysse représente la volonté occidentale de transformer tout lieu en espace, car l’espace est toujours traversable, c’est la condition de possibilité du marché. Les grecs sortent de la grotte – où reste le sauvage – pour devenir marchants.

Tout devient traversable – et maîtrisable –, car tout est homogène, et aussi tout devient commensurable: tout peut être compté, calculé et donc échangé, vendu.

Dans ce sens le numérique – au singulier – semble être la réalisation du rêve d’Ulysse: le numérique réduit tout à une unité homogène, quantifiable et calculable.

Retourner dans la grotte #

Mais est-ce que le numérique doit nécessairement être cette incarnation du rêve d’un espace homogène total? En suivant l’analyse de Luca et sa critique à l’arrimage parfait entre espace numérique et espace du marché, je voudrais ici proposer l’idée, presque iconoclaste, d’une démarche opposée à celle proposée par le rêve d’Ulysse. Et si nous arrêtions de nous féliciter de notre sortie de la grotte et nous faisons au contraire un effort dans le sens opposé pour y revenir?

Car une chose est certaine – je n’avais peut-être pas complètement tort – : le numérique est désormais devenu notre espace principal de vie. La pandémie a peut-être accéléré ce phénomène. Mais le numérique, en tant qu’espace n’est pas habitable. Car on ne peut pas, en réalité, habiter un espace. C’est ce que m’a appris Luca et qui contrevient à toutes mes analyses précédentes, où justement je parlais d’espace habitable – dans On editorialization notamment et dans plusieurs articles à propos du concept d’éditorialisation.

Et si la possibilité même pour nous d’habiter le numérique résidait dans le fait de ne plus le regarder comme un espace mais comme une multiplicité hétérogène de lieux? Non pas donc l’espace numérique, mais les lieux numériques, au pluriel.

Cette piste nous oblige à mettre en question l’équivalence entre “numérique” et quantifiable et remettre en contexte la question de la quantification et de la calculabilité. Comme nous enseigne, entre autres, Jean-Guy Meunier, le numérique est d’abord et avant tout une question de modèles et de modélisation. Il ne s’agit pas, en premier lieu, de compter, mais de modéliser, de décrire une situation, un contexte, un concept, une idée. On pourrait dire qu’il faut conter avant de compter. Le modèle fonctionnel, mathématique et calculable, n’est jamais unique, il repose sur un modèle représentationnel, ou conceptuel, une vision du monde, un récit, une interprétation. Et il y a une multiplicité inépuisable de modèles possibles. Une multiplicité de lieux, donc, avec leurs valeurs propres, leurs caractéristiques et leur spécificités locales.

Habiter les lieux numériques signifie d’abord oeuvrer à la mise en place de son chez soi, de sa maison, ou de sa grotte.

Pour illustrer cette hypothèse, je voudrais me concentrer sur un exemple: celui des formats d’écriture.

Habiter des formats? #

J’ai souvent attaqué l’idée selon laquelle un format pourrait être quelque chose de neutre. On ne peut pas “dire la même chose” en docx, en xml ou en tex. On dit des choses différentes car les formats pensent, ils portent une philosophie du texte, une épistémologie particulière, une vision du monde locale. Chaque format est donc un lieu. Il n’y a pas de format qui puisse se vouloir universel, il n’y a pas de “format-espace”.

Les formats textuels pensent: ils implémentent et proposent une épistémologie du texte particulière. Le format détermine directement le sens de ce que nous écrivons ou lisons. Sans une analyse approfondie des choix théoriques et des visions du monde derrière les formats, nous sommes destinés à déléguer la pensée aux environnements techniques dans lesquels nous évoluons: ce n’est pas la personne qui croit faire de la recherche qui pense et qui écrit, c’est le logiciel et son format.

Je vais donc brièvement esquisser une analyse de trois exemples, très différents, trois formats qui pensent de façon distincte. Lorsqu’on écrit dans un de ces formats notre texte ne pourra que porter et véhiculer ses valeurs. De cette manière, c’est justement le format qui pense. Le lieu détermine ce qu’on peut y faire, ce qu’on peut y dire et le sens même de ce qu’on y affirme.

Cela dépend du fait que chaque format est d’abord et avant tout une modélisation du sens du texte, un modèle épistémologique du texte – et donc à la fois théorique et technique, au point ou les deux ne peuvent pas être distingués.

La glu Microsoft #

Le premier format est celui qui semble s’imposer comme un standard et qui ne l’est pas du tout: docx. J’ai souvent parlé de Word et de son format, et surtout je ne peux que renvoyer à l’excellent texte de Julien Dehut sur le sujet. Je pensais que l’expression “la glu Microsoft” ou “la glu Word” venait de Julien, mais je ne la retrouve pas dans son texte. En tout cas c’est une expression qui me semble bien décrire ce format et les valeurs qu’il représente. C’est un format gluant car il met ensemble dans un colle qui semble tout rendre homogène un mixte de choses hétérogènes qui disparaissent dans la glu. Le texte devient illisible, caché dans un encodage obscur et rendu inaccessible dans l’archive du format (un fichier docx est en réalité une archive avec un nombre très élevé de fichiers texte qui contiennent toute sorte d’informations qui ne sont pas produites par la personne qui écrit, mais par le logiciel, sans que celui ou celle qui écrit puisse en avoir conscience). C’est un format qui est un lieu, mais qui veut faire semblant d’être un espace.

L’histoire de Word et d’autres logiciels de traitement de texte en révèle par contre la philosophie. Ces logiciels naissent pour répondre à des besoins bureautiques. Le texte qu’ils modélisent est un document d’entreprise, ou en tout cas de travail, une lettre, un dossier, une communication interne, qui est destiné à être imprimé. Ce sont les exigences des entreprises des années 1980 où une foule de secrétaires – toujours des femmes, mais c’est un autre sujet et je renvoie ici aux travaux de Melissa Terras, Margot Mellet et Julianne Nyhan entre autres – produisent des documents techniques destinés à rendre possible une particulière chaîne de travail et de production.

Les concepts de “production” et de productivité sont essentiels ici, car c’est à l’impératif productiviste que répond le modèle textuel de Word qui est, pas par hasard, le logiciel phare de celle que Microsoft appelle une “suite de productivité”.

Word essaye – et réussit – ensuite de s’imposer comme un format neutre, comme si c’était un moyen transparent pour remplacer n’importe quel autre système d’écriture. Il remplace en effet d’abord les machines à écrire pour ensuite devenir un format to kill ‘em all. Il cache, dans sa glu, une vision du monde qui devient invisible et qui finit par être considérée comme neutre. Comme me le disait une fois un collègue: que j’écrive “bonjour” avec Word ou en LaTeX, c’est toujours “bonjour”. On a l’impression que le format – et le logiciel – n’est pas là, qu’on est “juste en train d’écrire”.

Et pourtant les conséquences de ce format sont catastrophiques: elles vont d’un faux sentiment de désintermédiation, à la conséquente perte de contrôle et de compétences sur la gestion du texte. La personne qui écrit n’a plus aucune prise sur le modèle épistémologique du texte qu’elle produit, le texte est finalement produit par le format de façon complètement opaque, c’est le format qui pense et non la personne qui écrit. Utiliser un ordinateur pour écrire avec Word est une véritable aberration.

TEI #

L’analyse d’épistémologies textuelles un peu plus complexes et surtout plus explicites rend plus évident le coeur de mon argument. Si on prend XML et en particulier la Text Encoding Initiative on s’en aperçoit sans peine. Avant de commencer à écrire il est nécessaire de se poser la question de quel schéma utiliser, quels sont la structure, les données, les sens possibles, les parties du texte. Est-ce que ce texte a des chapitres? Des pages? Des paragraphes? Des notes? Des variantes? Un apparat critique? Est-ce qu’il contient des dates? Des noms de personne? Des traductions? Des vers?

On n’a plus affaire à un espace, mais à une multiplicité de lieux. Autant de lieux que de schémas possibles, chacun portant ses moeurs, sa vision du monde, ses règles, ses pratiques.

Mais même TEI n’est pas un format to kill ‘em all. Même s’il ne s’agit pas, à proprement parler, d’un format, mais plutôt d’un méta-format, qui permet d’expliciter et produire des modèles différents et spécifiques à une multiplicité infinie de points de vues, il reste tout de même un ensemble de lieux particuliers. On peut vouloir habiter ailleurs. Arthur Perret le disait dans un billet de blog récent: “ « le bon outil » dépend des circonstances”.

En effet XML propose une épistémologie du texte basée sur l’idée qu’on peut définir comment certaines structures et caractéristiques du texte peuvent être transformées en données. C’est l’idée derrière les schémas. Un schéma permet de modéliser une série de structures du texte et ensuite de les baliser dans le texte: une date, un titre, un nom, une conjecture, une note, une page, l’emplacement dans une page etc. Mais la structure du balisage n’est pas faite pour penser au moment de l’écriture l’incarnation du texte balisé dans un texte lisible par un être humain. La question de l’affichage est renvoyée à un second moment. Cela est certes une force d’XML, mais aussi une caractéristique locale, qui ne peut pas prétendre à l’universalité. XML ne peut et ne doit pas être un format to kill ‘em all, car certaines sensibilités textuelles ne peuvent pas habiter XML. XML ne doit pas se transformer dans l’espace abstrait dont parle Luca.

Ekdosis #

Le travail de Robert Alessi et en particulier son développement du paquet LaTeX ekdosis m’a particulièrement aidé à rendre cette intuition plus concrète.

Ekdosis est un paquet LateX écrit en lua et pensé pour réaliser des éditions critiques. Il produit en sortie un pdf pensé pour l’impression et un fichier TEI qui propose les informations transformées en données. L’abondante documentation est une véritable description d’un lieu, d’une maison, avec ses coutumes, ses langues, ses symboles, ses pratiques, ses réflexes…

Le travail de Robert part d’un constat très précis: certaines pratiques issues de certaines traditions d’édition critique classique sont profondément ancrées dans la lisibilité d’un texte complexe sur une page imprimée. La page d’une édition critique n’est pas simplement un texte avec des notes, il n’y a pas seulement un texte et des informations complémentaires à propos du texte; il y a une manière différente de lire et de comprendre. Pendant qu’on lit un texte critique on voit et on interprète en même temps le texte, ses variantes, les références à des lectures d’autres chercheur.e.s… C’est une technique de lecture complètement différente, qui implémente un paradigme particulier, complexe et très spécifique. C’est un sens différent qui se déploie. Il ne s’agit pas du texte avec un apparat critique, mais, tout simplement d’un autre texte, un autre sens.

L’encodage TEI ne peut pas être considéré, dans ce sens, comme universel. Car il pense le balisage comme une manière pour transformer des informations textuelles en données. Mais il ne pense pas à la correspondance entre la structure des données et des compétences techniques de lecture, des véritables façons d’habiter la lecture comme un lieu, d’avoir le réflexe de baisser la tête dès que, chez nous, on passe sous une porte un peu trop basse, de changer notre cadre mental à la vue d’un symbole qui renvoie à une conjecture.

Ces compétences et ces paradigmes mentaux se concrétisent dans des symboles particuliers, placés dans des lieux particuliers de la page, souvent en latin, des symboles qui implémentent des modèles épistémologiques très locaux et qui ont des histoires et des traditions centenaires – et différentes selon les écoles, les langues, les traditions, les approches, les cas particuliers…

Ces compétences deviennent une véritable pensée incarnée, un modèle épistémologique qui est inscrit dans la structure de la page imprimée, qui est gravé dans un oeil qui sait comment bouger dans la page pour trouver une variante ou une conjecture. La pensée n’est pas juste la modélisation formelle mais aussi une série d’inscriptions. Et TEI oblige à faire abstraction de cette pensée inscrite.

Robert fait souvent l’exemple de l’ajout, dans le cas d’un mot ou d’une série de mots qui manquent dans un manuscrit, des commentaires om. ou deest.

Affirme Robert: “Dans les textes versifiés, il y a ainsi une grande différence entre « 34 om. A » et « 34 deest in A » : dans le second cas, on indique en effet que l’omission du vers 34 n’est pas nécessairement fautive.”

Or, TEI oblige à décider si cette distinction doit ou pas faire partie du schéma des données: est-ce une donnée ou pas? Elle n’est pas dans les schémas les plus utilisés, mais on pourrait en créer un. Mais dans la pratique de lecture et d’écriture cette différence est trop subjective – et pourtant importante – pour être transformée en données. En TEI donc deux représentations possibles de cette idée, avec ces deux exemples (tirés d’un texte de Robert):

<p>
  <seg type="appItem">1 καὶ prep. Rw</seg>
  <seg type="appItem">ποιούμενος om. Pr<hi rend="sup">a</hi></seg>
</p>

ou alors:

<app>
  <lem wit="#V #Pra #Prb">κατασκευὴν</lem>
  <rdg wit="#Rw">καὶ κατασκευὴν</rdg>
</app>
<app>
  <lem wit="#V #Prb #Rw">ποιούμενος</lem>
  <rdg wit="#Pra"/>
</app>

Dans la première on perd les données relatives aux variantes – car on met l’annotation dans le texte – dans la seconde on perd la nuance de l’om. qui s’assimile à un deest.

Loin d’être un détail il s’agit là d’un caractéristique d’un modèle épistémologique local, particulier et qui ne peut pas être réduit à aucun modèle se voulant universel.

Dans ekdosis Robert a modélisé une série de questions théoriques, de pratiques, de compétences, de traditions interprétatives avec une finesse et une précision remarquables. L’élégance du code révèle la clarté de la modélisation. Cette modélisation part donc d’une tradition qui émerge matériellement dans le rapport à la page imprimée et à une particulière - locale - expression inscrite du modèle épistémologique. La pensée d’ekdosis est donc la représentation de ce modèle et de ces traditions et la transformation en données encodées en XML est faite à partir de ce premier modèle. La personne qui fait l’édition critique peut donc rester dans son lieu privilégié, le lieu de la tradition sur laquelle est basée sa formation et sur laquelle sont fondées ses capacités herméneutiques, profondément ancrées dans l’implémentation matérielle qui se fait dans la page imprimée. L’encodage des données, fait pour que les informations ne soient pas seulement lisibles, mais aussi calculables par une machine, dérive du premier modèle.

Un exemple peut aider à clarifier ce point.

Voici le code ekdosis - tiré de la documentation:

% Preamble:
\DeclareShorthand{egomute}{\unskip}{ego}

% Document:
\begin{ekdosis}
  σχεδὸν \app{
    \lem[resp=egomute, nosep, post={post σχεδὸν quattuor uerba
      excidisse uid.}, type=emendation]{\supplied{\gap{reason=lost,
        unit=word, quantity=4}}}
  } οὗτοι

  subsidiis magnis \sic*{epicuri} constabilitas

  declinare quis est qui \sic{possit cernere sese}
  \app{
    \lem[resp=egomute, type=emendation, nosep, post={ante
      ὑπογίν.}]{\surplus{καὶ}}
        \note{deleui e Gal.P}
  } ὑπογίνονται

  Πάντων δὲ \app{
    \lem[resp=egomute, type=emendation, nosep]{\supplied{τῶν πυρετῶν}}
    \note[sep]{addidi (\arb{^gamI`a 'l-.hummayAti}
      \getsiglum{Gal})}
    \rdg[nordg, source=Gal]{\arb{al-.hummayAti}}
    \rdg[wit=codd, source=edd, alt=om.]{}
 },
\end{ekdosis}

Et le rendu pdf:

Et finalement la sortie XML-TEI produite automatiquement par ekdosis au moment de la compilation:

<p>σχεδὸν
<app>
  <lem resp="#ego" type="emendation">
    <supplied>
      <gap reason="lost" unit="word" quantity="4" />
    </supplied>
  </lem>
</app>οὗτοι</p>
<p>subsidiis magnis
<sic>epicuri</sic> constabilitas</p>
<p>declinare quis est qui
<sic>possit cernere sese</sic>.</p>
<p>
<app>
  <lem resp="#ego" type="emendation">
    <surplus>καὶ</surplus>
  </lem>
  <note>deleui e Gal.P</note>
</app>ὑπογίνονται</p>
<p>Πάντων δὲ
<app>
  <lem resp="#ego" type="emendation">
    <supplied>τῶν πυρετῶν</supplied>
  </lem>
  <note>addidi (

  <foreign xml:lang="ar-Latn" type="transliterated"
  subtype="arabtex">^gamI`a 'l-.hummayAti</foreign>
  <ref target="#Gal">Gal.</ref>)</note>
  <rdg source="#Gal">
    <foreign xml:lang="ar-Latn" type="transliterated"
    subtype="arabtex">al-.hummayAti</foreign>
  </rdg>
  <rdg wit="#V #I #R #H" source="#Lit #Erm #Sm" />
</app>,</p>

Une analyse rapide de la syntaxe qui permet d’ajouter les annotations – notamment le om. qui disparaît dans la version TEI – permet de comprendre l’élégance de la démarche qui consiste justement à habiter un lieu et à ne pas se plier à l’injonction universaliste de l’espace.

Ikea? Non, je bricole #

L’approche de Robert me semble aller donc dans le sens – certes, à première vue pas très sexy – du retour à la grotte. On ne peut pas habiter des espaces. Il n’est pas possible d’être chez soi dans l’homogène et dans l’universel. Il faut pouvoir développer des chez soi locaux, spécifiques, particuliers. Pour ce faire l’approche universaliste de l’espace homogène et toujours mesurable, où n’importe quelle portion est compatible et commensurable avec n’importe quelle autre, n’est pas une option. Les modules interchangeables d’Ikea ne permettent pas de produire des habitations, mais juste des marchés, des non-lieux traversables, utilisables – peut-être – qui permettent des connexions mais qui empêchent d’y habiter.

Retourner dans la grotte signifie essayer de bricoler son chez soi en implémentant dans des architectures numériques spécifiques des valeurs, des visions du monde, des enjeux théoriques, des approches et des besoins qui ont la vocation de rester toujours multiples et locaux.

ekdosis, TEI, Word, docx, formats, Luca Paltrinieri, Franco Farinelli, Robert Alessi, Margot Mellet, Melissa Terras, Julianne Nyhan