(Nota Bene : Ce billet a été écrit il y a quelques jours, avant les opérations de maintenance de la plateforme. Depuis, j’ai croisé sur mon chemin le livre de Maïeul Rouquette (qui tient sur Hypothèses le carnet Apocryphes), (Xe)LaTeX appliqué aux sciences humaines, qui sauvera votre vie ou au moins votre santé mentale. Puisse-t-il en être infiniment remercié.)

tex, pdf, pages, doc, docx, txt, rtf, html sont quelques unes des extensions que j’ai utilisées, ces derniers jours, pour travailler mes fichiers à l’occasion de différents projets. La plupart d’entre elles n’apparait jamais dans les échanges que je peux avoir avec d’autres membres de l’Université, au fil des courriels, quand il s’agit de rendre un article à une revue, de partager des informations, de préparer des cours collaboratifs ou de relire des épreuves. En règle générale, les seuls formats dont il soit question, dans ma discipline, sont le pdf, que l’on est prié de ne pas utiliser trop souvent, et le doc et le docx, dans le meilleur des cas, pour ceux — et ce n’est peut-être pas la majorité — qui sont véritablement à la pointe du progrès. Dans les disciplines littéraires au moins, la vie d’un ouvrage pour le chercheur peut se dérouler tout entière entre ses trois formats : on écrit l’article en doc, il revient commenté, plus ou moins habilement, dans le même format, il repart toujours ainsi et, quelques mois plus tard, dans certains cas, l’on reçoit les épreuves d’un volume complet en pdf, auquel cas on produit un nouveau fichier doc, où l’on note scrupuleusement les errata, afin de perfectionner le document final.

Quelques anecdotes des deux derniers mois, désormais. En préparant un cours collaboratif pour la rentrée, j’ai utilisé Framapad, sans grand succès : l’un de mes collaborateurs a préféré m’envoyer sa propre maquette de cours en Word, pour ne pas perdre sa mise en page. Autre jour, autre micro-événement informatique. Lors d’une réunion sur la formation doctorale, nous examinions, avec une autre représentante des doctorants ainsi que des directrices et directeurs d’écoles doctorales et des formateurs, la liste des formations proposés, dont l’une était une initiation au LaTeX. À ma gauche, un physicien hochait la tête d’un air entendu, à ma droite, une angliciste me demandait ce dont il pouvait bien s’agir. Ma brève explication a laissé le premier satisfait et la seconde dubitative. Troisième événement. Mercredi dernier, pour rédiger mon billet sur la participation des femmes aux activités littéraires à l’époque moderne, j’ai décidé d’écrire directement en html, quoique je n’eusse pas pratiqué depuis quelques années. J’avais pris l’habitude d’utiliser un logiciel de traitement de texte, Word, Pages ou Scrivener, mais le résultat du transfert à l’interface de WordPress était toujours décevant et exigeait un second long travail de mise en forme.

Pour la forme et l’exemple, je suis en train de rédiger ce billet sous TexShop — il sera enregistré au format tex, puis j’utiliserai un programme lancé depuis un terminal, c’est-à-dire, si l’on veut, en ligne de commande, TeX4ht ou bien pandoc. Le fichier html produit devrait théoriquement pouvoir être réceptionné par WordPress, tandis que le fichier tex servirait sans difficulté de support à d’autres exportations, en pdf, en txt évidemment ou en rtf. En fait, LaTeX est sans aucun doute l’une des meilleures manières de produire rapidement et efficacement des documents dans des formats universaux, comme le rtf, le pdf ou le html. Mais ça, c’est la théorie. (P.S. : En pratique, cette fois-ci peut satisfait du résultat, j’ai repris mon texte et je l’ai rebalisé manuellement en html.)

Imaginons maintenant que je veuille rédiger une note de lecture — au hasard — pour une revue en SIC — au hasard — qui me demande de l’envoyer en doc. Les choses se compliquent singulièrement. Deux méthodes s’offrent à moi : utiliser latex2rtf en ligne de commande pour convertir un fichier tex en rtf, ouvrir le fichier rtf avec un éditeur de texte comme Word, Pages ou Scrivener et l’enregistrer dans le format demandé, avant de l’envoyer à la revue ou bien produire un fichier html grâce à htlatex à partir de mon fichier tex et exporter ensuite ce fichier html en doc. Dans les deux cas, je risque de rencontrer de sérieux problèmes d’encodage, par exemple avec pandoc si mon fichier source n’est pas encodé en UTF-8, et, de toute façon, je vais perdre une partie de ma mise en forme : justification envolée, petites capitales disparues dans les noms d’auteur, lettres accentuées non reproduites, etc.

Le plus simple ne serait-il pas d’utiliser tout bêtement Pages, après tout livré avec tout Mac qui se respecte, ou bien Word, qui ne coûte que la modique somme de tant et tant ? Assurément, ce serait beaucoup plus facile. Même si \LaTeX est in fine beaucoup plus simple d’utilisation, Word est plus répandu et il constitue de facto un impératif social pour le chercheur en humanités. Maintenant, imaginez. Imaginez que vous vouliez vous rendre à un colloque mais que l’on accepte de ne vous en ouvrir les portes que si vous avez payé un taxi pour venir. Imaginez que votre hôtel est à côté de l’université, que marcher sur la voie publique entre l’hôtel et l’université soit à la fois plus économique, plus simple et plus responsable, parce que plus écologique, et que néanmoins les portes du colloque soient fermées à tous ceux qui n’auraient pas emprunté un taxi : c’est à peu près la situation des chercheurs en sciences humaines avec \LaTeX, Word et leurs documents communs.

La situation ne manque pas d’ironie si l’on songe que les injonctions se multiplient pour que ces mêmes chercheurs développent des projets d’humanités numériques, se mettent à l’informatique, apprennent pourquoi pas à coder (mais dans quel langage ? propriétaire ou non ?), utilise le numérique dans leurs classes comme dans leurs projets de recherche. Des TICE aux DH en passant par tout ce que vous voulez, l’informatique a tout l’air de vouloir envahir la pratique des chercheurs en SHS. En réalité, à bien des égards, ces chercheursS en savent à peu près autant sur l’informatique que les érudits de 1732 en savaient sur les vis hollandaises pour la trituration du papier ou le dernier modèle de presse mécanique pour l’impression.

Si vous tentez d’exprimer cette difficulté sérieuse à ceux qui savent, ceux qui maîtrisent déjà les outils, par hasard ou par profession, vous risquez fort de pénétrer dans le monde étrange du y a qu’à. Hier par exemple, en quête d’un convertisseur tex vers doc, j’ai eu l’ineffable plaisir de parcourir d’innombrables forums consacrés aux logiciels libres où de courageux impétrants venaient exposer leurs doutes à l’idée de se convertir à LaTeX ou les premiers signes d’une dangeureuse acédie, s’ils avaient déjà franchi le pas. Par exemple le cas d’un-e doctorant-e souhaitant rédiger sa thèse en LaTeX et s’enquérant du meilleur moyen de convertir le tex en doc, pour remettre des chapitres à son directeur de thèse, afin qu’il puisse les corriger.

De semblables messages de détresse sont légions. Les utilisateurs avertis semblent adopter systématiquement la même démarche dans leur secourable réponse.

Demander pourquoi, mais oui, ça alors, pourquoi diable voudrait-on avoir des fichiers doc, alors que le monde de \LaTeX est si plein de rires, de chants et de balises ? Lancer un débat sur la propriété, l’éthique, la politique, le monde comme il va et le Grand Satan capitaliste, par exemple en demandant si le directeur de thèse sera co-auteur de thèse et, dans le cas contraire, en soulignant qu’il ne devrait pas à avoir à/pouvoir éditer un fichier, parce qu’on peut être pour le logiciel libre et avoir une idée romantique et personnaliste de la production intellectuelle. Suggérer d’envoyer tout simplement le fichier tex, qui après tout est parfaitement lisible et que l’on peut éditer facilement.

Certes. Pareille lecture revient à se plonger directement sans aucun pallier de pressurisation dans le monde hostile de la pure abstraction. Dans de pareils sujets, pour nombre de répondants, l’usager des outils informatiques est à peu près l’agent économique des théories libérales les plus naïves, celui qui, parfaitement rationnel et extrait de toute temporalité accumulative, calcule numériquement ses intérêts et effectue toujours le choix le plus rationnel, en toutes circonstances. L’idée que l’on puisse être effrayé par un système de balisage pour mettre en forme du texte est absurde, parce qu’elle n’est pas rationnelle — elle n’a donc pas lieu d’exister et n’importe qui peut sans difficulter manipuler un fichier texte.

Sur quoi, deux anecdotes. Il y a quelques mois, lors d’une formation sur l’esprit critique dans les médias, dispensé par Richard Monvoisin du CORTECS, j’ai rencontré une doctorante en informatique, dont le nom m’échappe hélas, mais qui travailait sur les logiciels de traitement de l’image médicale. Si je me souviens bien, elle nous expliquait que les informaticiens qui développaient ces logiciels produisaient des outils très efficaces mais parfois difficiles à prendre en main pour les médecins. Selon elle, la qualité d’un logiciel reposait certes sur son efficacité objective, mais également sur la facilité de son emploi par ceux auxquels il est destiné. En d’autres termes, il y avait un dosage à faire entre efficacité (évaluée par les informaticiens) et accessibilité (évaluée par les utilisateurs). Prétendre que \LaTeX est la meilleure solution pour produire du texte, c’est dans certains cas accorder une importance excessive à l’efficacité aux dépends de l’accessibilité. D’où, deuxième anecdote. Ce printemps, lors d’un même mois, j’ai eu l’occasion de discuter avec Marie-Luce Demonet, à un déjeuner de colloque, et Cécile Meynard, à un dîner de colloque. Marie-Luc Demonet pilote le projet de la Bibliothèques Virtuelles des Humanistes, dont on peut aussi consulter ici le carnet de recherches et s’attache par ailleurs à proposer aux étudiants de l’université où elle exerce des cours d’humanités numériques impliquant par exemple, si j’ai bien compris, des exercices de description TEI des textes numérisés, pour permettre leur traitement. Le projet de la Bibliothèques Virtuelles des Humanistes, assez bien financé, a les moyens d’affecter des professionnels bien formés à la description de ses textes, en même temps qu’ils en font la relecture. La situation de Cécile Meynard avec Manuscrits de Stendhal est bien différente : les ressources fluctuantes du projet — parce que les injonctions de pilotage ne sont pas toujours suivies, loin de là, des moyens pour y répondre — imposent de faire appel, pour la relecture des manuscrits numérisés puis leur transcription, à des contractants non professionnels, généralement des retraités de diverses professions, qui ne savent pas utiliser la description TEI. Évidemment, la TEI n’est pas très difficile à apprendre, mais la difficulté réelle de maîtrise d’un outil est bien un calcul entre sa complexité objective et son accessibilité et cette seconde variable dépend, par exemple, de l’âge de l’utilisateur.

Revenons donc à ce directeur de thèse, de revue, d’atelier, de tout ce que vous voulez qui n’acceptait que des fichiers doc. La vraie solution consiste-t-elle, à la guerre comme à la guerre, à lui envoyer le fichier source tex en lui suggérant de se saisir de ses dix doigts et de son Notepad pour le commenter ? Alternative trouvée sur certains forums, et je vous jure que c’est vrai : imprimer le PDF produit par la compilation du fichier tex et l’envoyer au directeur en question (avec un stylo rouge). On ne saurait mieux souligner l’une des plus grandes faiblesses de LaTeX : n’avoir pas su anticiper la dématérialisation croissante des produits éditoriaux et continuer à générer des fichiers finaux difficiles à éditer. Dans l’état actuel des choses, rien ne saurait empêcher la dépendance croissante des outils LaTeX à des programmes de conversion comme pandoc, capables certes de produire des ebooks (par exemple) mais encore moins accessibles que les programmes qui produisent ce qu’ils doivent convertir.

Toutes ces considérations restent bien souvent cachées dans une très large part des discours sur les humanités numériques, qui poussent aujourd’hui comme des champignons de toutes saisons, pour deux raisons principalement.

Nombre des productions concernant les humanités numériques, particulièrement lorsqu’elles ne circulent pas dans le milieu restreint des hyperspécialistes mais dans celui, plus large, des chercheurs conscients des potentialités du numérique et désireux, à la fois par intérêt et par contrainte, de répondre aux injonctions de pilotage en ce sens, nombre de ces productions-là parlent des projets sans véritablement explorer leurs aspects techniques ou bien en externalisant ces aspects : les logiciels ont été produits par des sociétés privées, grâce à une collaboration avec un laboratoire d’informatique ou bien ils sont restés le pré carré des ingénieurs de recherche recrutés (temporairement ?) pour l’occasion. Il est tout à fait possible pour un-e humaniste, voyez l’ironie, de collaborer plusieurs années à un projet d’humanités numériques sans voir jamais un morceau de fichier source ; pour elle ou lui, le projet ne sera jamais que le rendu graphique, aux différentes étapes de son élaboration. Quand il est question d’outils, les outils évoqués sont les instruments spécifiques aux projets particuliers et novateurs qu’il s’agit de présenter, de défendre ou de perfectionner. Jamais ou presque les instruments utilitaires spécifiques ne sont mentionnés, en dehors de quelques stars de la catégorie comme Zotero (voir le carnet de la communauté francophone). Or, \LaTeX (par exemple) compte parmi ces instruments qui ne servent pas à faire des humanités numériques, mais dont on pourrait à bon droit estimer qu’il doive faire partie, plutôt que Word, Pages ou d’autres, de l’arsenal du chercheur publiant et même de l’étudiant en lettres, en langues ou en anthropologie. Former des chercheurs aux humanités numériques revient bien souvent à leur dispenser les compétences hyper-spécialisées nécessaires à la manipulation locale, voire sectorisée par tâche, qu’ils auront à accomplir à l’intérieur d’un projet donné.

À la rentrée, je participerai au groupe de travail sur les humanités numériques piloté à Grenoble 3 par Cécile Meynard, pour la nouvelle offre de formation du prochain plan quinquennal. Pour l’instant, dans le département de lettres, la place réservée à l’enseignement des humanités numériques est minime, pour ne pas dire inexistante, malgré plusieurs projets, déjà en partie aboutis, comme Manuscrits Stendhal, ou en cours de développement, comme HyperFerrazzi, auquel je collabore. Ce groupe va avoir la difficile mission de ménager une petite place aux humanités numériques dans une offre de formation où la marge de manœuvre est évidemment minime. Dans ce temps anecdotique dédié à la formation des étudiants en humanités au numérique, que doit-on leur apprendre ? À gérer le plus efficacemment possible les outils commerciaux les plus répandus en réservant l’apprentissage vraiment technique à quelques instruments endémiques aux humanités numériques ? Ou à s’emparer d’outils généralistes très performants mais encore confidentiels, quitte à les forcer à des interactions sociales complexes avec leurs futurs collaborateurs qui ne les maîtriseraient pas ?