Écriture scientifique au format texte

Arthur Perret (Université Jean Moulin Lyon 3)

🚧 Page en construction — Dernière mise à jour : 11/12/2022

Cette page donne des arguments en faveur de l’utilisation du format texte pour rédiger des documents scientifiques.

1 Introduction

1.1 Inconvénients des logiciels de traitement de texte

En sciences humaines et sociales, les logiciels de traitement de texte, comme LibreOffice Writer, Microsoft Word et Google Docs, sont utilisés par la majorité des auteurs et des éditeurs. Ce sont des outils polyvalents, puissants, capables de gérer toutes les étapes de la chaîne éditoriale. Mais leurs avantages sont contrebalancés par une série d’inconvénients plus ou moins problématiques.

D’abord, et du fait de leur polyvalence, ces logiciels tendent souvent vers l’usine à gaz. Leur interface est notoirement encombrée, pleine de distractions. Et ils sont gourmands en ressources (énergie, mémoire) ; or malgré cela, ils gèrent mal les documents longs et complexes.

Ensuite, ce sont des logiciels ancrés dans le paradigme de l’imprimé, qui sont donc fondamentalement inadaptés à la communication via le Web. Dans un monde où le papier et le numérique sont appelés à cohabiter durablement, c’est une lacune considérable.

Autre problème : leur modèle économique (en tout cas pour les logiciels propriétaires) est de moins en moins avantageux pour le consommateur. La tendance est à l’abonnement : payer pour accéder à ses propres données, sans aucune garantie sur la longévité du service.

Enfin, leurs formats sont soit complètement fermés (.doc), soit difficiles à utiliser via d’autres outils (.docx). Les logicels de traitement de texte verrouillent les auteurs dans un écosystème propriétaire dans lesquels les choix sont réduits. Certes, LibreOffice existe ; mais la compatibilité entre formats a des limites, en partie entretenues par les éditeurs commerciaux qui n’en tirent aucun profit.

1.2 Le format texte comme alternative

Le format texte constitue une alternative au traitement de texte, sans pour autant le remplacer totalement. Il constitue un compromis différent, avec ses propres avantages et inconvénients.

Un fichier au format texte est un fichier ne contenant que des caractères. Il se manipule avec des éditeurs de texte. Un fichier au format texte est toujours exprimé dans un certain codage, qui définit les caractères utilisables dans le fichier. Et il peut également être rédigé dans un langage particulier, c’est-à-dire en respectant des règles d’écriture qui se traduisent par des fonctionnalités lorsqu’on ouvre le fichier dans un logiciel approprié. En fonction du langage utilisé, on peut exprimer différentes choses : pas seulement du texte au sens littéraire, mais aussi toutes sortes de données et de médias.

Le format texte a des avantages intrinsèques. Sa simplicité et sa légèreté se traduisent par des gains de performance et de portabilité. Il appartient au logiciel libre, ce qui se traduit par une grande diversité d’outils, donc une plus grande liberté de choix, et par une plus grande pérennité des données. Enfin, c’est une technique expressive qui sert de base à de nombreux formats et donc de nombreux usages, tout en garantissant une certaine interopérabilité et en facilitant les conversions.

Pour plus de détails, voir ma page Format texte.

Le format texte a également des avantages plus spécifiques dans la perspective de l’écriture scientifique.

Je l’ai dit, il existe une plus grande diversité dans le choix d’interfaces de travail parmi les outils conçus pour le format texte. On trouve ainsi des interfaces bien mieux pensées pour l’écriture que celles des logiciels de traitement de texte, avec notamment des fonctionnalités qui favorisent la concentration et d’autres qui facilitent la manipulation de la structure des documents.

Le format texte donne de plus grandes capacités d’automatisation. Il facilite notamment la gestion des figures, beaucoup moins laborieuse que dans un traitement de texte. Mais surtout, il rend l’automatisation reproductible par simple copier-coller.

Enfin, le format texte encaisse parfaitement les longs documents ; certains langages comme LaTeX sont même pensés pour ça.

2 Langages

Le format texte est une technique générique, qui se décline en différents langages. Chaque langage a ses propres fonctionnalités, qui se traduisent par des règles d’écriture, et qui lui donnent une utilité propre.

Voici quelques langages largement répandus dans le domaine scientifique et qui permettent de créer des documents :

HTML
HTML (HyperText Markup Language) est le langage de balisage conçu pour représenter les pages web. Il permet d’écrire de l’hypertexte, de structurer sémantiquement la page, d’inclure des ressources multimédias et de créer des documents interopérables et accessibles. Tout contenu scientifique publié sur le Web est en HTML.
XML
XML (eXtensible Markup Language) est un méta-langage qui permet de créer des langages de balisage ayant des vocabulaires différents mais une grammaire commune. Parmi les langages basés sur XML et utilisés dans le domaine scientifique, on trouve par exemple TEI (Text Encoding Initiative, pour les manuscrits), JATS (Journal Article Tag Suite, pour les périodiques) et DocBook (pour la documentation technique). Certains de ces langages servent d’intermédiaire pour exprimer le document dans un autre langage (comme HTML) ou un autre format (comme PDF).
LaTeX
LaTeX est un langage permettant d’utiliser le système de composition TeX afin de créer des PDF de qualité professionnelle. TeX a été inventé par un mathématicien qui désirait retrouver la qualité typographique des ouvrages de mathématiques imprimés à l’époque de la composition au plomb ; LaTeX est un ensemble de macros (formes condensées) qui allègent l’écriture des commandes TeX et les rendent ainsi plus accessibles aux auteurs. LaTeX est principalement utilisé en mathématiques et en sciences de la nature.
Markdown
Markdown est un langage de balisage dit « léger », c’est-à-dire dont la syntaxe est plus économe en caractères, donc potentiellement plus facile à écrire et à déchiffrer, que des langages comme HTML, XML ou encore LaTeX. Markdown a été conçu pour faciliter l’écriture de contenus destinés au Web et a depuis été adapté à des processus d’écriture scientifique, à travers différentes variantes comme R Markdown et Pandoc Markdown.

Il existe d’autres types de langages, qui servent à exprimer des données au format texte. Or celles-ci sont susceptibles d’intervenir dans la création de documents. Voici donc également une liste de quelques noms qui donnent une idée des usages possibles :

3 Outils

3.1 Markdown et Pandoc

Pandoc est un programme de conversion entre formats de balisage. Il reconnaît et sait transformer des formats comme HTML, XML et LaTeX mais aussi les formats pour traitement de texte, présentations, bibliographies, livre numérique, wikis et bien d’autres.

Parmi les formats reconnus par Pandoc, Markdown occupe une place particulière. Pandoc permet d’utiliser une variante de Markdown qui lui est propre, et qui ajoute des fonctionnalités liées à l’écriture scientifique : tableaux, références bibliographiques, listes de définitions, formules mathématiques, notes de bas de page. Il est alors possible (et encouragé) d’utiliser Markdown comme « format d’entrée universel » pour Pandoc : cela consiste à écrire au format texte avec une syntaxe simple et de générer à la volée des documents dans tous les formats que peut fabriquer Pandoc.

Concrètement, écrire en Markdown via Pandoc donne accès à l’essentiel des possibilités de LaTeX et HTML (entre autres), sous une forme beaucoup plus simple, et en conservant un seul fichier source dans un format pérenne.

Ceci est particulièrement intéressant dans le cas de LaTeX, dont les bénéfices sont très intéressants mais qui est lourd à écrire et difficile à maîtriser. Pandoc permet de créer des PDF via LaTeX sans écrire de LaTeX, ce qui permet – passez-moi l’expression – d’avoir le beurre et l’argent du beurre.

Comme l’écrit Blair Fix (2020), Markdown a transformé le paysage de l’écriture au format texte :

« Markdown a transformé le paysage de l’écriture au format texte. Il permet d’utiliser une syntaxe simple pour rédiger des documents complexes. Et contrairement aux outils plus anciens comme LaTeX, un document Markdown peut être transformé facilement dans n’importe quel format. C’est le rêve de tout auteur. »

“Markdown has transformed the landscape of plain-text writing. It allows you to use simple syntax to write complex documents. And unlike older tools like LaTex, your Markdown document can be rendered seamlessly in any format you want. It’s a writer’s dream.”

3.2 Éditeurs de texte

Les principales fonctionnalités qu’on attend d’un bon logiciel d’écriture scientifique sont :

  • structurer de longs documents et faciliter la navigation ;
  • insérer des citations et générer des bibliographies ;
  • exporter les fichiers dans différents formats.

Zettlr est un exemple d’éditeur de texte Markdown avec des fonctionnalités d’écriture scientifique, basé sur Pandoc, qui répond à ces critères.

4 Guide pratique

4.1 Traitement des citations

Dans cette section, j’explique comment utiliser conjointement Zotero et Zettlr pour intégrer automatiquement citations et bibliographies dans votre processus d’écriture.

Première étape : téléchargez Zotero.

Je recommande Zotero plutôt qu’un autre car c’est un logiciel libre, maintenu par une institution de recherche, et très utilisé dans le monde universitaire. On a donc une assez bonne garantie que le logiciel reste maintenu, qu’on reste propriétaire de ses données sans être espionné par une société privée, et qu’on peut trouver de l’aide facilement en prenant contact avec des bibliothécaires et documentalistes qui travaillent à la fac.

Besoin d’aide ? Tutoriel Zotero en français

Deuxième étape : téléchargez le plugin Better BibTeX pour Zotero. Pour l’installer :

  • Dans Zotero, cliquez sur OutilsExtensions.
  • Cliquez sur l’engrenage dans le coin supérieur droit et choisissez Install add-on from file.
  • Choisissez le fichier .xpi que vous venez de télécharger et cliquez sur Installer.
  • Redémarrez Zotero.

Troisième étape : paramétrer les clés de citation.

  • Dans les réglages de Zotero, cliquez sur l’onglet Better BibTeX.
  • Sous Clés de citation, dans le champ Format de clé, saisissez [auth:lower:nopunctordash][year] (format recommandé).

Quatrième étape : une fois que vous avez des références, il faut exporter votre bibliothèque (à faire une seule fois).

  • Faites clic droit sur Ma bibliothèque et sélectionner Exporter la bibliothèque.
  • Sélectionnez le format Better CSL JSON, cochez Garder à jour et cliquez sur OK.
  • Sélectionnez un emplacement pour le fichier, renommez-le éventuellement (ex : references.json) et cliquez sur Enregistrer.

Cochez bien Garder à jour : vous n’aurez plus besoin de vous préoccuper du plugin, ni de faire d’export, car à chaque modification de la bibliothèque, l’export sera mis à jour automatiquement par Zotero.

Besoin d’aide ? Documentation du plugin Better BibTeX en anglais

Cinquième étape : téléchargez Zettlr.

Je recommande Zettlr plutôt qu’un autre car il est spécialisé dans l’écriture scientifique, contrairement à des logiciels généralistes (VS Code, Obsidian…) qui proposent des extensions (plugins) mais qui ne sont pas conçus pour ça (ce qui se ressent négativement à l’installation et à l’usage).

Sixième étape : paramétrer Zettlr pour utiliser vos données bibliographiques.

  • Dans les réglages de Zettlr, cliquez sur l’onglet Citations.
  • Dans le champ prévu à cet effet, indiquez l’emplacement du fichier de références bibliographiques que vous avez exporté via Zotero.
  • Dans le champ en-dessous, indiquez l’emplacement du fichier de style bibliographique de votre choix. Je vous recommande de télécharger le fichier correspondant à la norme ISO-690 au format auteur-date.

À ce stade, vous êtes prêts pour collecter des références dans Zotero et les citer en Markdown dans Zettlr. Au moment d’exporter votre travail, les clés de citation seront traitées automatiquement. On obtient alors un fichier avec des citations mises en forme et une bibliographie.

Liens utiles

Mes autres pages :

Bibliographie

FIX, Blair, 2020. Why and How I Write Scientific Documents in Plain Text. In : Economics from the Top Down [en ligne]. 10 décembre 2020. Disponible à l'adresse : https://economicsfromthetopdown.com/2020/12/10/why-and-how-i-write-scientific-documents-in-plain-text/.