La logique hyperdocumentaire dans la structuration de l’information et sa visualisation

2019-11-08

La logique hyperdocumentaire correspond à la conception de la documentation sur le modèle du réseau dans les travaux pionniers de Paul Otlet. Elle repose sur une nouvelle théorie du document et de la classification qui tend vers l’encyclopédie. Parce qu’elle est indissociable du graphe, l’hyperdocumentation s’inscrit à la fois dans le champ de l’épistémologie visuelle et des humanités numériques. Le graphe constitue un outil d’exploration réflexif de la logique hyperdocumentaire. Cela nous permet de développer une compréhension pratique du lien entre structuration et visualisation.

1 Introduction

Paul Otlet (1868-1944) est un avocat, bibliographe et militant pacifiste belge considéré comme le fondateur de la documentation moderne. Ses travaux offrent une réponse théorique et pratique au défi informationnel de son époque et de la nôtre. En effet, faisant face à un accroissement considérable de la production écrite (notamment scientifique et technique), il fait le constat de la difficulté immense que représente l’acquisition d’une connaissance globale du monde, non seulement pour un individu mais également à l’échelle de la société – problématique toujours d’actualité à l’ère d’Internet et des big data. Otlet estime qu’il y a un lien direct entre l’ignorance, l’incommunication et la guerre ; son projet est celui de la connaissance universelle pour favoriser la paix entre les hommes. Dès lors, il s’attelle à refonder l’ancienne bibliographie en une véritable science, qu’il nomme documentation, dans la perspective plus globale de la coopération internationale.

Bien qu’ayant eu une influence majeure sur l’émergence de toute une profession, les travaux d’Otlet ont été délaissés par les milieux scientifiques pendant plusieurs décennies, avant de faire l’objet d’une redécouverte progressive Rayward, The universe of information, 1975 ; Buckland, « What is a document? », 1997 ; Van Acker, Universalism as utopia, 2011.
. Aujourd’hui, une attention nouvelle est portée à son ouvrage majeur, le Traité de documentation, notamment dans ses toutes dernières pages, consacrées à une anticipation de l’avenir de la documentation. Dans un passage souvent cité, Otlet imagine un dispositif de consultation que la technologie de l’époque n’est pas tout à fait en mesure de concrétiser et qui nous évoque l’écran d’un ordinateur connecté à une base de données distante Otlet, Traité de documentation, 2015 [1934], p. 428.
. Ces quelques lignes d’anticipation devenues célèbres favorisent l’analogie avec nos infrastructures contemporaines. Le Répertoire bibliographique universel, un centre documentaire qui met à profit le réseau téléphonique pour proposer un service informationnel à distance, trouve un lointain successeur dans le Minitel. Quant à Internet et au Web, ils représentent aujourd’hui ce qui se rapproche le plus du projet à échelle mondiale que concevait Otlet.

Le mot documentation a hérité d’Otlet son caractère polysémique. Jean Meyriat en distingue trois acceptions : ensemble de documents, activité constituant cet ensemble et connaissance scientifique associée à cette activité Meyriat, « Document, documentation, documentologie », 2001 [1981], p. 148‑149.
. Nous observons une autre division : la documentation se rapporte à une infrastructure, c’est-à-dire à une organisation de nature à la fois humaine (tour à tour science, profession ou service) et matérielle (supports documentaires, mobilier, lieux de savoir) ou bien à la structure de l’information elle-même. Or comme nous allons le voir, Otlet utilise le réseau comme modèle commun à la structure et à l’infrastructure, unifiant toute la théorie et la pratique de l’organisation des connaissances. Cette logique nourrit une forme d’épistémologie visuelle. Elle fait notamment du graphe une technique privilégiée des humanités numériques et qui peut favoriser l’acquisition d’une culture technique.

2 Documentation et réseau

À l’origine de la proposition d’Otlet se trouve une réflexion sur le livre, dont il juge la forme insatisfaisante au vu des besoins de son époque en matière de communication. Sa critique porte sur deux aspects : la faible densité d’information véritablement utile, trop souvent noyée dans la glose et le jargon ; la rigidité du format, qui ne permet pas facilement de réutiliser le contenu. C’est au miroir de cette frustration qu’on peut comprendre son intérêt pour la fiche : elle est plus synthétique que le livre et plus facilement manipulable. Cette forme ouvre de nombreuses possibilités, puisqu’une ressource composée de fiches permet plus facilement l’augmentation, l’extraction, la recombinaison, etc. On comprend également son enthousiasme pour les nouvelles technologies d’enregistrement du son et de l’image, qui facilitent la reproduction et la diffusion du texte. C’est pourquoi il propose une définition large du document qui inclut le livre mais aussi ses « substituts », tels que la photographie, le microfilm ou encore le phonogramme. Afin d’organiser ces différents niveaux de granularité et ces formes hétérogènes, Otlet travaille sur des réalisations concrètes bien connues, qui vont influencer les développements de la documentation durant le 20e siècle : la fiche standardisée, associée à un mobilier spécial, et la Classification décimale universelle.

Le Traité de documentation constitue l’aboutissement et la synthèse des efforts qu’il déploie pour donner un caractère scientifique à sa démarche. Dans une perspective positiviste influencée par l’atomisme, Otlet traduit l’interchangeabilité du support par l’idée d’une unité informationnelle (le biblion) qui peut prendre différentes formes. La mise en rapport de ces unités, dans des ensembles éventuellement complexes, est rendue possible par la classification, qui est conçue comme un codage scientifique des relations entre documents. C’est ainsi que la structure de la documentation se trouve décrite comme un ensemble de nœuds et de liens, c’est-à-dire un réseau. Otlet envisage un temps de publier le Traité sous la forme d’une encyclopédie documentaire à la forme révolutionnaire. Malheureusement, les contraintes matérielles qui s’imposent à lui dans les années 1930 ne lui permettent pas de mener à bien ce projet. L’ouvrage paraît sous une forme classique, avec ce sous-titre fort à propos : Le livre sur le livre.

Les publications et les archives d’Otlet comportent un nombre important de schémas, depuis les nombreux croquis dont il parsème ses papiers personnels jusqu’aux planches qu’il fait réaliser pour des publications ou des expositions. Dans cette iconographie abondante, Wouter Van Acker distingue certaines métaphores visuelles comme étant centrales dans la pensée d’Otlet, citant comme exemples la sphère, la pyramide et le réseau Van Acker, cité, p. 62.
. De ce dernier, il développe une analyse centrée sur la coopération internationale. S’il fait allusion à une connection entre les approches universalistes de la connaissance et de la coopération Ibid., p. 96.
, il n’étudie pas l’application de la métaphore du réseau aux deux approches, seulement à la seconde. Les schémas montrent cependant que la même forme du réseau façonne la vision qu’a Paul Otlet de la connaissance (au sens d’une structure donnée à l’information) et de la coopération (qui constitue une partie de l’infrastructure dédiée à la connaissance), ce qui inscrit sa pensée dans la longue histoire de l’ontologie.

Ainsi que le décrit Umberto Eco, la représentation graphique intervient très tôt dans l’évolution du questionnement ontologique et se manifeste essentiellement sous forme d’arbres Eco, De l’arbre au labyrinthe, 2010.
. En analysant l’arbre de Porphyre (3e siècle), il met en évidence une distinction fondamentale : soit les propriétés qui permettent de fonder l’ontologie représentent la seule façon possible de concevoir le monde et elles façonnent alors un arbre définitif qui produit un mode de connaissance unique ; soit on admet que ces propriétés sont choisies parmi différents groupes qui représentent tous une vision possible et il y a alors autant d’ontologies et d’arbres que de systèmes de pensée. La première approche est limitée : « un arbre à hiérarchie fixe, avec un nombre fini de déterminations, ne sert qu’à classer », il s’apparente au dictionnaire Ibid., p. 30.
. Eco montre que la seconde approche s’impose progressivement dans l’histoire de l’ontologie, faisant évoluer ses modèles et ses modes de représentation : « l’arbre éclate en une multitude infinie d’accidents, en un réseau impossible à hiérarchiser de qualia. Le dictionnaire finit nécessairement par se dissoudre. Il se fait alors encyclopédie » Ibid., p. 34.
.

L’encyclopédie est la forme privilégiée de la documentation otlétienne et constitue également son horizon. La théorie que développe Otlet lui permet en effet de poser les conditions d’un enregistrement total de la connaissance possible ; il en fait le stade ultime du développement de la documentation ou « Hyper-documentation » Otlet, Traité de documentation, 2015 [1934], p. 429.
. La possibilité d’inscrire tout ce qui est énoncé socialement apparaît chez Eco dans le concept d’« encyclopédie maximale » : parce qu’il est impossible de déplier un réseau, il propose cette idée comme un horizon régulateur permettant de concevoir « des hiérarchies provisoires, ou des réseaux maniables » Eco, cité, p. 74.
. Un modèle de classification décimale comme celui de Dewey et d’Otlet produit des arbres hiérarchiques ; à l’inverse, la classification à facettes de Ranganathan et les vocabulaires contrôlés utilisés dans le Web sémantique (appelés « ontologies » par abus de langage) forment plutôt un rhizome. En règle générale, il apparaît que la fonction réticulaire de la classification est plus importante que le choix d’un système particulier : c’est elle qui fonde la possibilité d’une hyperdocumentation, c’est-à-dire d’un réseau de documents à la fois ouvert, composite, sur différentes échelles et à la structure plus ou moins hiérarchique.

3 Épistémologie visuelle et problématique

La logique hyperdocumentaire est donc le fait de penser la structure de la documentation comme un réseau. Elle s’appuie particulièrement sur un outil visuel bien spécifique : le graphe, c’est-à-dire la représentation graphique d’un modèle abstrait de réseau. Le graphe est un puissant outil de travail interprétatif et réflexif sur la logique hyperdocumentaire – sous certaines conditions.

Les graphes sont à la fois une catégorie générique et une sous-catégorie de représentation : ils incluent par exemple les arbres (qui se distinguent des autres graphes par la présence d’une hiérarchie) mais peuvent être eux-mêmes inclus dans la catégorie des diagrammes. Johanna Drucker situe ces différents outils au sein de l’épistémologie visuelle, qu’elle définit comme « les modes de connaissance qui se présentent et se traitent visuellement » Drucker, Graphesis, 2014, p. 8.
(trad. libre). Elle rappelle que certaines images ont la capacité de générer une connaissance et pas seulement de la représenter. Pour les graphes, elle montre que cette dynamique repose sur deux éléments : l’indexation dans un espace en deux dimensions et une logique combinatoire Ibid., p. 106‑107.
– nous retrouvons ici les nœuds et les liens du réseau. L’interprétation d’un graphe passe par des parcours de lecture : il est le support d’une circulation intellectuelle dans le réseau. Lorsque le graphe se fait purement illustratif et que sa construction est masquée, cette valeur heuristique est perdue.

Van Acker emploie une terminologie similaire dans son analyse des schémas d’Otlet. Il y distingue trois catégories de métaphores visuelles selon qu’elles remplissent une fonction illustrative, heuristique ou constitutive Van Acker, Universalism as utopia, 2011, p. 58‑62.
. Selon lui, le réseau peut être décrit comme constitutif de la pensée d’Otlet : parce qu’il est intégré profondément à son travail sur une longue période, il devient progressivement une métaphore « morte », au sens où l’analogie entre dessin et idée n’est plus possible que pour les initiés. Otlet utilise le graphe surtout comme symbole, on perd alors ce qui en fait initialement un outil heuristique : l’adéquation totale entre l’objet abstrait (le réseau) et sa représentation concrète (le graphe).

Cette connexion est cruciale, car elle conditionne une certaine réflexivité. Dans son étude des effets de l’écriture sur le langage et la parole, Jack Goody remet en cause la hiérarchie stricte entre compétence et performance défendue par certains linguistes à son époque Goody, La Raison graphique, 1979, p. 60, 143.
. Le rapport nouveau qu’il établit entre les deux termes est repris par Drucker dans son travail sur l’épistémologie visuelle : « les diagrammes performent l’acte de raisonnement, ils ne le représentent pas après coup mais sont le moyen d’en faire fonctionner le processus logique » Drucker, cité, p. 115.
(trad. libre). Autrement dit, le graphe permet non seulement de générer une connaissance mais d’en expliciter la construction, ce qui nous permet éventuellement de l’analyser. Cette possibilité d’un effet de la performance sur la compétence constitue presque une définition de la réflexivité.

Les humanités numériques nous fournissent un terrain concret pour observer ces idées en action. Les graphes sont les représentations privilégiées des corpus, qui constituent la structure hyperdocumentaire par excellence. Aurélien Berra dit de l’épistémologie des humanités numériques qu’elle concerne avant tout la résolution pratique de problèmes et les effets de cette résolution – d’où l’expression d’« épistémologie problématique » Berra, « L’épistémologie problématique des humanités numériques », 2014.
. Celle-ci se puise dans une tradition particulière de l’anthropologie, de l’histoire et de la philosophie des sciences qui s’intéresse aux médiations techniques telles que le diagramme, la cartographie et la bibliothèque Dagognet, Les outils de la réflexion, 1999 ; Jacob, L’empire des cartes, 1992 ; Latour, « Pensée retenue, pensée distribuée », 2007.
. Le fil rouge de ces travaux est la boucle établie entre culture et technique à travers différents processus de matérialisation qui sollicitent intellect et outil de façon contigüe. Sa compréhension nécessite ce que nous appelons une pratique des concepts, c’est-à-dire une mise à l’épreuve de la théorie par l’expérimentation.

Or cette pratique ne va pas sans obstacles. Les humanités numériques ont permis la démocratisation d’outils logiciels clé-en-main, ce qui peut entraîner des effets délétères de « boîte noire » Mounier, Les humanités numériques, 2018, p. 141.
. Le graphe risque alors d’intervenir alors comme support d’un discours extrêmement fragile sur le plan méthodologique. À cela, on peut opposer une démarche de recherche-conception heuristique. L’Otlétosphère est un exemple (parmi bien d’autres) de cette approche. Cet outil développé au sein du programme ANR HyperOtlet est un prototype de cartographie relationnelle autour de Paul Otlethttp://hyperotlet.huma-num.fr/otletosphere.html
. Les données (entités et relations) sont stockées dans un format tabulaire à partir duquel le graphe est généré. La circulation constante entre ces deux niveaux est bénéfique pour comprendre qu’il n’est de lien qui ne soit construit. L’outil permet de tester la base de connaissances et le modèle a priori des relations. Ce type de dispositif permet de se confronter à la structure hyperdocumentaire du corpus.

4 Conclusion

La forme que conçoit Paul Otlet pour la documentation au début du 20e siècle représente une innovation considérable dans l’organisation des connaissances, qui structure toujours nos systèmes d’information aujourd’hui. C’est pourquoi il est crucial d’en saisir la logique, que nous avons qualifiée d’hyperdocumentaire. Celle-ci nous permet de mieux comprendre le lien entre structuration et visualisation de l’information dans un champ comme les humanités numériques, au sein duquel l’usage des graphes est très répandu. Cette logique appelle une épistémologie à la fois visuelle et problématique, c’est-à-dire qui étudie la visualisation dans la perspective de la réflexivité. Elle nous invite à nous intéresser à des outils qui ne sont pas seulement informatifs mais formateurs.

Références

Berra, Aurélien. « L’épistémologie problématique des humanités numériques ». Dans : Philologie à venir. 2014. https://philologia.hypotheses.org/1461.
Buckland, Michael. « What is a document? » Journal of the American Society for Information Science. 1997, Vol. 48, n° 9, p. 804‑809. https://doi.org/10.1002/(SICI)1097-4571(199709)48:9<804::AID-ASI5>3.0.CO;2-V.
Dagognet, François. Les outils de la réflexion : épistémologie. Institut Synthélabo pour le progrès de la connaissance, 1999. Les empêcheurs de penser en rond. 2-84324-072-7.
Drucker, Johanna. Graphesis: visual forms of knowledge production. Harvard University Press, 2014. MetaLABprojects. 978-0-674-72493-8.
Eco, Umberto. De l’arbre au labyrinthe. Études historiques sur le signe et l’interprétation. Grasset, 2010. 978-2-246-74851-9.
Goody, Jack. La Raison graphique : la domestication de la pensée sauvage. Les Editions de Minuit, 1979. 978-2-7073-0240-3.
Jacob, Christian. L’empire des cartes. Approche théorique de la cartographie à travers l’histoire. Albin Michel, 1992.
Latour, Bruno. « Pensée retenue, pensée distribuée ». Dans : Jacob, Christian (dir.), Lieux de savoir. Albin Michel, 2007, p. 605‑615.
Meyriat, Jean. « Document, documentation, documentologie ». Dans : Couzinet, Viviane (dir.), Jean Meyriat, théoricien et praticien de l’information-documentation. ADBS Éditions, 2001 [1981], p. 143‑159.
Mounier, Pierre. Les humanités numériques : une histoire critique. Éditions de la Maison des sciences de l’homme, 2018. Interventions. 978-2-7351-2483-1. http://books.openedition.org/editionsmsh/12006.
Otlet, Paul. Traité de documentation. Le livre sur le livre. Les Impressions nouvelles, 2015 [1934]. 978-2-87449-299-0.
Rayward, W. Boyd. The universe of information: the work of Paul Otlet for documentation and international organisation. All-Union Institute for Scientific and Technical Information, 1975.
Van Acker, Wouter. Universalism as utopia : a historical study of the schemes and schemas of Paul Otlet (1868-1944). Thèse de doctorat. Ghent University, 2011. http://hdl.handle.net/1854/LU-1942681.