Cliquez sur un nœud du graphe ou dans un élément de l'index pour ouvrir une fiche.
4CAT - Capture and Analysis Toolkit
4CAT est un outil permettant de créer et d’analyser des fichiers de données à partir d’une variété de forums et de plateformes web.
Site web (connexion nécessaire) : https://4cat.oilab.nl/login/?next=%2F
Présentation de l'outil : https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3914892
ABES
L’ABES, Agence Bibliographique de l’Enseignement Supérieur, est un établissement public à caractère administratif créé en 1994 et sous tutelle du Ministère de l’Enseignement supérieur et de la Recherche pour la mise en œuvre du SUDOC (Système Universitaire de Documentation).
Depuis, ses missions se sont développées. Elle fournit ainsi un ensemble d’outils de signalement et d’administration de leurs ressources documentaires aux établissements de l’enseignement supérieur et de la recherche. On compte ainsi le moteur de recherche thèses.fr, le catalogue Calames, le référentiel IdRef, la gestion de l’attribution des numéros ISIL pour les bibliothèques.
Site web : https://abes.fr/
Accessibilité des données
Il s’agit de garantir l’accès et la pérennité des données. Cette accessibilité est généralement assurée par des développements informatiques réalisés à partir de logiciels open source, et à partir de librairies sans dépendances, ou que l’on peut facilement remplacer. Elle est aussi assurée par un choix de format d’encodage des données, format qui doit être ouvert, documenté et utilisé par une communauté.
ADT
L'Analyse de Données Textuelles (ADT) est l'exploration d'un ensemble de textes établi comme données organisées, structurées. L'ADT est une appproche utilisée en SHS. Ses méthodes sont diverses et variées : statistique exploratoire, visualisations, approches quantitatives ou qualitatives.
Agora Project
Outil de travail collaboratif permettant de créer un espace en ligne pour une équipe et partager des fichiers, un fil d’actualité, un agenda, des notes, etc., pour communiquer facilement autour d’un projet commun.
Site web : https://www.agora-project.net.
Alignement
Fait de positionner un élément d’une certaine façon par rapport aux autres.
En linguistique, on parle d’aligner des éléments textuels de versions ou de langues différentes, pour repérer automatiquement les transformations. Par extension, on parle d’alignement pour la correspondance entre du texte dans une image et sa version textuelle transcrite. En informatique, l’alignement désigne la mise en correspondance et le lissage par rapport à un standard et en bibliothèque l’alignement peut aussi désigner le fait de faire correspondre les entrées de deux référentiels ou thésaurus.
Altmetrics
Les altmetrics sont des mesures alternatives quantitatives d’impact de la production scientifique sur Internet qui complètent les mesures bibliométriques traditionnelles telles que le facteur d’impact.
Elles s’appuient sur les médias et les plateformes sociales comme Twitter, Facebook, Research Gate, HAL pour calculer le nombre de partage d’une publication scientifique dans les réseaux sociaux, le nombre de téléchargement ou de vues, le nombre de sauvegardes ou encore le nombre de conversations mentionnant un article ou un auteur.
ALTO
Standard XML documentaire permettant de décrire la mise en page physique et la structure logique d'une page de document analysée par reconnaissance optique de caractères (OCR).
Amazon Related Product Graph
Il s’agit d’un script PHP qui permet d’entrer dans un ensemble d’ASIN (Amazon Standard Identification Number) et de récupérer leurs recommandations.
Site web : https://github.com/digitalmethodsinitiative/dmi-amazon-recscraper
Analec
Analec est un logiciel d’annotation et d’analyse de corpus écrits.
Site web : https://www.lattice.cnrs.fr/ressources/logiciels/analec/
AnaText
AnaText est un outil en ligne permettant d’analyser des textes par simple copier-coller. Il est notamment utilisé pour l’initiation à l’exploration de corpus. Il peut traiter des textes de langues variées (une dizaine) et contrairement à AntConc, il affiche la catégorie et le lemme du mot analysé.
Site web : http://phraseotext.univ-grenoble-alpes.fr/anaText/
Ancre
Une ancre est l’endroit de destination d’un lien au sein d’une page web ; cela permet de se rendre directement à un emplacement précis de la page.
ANNIS
ANNIS est un outil de recherche et de visualisation destiné aux corpus complexes caractérisés par plusieurs niveaux linguistiques. Il permet également d’annoter les données.
Site web : https://corpus-tools.org/annis/
Annotation
L’annotation est ce qui se rajoute au texte. Cet ajout est localisé, à savoir qu’il s’agit de l’adjonction in situ, sur une représentation particulière du texte.
L'annotation peut être de nature explicative ou critique. Elle commente et ne décrit pas. L’annotation est dans l’encodage une strate supplémentaire à la documentation.
ANTA
ANTA (Actor Network Text Analyzer) est un logiciel d’analyse de corpus textuel de taille moyenne. Il permet d’extraire les occurrences d’expressions dans les textes d’un corpus et de créer des réseaux de cooccurrences de textes et d’expressions.
Site web : https://medialab.sciencespo.fr/outils/anta-actor-network-text-analyzer/
AntConc
AntConc est un logiciel d’analyse textuelle spécialisé dans les concordances.
Voir aussi : AnaText
Anvil
Anvil est un outil d’annotations à plusieurs niveaux de vidéos. Il peut être utilisé dans plusieurs disciplines comme la linguistique, l’anthropologie ou encore la psychothérapie.
Site web : http://www.anvil-software.org
Anystyle.io
AnyStyle permet de séquencer semi-automatiquement une bibliographie rédigée au format électronique et la verser dans les champs structurés de Zotero ou de Endnote.
Site web : https://anystyle.io/
Tutoriel : https://youtu.be/Jqhtsib5yGY
API
Le rôle d’une API (Application Programming Interface) ou interface de programmation est de fournir une bibliothèque d’outils (fonctions, objets, programmes) permettant l’interaction entre d’autres entités informatiques (serveurs, programmes, services).
App Tracker Explorer
Il s’agit d’un outil permettant de détecter les empreintes de technologies de traçages ou d’autres bibliothèques de code au sein de fichiers APK (Android Package Kit ou format de fichier conçu pour le système d’exploitation android).
Voir aussi : Tracker tracker
Site web : https://tools.digitalmethods.net/beta/appTrackers/
Application
En informatique, une application est un programme utilisé pour réaliser une tâche ou un ensemble de tâches. Le terme est synonyme de logiciel. Un éditeur de texte, un jeu vidéo, un navigateur web sont des applications ; elles ont besoin des services d’un système d’exploitation pour fonctionner.
Arbil
Arbil est un outil permettant d’organiser et d’éditer les données de la recherche ainsi que leurs métadonnées dans un format approprié pour l’archivage. Il peut être utilisé à distance et hors ligne et les données peuvent être entrées à n’importe quel moment, en partie ou en bloc.
Site web : https://archive.mpi.nl/forums/t/arbil-information-manuals-download/1045
ArcGIS
Logiciel de Système d'Information Géographique bureautique lancé en 1999 par ESRI, ArcGIS est la solution commerciale leader sur le marché (pour OS Windows). Il propose une solution complète pour collecter, organiser, gérer, analyser, communiquer et diffuser des informations géographiques. De plus, il offre de nombreuses extensions, ainsi que la possibilité d'écrire des scripts en langage Python. ArcGIS Pro en est le dernier développement, conçu pour remplacer progressivement les versions précédentes.
Site web : https://www.esrifrance.fr/about-arcgis.aspx
Archivage
L'archivage est la gestion, le classement et la conservation d'objets, par exemple les corpus.
Archivage numérique
L’archivage de contenus électroniques est l’ensemble des actions, outils et méthodes mis en œuvre pour réunir, identifier, sélectionner, classer, détruire et conserver des contenus électroniques, sur un support sécurisé, dans le but de les exploiter et de les rendre accessibles dans le temps, que ce soit à titre de preuve (en cas d’obligations légales notamment ou de litiges) ou à titre informatif.
Le contenu archivé est considéré comme figé et ne peut donc être modifié. Ceci est notamment possible en garantissant l'authenticité via l’empreinte électronique, la signature électronique, la traçabilité des accès et bien d'autres moyens. La durée de l’archivage est fonction de la valeur du contenu et porte le plus souvent sur du moyen ou long terme.
Voir aussi : Archivage, Archivage pérenne
Archivage pérenne
L’archivage pérenne a pour but de conserver le document, de le rendre accessible et d’en préserver l’intelligibilité. Ce type d’archivage fait face à quatre risques principaux : l’obsolescence du matériel, celle des logiciels, celle du format de fichier ainsi que la perte de la signification du contenu.
Voir aussi : Archivage, Archivage numérique
Site web du CINES, proposant des solutions d'archivage pérenne de données électroniques : https://www.cines.fr
Archive ouverte
Une archive ouverte est un réservoir web où sont déposées des publications issues de la recherche scientifique et de l’enseignement dont l’accès est libre et gratuit.
Elle peut être institutionnelle (ex. OATAO de l’ Université de Toulouse), régionale (ex. OpenAIRE pour l’Europe), nationale (HAL pour la France) ou disciplinaire (ex. arXiv en Physique, RePEC en Economie).
Voir OpenAIRE, HAL, Science ouverte
Argos
Argos est un outil en ligne développé par OpenAIRE qui permet de créer et de publier des plans de gestion des données (ou PGD).
Site web : https://argos.openaire.eu/splash/
ARIES
ARIES (Art and images exploration space) est une plateforme web d’exploration et d’organisation d’images pour les chercheurs en histoire de l’art. Il permet de créer un projet où regrouper des images afin de les comparer. Ces comparaisons peuvent se faire sur l’iconographie en superposant les images grâce à un système de transparence, sur les dimensions des tableaux en mettant à l’échelle les représentations les unes par rapport aux autres d’après les métadonnées, ou encore sur l’évolution d’une représentation en créant des frises chronologiques également depuis les métadonnées.
Site web : https://artimageexplorationspace.com/
ARK
ARK (Archival Resource Key) est un système d’identifiants pérennes créé par la California Digital Library. Il permet d’identifier des objets de tous types : physiques (livres, tables), numériques (livres numériques) ou immatériels (concepts).
Voir DOI
Artoos.js
Artoos.js est un bookmarklet (programme en javascript qui s'exécute dans un navigateur) qui injecte dans n’importe quelle page de navigateur des utilitaires JavaScript aidant à scraper (= extraire du contenu de sites web de manière automatique).
Voir aussi : Web scraping
Site web : https://medialab.github.io/artoo/
ASCII American Standard Code for Information Interchange
L'American Standard Code for Information Interchange (ASCII) est un système d'encodage des caractères reposant sur un code de 7 bits et définissant 128 caractères. L’encodage se compose de 33 caractères non imprimables et 95 caractères imprimables et comprend des lettres, des signes de ponctuation, des chiffres ainsi que des caractères de contrôle Unicode.
Il est utilisé pour les mails ou les noms de domaines informatiques, mais il a également servi à créer des images à partir de ces caractères dans le cadre de l'ASCII art.
Ayant droit
L'ayant droit est une personne bénéficiant d'un droit sur un document en raison de sa situation juridique, fiscale, financière, ou d'un lien familial avec le bénéficiaire direct de ce droit.
Ainsi un fonds peut être la propriété matérielle d’une bibliothèque (ex. le fonds Foucault conservé au département des Manuscrits de la BnF) mais la propriété intellectuelle reste aux ayants droit d’un auteur. Dans le cadre de projets d’édition numérique, il faut donc demander l’autorisation de diffuser le fonds sous forme de reproduction numérique aux ayants droits et au lieu de conservation.
Voir Droit d’auteur.
Bacon
Base de connaissances nationale, BACON constitue un entrepôt de métadonnées de référence sous licence CC0. Elle collecte, corrige, enrichit et diffuse les métadonnées des ressources électroniques disponibles.
Son but est ainsi d’optimiser le signalement des ressources électroniques pour en faciliter l’accès et de favoriser le partage des métadonnées entre les acteurs de la communication scientifique tels que les éditeurs et les bibliothèques.
Site web : https://bacon.abes.fr/index.html
Balise
La balise est une marque que l’on utilise dans les langages informatiques afin de signaler une spécificité descriptive (exemple : italique, gras…) ou pour commander une action à un logiciel. Le langage HTML utilise des balises pour mettre en forme le texte, le XML fait de même mais avec une couche interprétative de ce contenu.
La balise se matérialise par des chevrons ouvrants et fermants, elle est souvent double avec une balise ouvrante et une balise fermante (exemple : <p>texte</p>) ou se compose d’une balise unique qui souvent se termine par un / (exemple : <br/> pour le retour à la ligne qui est par définition unique). Les balises ne sont pas visibles à l’écran mais elles sont consultables en demandant au navigateur l’affichage du code source de la page.
BaObab
BaObab constitue la boîte à outils de Biblissima. Il s’agit d’un répertoire de ressources, d’outils, de tutoriels et de manuels qui fournissent un appui à la collecte et à la production de données dans les domaines couverts par Biblissima (circulation des textes, transmission des savoirs en Europe du VIIIè au XVIIIè siècle, l’environnement et l’avenir des bibliothèques).
Site web : https://baobab.biblissima.fr
BAP D
Les métiers des ingénieurs et personnels techniques de recherche et de formation (ITRF) et des ingénieurs et personnels techniques de la recherche (ITA) sont décrits dans le répertoire des branches d’activités professionnelles (BAP) et des emplois-types, dénommé RéFérens (REFérentiel des Emplois-types de la recherche et de l’Enseignement Supérieur). La BAP D Sciences humaines et sociales comprend quatre familles d'activités professionnelles : production, traitement et analyse de données ; sciences de l'information géographique ; analyse des sources historiques et culturelles ; recueil et analyse des sources archéologiques. Ces familles d'activités sont découpées en emplois-types suivant quatre grades : ingénieur de recherche, ingénieur d'étude, assistant ingénieur et technicien. À chacun de ces grades correspondent des possibilités d'accompagnement des équipes de recherche en SHS.
Source : https://data.enseignementsup-recherche.gouv.fr/pages/la_bap/?refine.referens_bap_id=D
La liste nationale officielle des experts ITRF de la BAP D est disponible ici : https://www.enseignementsup-recherche.gouv.fr/fr/recrutements/itrf/experts.
BASE
BASE (Bielefeld Academic Search Engine) est un moteur de recherche scientifique, spécialisé dans le moissonnage des bases de données académiques en libre accès. Il est géré par la bibliothèque de l’Université de Bielefeld en Allemagne. Il collecte, met aux normes et indexe les données respectant le protocole OAI-PMH.
Les sources académiques moissonnées ne sont pas choisies par un algorithme mais sélectionnées par des professionnels.
Site web : https://www.base-search.net
Base de données
Une base de données est une collection d'informations destinée à stocker des données de façon structurée. Le logiciel de gestion de bases de données (ou SGBD) permet de gérer les données qu'elle contient (insertion, suppression, modification, interrogation ou extraction).
L'architecture traditionnelle qui s'est imposée dans les années 1970 est celle des bases de données relationnelles : les données y sont organisées en tableaux interreliés (correspondant à des entités distinctes), avec les colonnes représentant des types de données (champs) et les lignes des ensembles cohérents de données (enregistrements). Ce modèle reste encore aujourd'hui dominant, même si d'autres approches, plus souples et plus modulaires, émergent depuis 2010 (NoSQL notamment).
Voir aussi l'outil Heurist.
BaseX
BaseX est un logiciel open source de gestion de base de données XML. Il utilise le langage de requête X-Query. BaseX contient une interface utilisateur graphique (GUI – graphical user interface), permettant de réaliser des visualisations de données. Son code source est hébergé sur GitHub.
Site web : https://basex.org/
Voir aussi : eXist
Bibliothèque numérique
Une bibliothèque numérique (virtuelle ou en ligne ou électronique) est une collection de ressources (textes, images, sons) numériques (c'est-à-dire numérisées ou nées numériques) accessibles à distance (en particulier via Internet), proposant différentes modalités d'accès et de consultation à l'information à des publics différents. La bibliothèque virtuelle regroupe donc un ensemble de ressources et de services dématérialisés.
Parmi les bibliothèques numériques, voir OMEKA.
Biblissima
Équipement d’excellence, Biblissima fédère et structure un ensemble de corpus numériques de données scientifiques sur l’histoire de la circulation des textes en Occident du Moyen Âge à la fin de l’Ancien Régime. Il propose des outils (portail, bibliothèque numérique, etc.) et des contenus.
Site web : https://projet.biblissima.fr
BMP
Le BMP ou bitmap est un format d’image matricielle, simple à utiliser et à développer et lisible par presque tous les éditeurs d’images et les visualiseurs. Un fichier bitmap (nom.bmp) est un fichier d’image graphique qui stocke les pixels sous la forme d’un tableau de points et qui gère les couleurs. Ce fichier bitmap se compose de l’en-tête du fichier, de la palette de couleurs et des données relatives à l’image.
Le format BMP ne dégrade pas l’image et s’avère par conséquent très lourd. Il est peu compressé même si cela est possible grâce au système de compression RLE.
BnF pour les professionnels
La bibliothèque nationale de France met à disposition des professionnels de la documentation (normes, formats, données d’autorité, guides de bonnes pratiques, etc.).
Sites web : https://www.bnf.fr/fr/Signaler - https://www.bnf.fr/fr/outils-de-la-numerisation
BrightBeam
Outil numérique permettant la capture et l’inspection interactive les trackers “third-party” rencontrés pendant la navigation.
Site web : https://github.com/digitalmethodsinitiative/brightbeam
Bubble Lines
Bubbles Lines est un outil permettant d’entrer des tags et des valeurs pour produire des bulles proportionnées en fonction des données, sous la forme d’un fichier SVG.
Voir aussi : Visualisation de données
Site web : https://tools.digitalmethods.net/beta/bubbleline/
BVH
Le programme « Bibliothèques Virtuelles Humanistes », porté par l’université de Tours, diffuse des documents patrimoniaux (bibliothèque numérique) et poursuit des recherches associant des compétences en sciences humaines et en informatique.
Site web : <http://www.bvh.univ-tours.fr >
Calames
Géré par l’ABES, Calames (Catalogue en ligne des archives et des manuscrits de l’enseignement supérieur) est le catalogue des archives et des manuscrits présents dans les bibliothèques universitaires, de grands établissements nationaux comme l’Institut de France et des établissements de recherche.
Site web : http://www.calames.abes.fr/pub/
Calenda
plateforme communautaire académique en ligne dédiée à l’actualité de la recherche en lettres et sciences humaines et sociales. Elle publie des annonces de colloques, les programmes de séminaires, les cycles de conférences, les propositions d’emploi et les appels à contribution.
Site web : https://calenda.org
Canvas
Canvas est une plateforme en ligne qui permet aux utilisateurs de concevoir des flyers, des vidéos, des documents, des présentations ou des sites web.
Le site propose des modèles à utiliser et il permet à des personnes n'étant pas "designer" de concevoir des présentations dynamiques et personnalisées.
Site web : https://www.canva.com/
Tutoriel : https://www.youtube.com/watch?v=_XOWhA1dK7Y
CAQDAS
Un CAQDAS (Computer Aided Qualitative Data Analysis Systems) est un outil permettant l'analyse de données qualitatives. Il existe toute une série de logiciels de ce type, payants (comme par exemple NVivo) ou gratuits (comme par exemple WeftQDA, TamsAnalyser).
En savoir plus : http://triangle.ens-lyon.fr/spip.php?article5120
Présentation des logiciels gratuits CAQDAS : https://guides.library.illinois.edu/c.php?g=348074&p=2346107
Carte
« La carte est une représentation géométrique conventionnelle, généralement plane, en positions relatives, de phénomènes concrets ou abstraits, localisables dans l’espace ; c’est aussi un document portant cette représentation ou une partie de cette représentation sous forme d’une figure manuscrite, imprimée ou réalisée par tout autre moyen. »
Comité français de Cartographie (CFC), 1990.
Voir Cartographie.
Cartographie
Ensemble des études et opérations scientifiques, artistiques et techniques, intervenant dans l’élaboration d’une carte, d’un plan ou autre mode d’expression, à partir des résultats d’observations directes ou de l’exploitation d’une documentation, ainsi que dans leur utilisation.
Voir Carte.
Cartomundi
Cartomundi est une cartothèque numérique proposant en ligne des numérisations de cartes historiques appartenant à différentes institutions européennes (France, Allemagne, Italie, Autriche, et République Tchèque).
Site web : http://www.cartomundi.fr/site/
Voir aussi : OldMapsOnline
Catwalk
Catwalk est un outil d’exploration et de sélection de tweets pour les SHS.
CCSD
Le CCSD (Centre pour la Communication Scientifique Directe) a été créé par le CNRS en 2000 pour mettre au point à destination de la communauté des chercheurs des outils pour l’archivage, la diffusion et la valorisation des publications et des données scientifiques. C’est lui qui a créé et qui développe et administre toujours l’archive ouverte HAL, la plateforme de gestion de colloques SciencesConf ainsi que la plateforme de gestion d’épi-revues Episciences.
Site web : https://www.ccsd.cnrs.fr
CD-ROM
Un CD-ROM ou Cédérom (Compact Disk Read Only Memory) est un disque compact où sont stockées des données telles que des texte, des images et des sons et qui se lit au moyen d’un ordinateur.
Censorship Explorer
Censorship Explorer est un outil qui permet de savoir si une URL est censurée dans un pays donné.
Champ
Un champ est l’information élémentaire d’une base de données, il équivaut à la colonne d’un tableau. En programmation, on peut également le définir comme la propriété d’un objet.
Chronocarto
Chronocarto est un web-SIG développé depuis 2006 par le laboratoire AOROC pour la représentation de données cartographiques en archéologie. Il a été conçu pour permettre un travail de réflexion en réseau entre chercheurs, non spécialistes de SIG, depuis la phase d’acquisition jusqu’à celle de l’enrichissement de documents existants en ligne.
Autour de l'outil de Web-SIG s'est constitué un portail dont le but est de favoriser le moissonnage des données par le développement d’une gestion multimédia, par des moteurs de recherche et par la cartographie spatiale de ces données. Il vise à rendre les données facilement interrogeables et à mettre au point une vision simple de toute la documentation quelle que soit sa localisation sur le net.
Site web : https://www.chronocarto.eu
Présentation détaillée : https://www.openscience.fr/Chronocarto-un-Web-SIG-libre-pour-les-archeologues-pas-seulement
CIDOC-CRM
Le Modèle Conceptuel de Référence du CIDOC (le Comité International pour la DOCumentation du conseil international des musées), est une ontologie informatique qui définit un modèle de structuration des données patrimoniales et leurs relations. Les institutions patrimoniales utilisant cette ontologie permettent ainsi à leurs systèmes d’être interopérables et de partager des données entre-elles. Le CIDOC-CMR est aujourd’hui une norme ISO 21127:2014.
Site web : https://www.cidoc-crm.org/
CINES
Le CINES (Centre Informatique National de l’Enseignement Supérieur) est un établissement public national à caractère administratif. Il est chargé d’assurer un service informatique à destination des établissements publics d’enseignement supérieur et des organismes de recherche.
Il intervient plus précisément dans trois domaines : le calcul numérique intensif, l’archivage pérenne de données électroniques et l’hébergement de matériels informatiques à vocation nationale comme les serveurs de l’ABES par exemple.
Site web : https://www.cines.fr
CIRIS
CIRIS est une base de données bibliographiques collaborative qui recense et décrit les éditions anciennes et récentes des textes non documentaires de l’Antiquité gréco-latine.
Site web : https://ciris.huma-num.fr
CitEc
CitEc est un outil qui fournit une analyse des citations pour tout document diffusé sur la bibliothèque numérique RePec, spécialisée en économie. La liste des références présentes dans chaque document est automatiquement extraite ce qui permet de savoir quels documents ont été cités, combien de fois et par qui.
Site web :< http://citec.repec.org>
CLARIN
CLARIN (Common Language Resources and Technology Infrastructure) : infrastructure de recherche européenne pour les ressources linguistiques et la technologie, dont l’objectif est de fédérer les efforts européens faits autour des données de langage, pour toutes les langues, à destination de toutes les disciplines.
CLARIN met les ressources linguistiques numériques à la disposition des universitaires, des chercheurs, des étudiants et des citoyens-chercheurs de toutes les disciplines, en particulier dans les sciences humaines et sociales, grâce à un accès par connexion unique. CLARIN offre des solutions et des services technologiques à long terme pour le déploiement, la connexion, l'analyse et la maintenance des données et des outils linguistiques numériques.
CLARIN soutient les chercheurs qui veulent s'engager dans une recherche de pointe axée sur les données, contribuant ainsi à un véritable espace européen de la recherche multilingue.
Site web : https://www.clarin.eu/
Services proposés par CLARIN : https://www.clarin.eu/content/services
Classification
Une classification est un système de répartition en classes, en catégories, d’êtres, d’objets, de notions ayant un ou plusieurs caractères communs dans le but, notamment, d’en faciliter l’étude.
Dans le domaine des bibliothèques, une classification est un système de répartition des connaissances selon un ordre déterminé. Il existe plusieurs classifications (Dewey, CDU, etc.) ; elles peuvent concerner l’ensemble des connaissances et des activités humaines ou une partie plus restreinte.
CMS
Il s'agit d'une technologie sous-jacente à de nombreux sites. Le CMS (Content Management System) est un système d’interfaces qui permet de gérer la conception et la gestion d’un site sans avoir besoin de trop de connaissances en informatique. Par contre, la mise en forme du site, appelée souvent thème, demande des compétences en HTML et en d’autres langages internet.
Le CMS sert essentiellement à diffuser du contenu rédactionnel sous forme de billets ou d’actualités mais ce n’est ni une base de données permettant l’exploitation des données ni un éditeur numérique permettant de faire de l’édition scientifique poussée.
Drupal, Wordpress, Omeka et Joomla peuvent être cités parmi les CMS open source les plus connus.
CNIL
Commission Nationale de l’Informatique et des Libertés, autorité administrative indépendante. Elle vise à protéger les données personnes, à accompagner l’innovation et à préserver les libertés individuelles.
Voir : RGPD
Site web : Site de la CNIL
CoCoON
CoCoON est une plateforme de "COllections de COrpus Oraux Numériques". Elle aide à la création, la structuration et l'archivage de corpus oraux.
Un corpus se compose d'enregistrements (données audio) et d'annotations.
Site web : https://cocoon.huma-num.fr/exist/crdo/
CodiMD
CodiMD est une plateforme collaborative d’édition de texte en Markdown. Elle sert à partager des notes avec des collaborateurs. Cette plateforme permet à la fois d’écrire du texte, mais aussi de réaliser des schémas, diagrammes, graphiques, tableaux etc. et d’insérer des vidéos ou des pdf, et même des formules mathématiques codées en LaTeX.
Site web : https://codimd.math.cnrs.fr/
Collaboratif
Dispositif qui vise à faciliter la collaboration de différents participants ou publics grâce à des outils informatiques adaptés au partage et à l’échange d’information. On parle aussi de système contributif ou participatif et de Crowdsourcing. Une problématique majeure de ce type de dispositif est la modération des contenus proposés.
Collatinus
Collatinus est un logiciel libre, gratuit et multi-plateforme. Il s’agit d’un lemmatiseur et d’un analyseur morphologique de textes latins. A partir d’un texte latin, l’application propose quatre onglets d’analyse : lexiques, dictionnaires, scansions, flexions. Collatinus-web constitue quant à lui la version web du logiciel Collatinus.
Voir Eulexis pour les textes grecs.
Sites web : https://outils.biblissima.fr/fr/collatinus/ ; https://outils.biblissima.fr/fr/collatinus-web/
CollEc
CollEc est un service fourni par RePec qui évalue et analyse les réseaux de co-auteurs de la littérature économique.
Site web : https://collec.repec.org/app/collec_app
Collective Access
CollectiveAccess est un logiciel open source pour le catalogage et la publication en ligne de collections muséales ou archivistiques. Ce logiciel est full-web, ce que le rend accessible à distance via un navigateur web. Il repose sur le modèle de la base de données relationnelle Access développé par Microsoft.
Site web : https://www.collectiveaccess.org/
Collex-Persée
Collex-Persée est un groupement d’intérêt scientifique (GIS) co-piloté par la bibliothèque nationale universitaire de Strasbourg et le ministère de l’enseignement supérieur et de la recherche. Il regroupe vingt-et-un établissements (universités, Bnf, ABES, Persée, etc.) et une centaine de structures dont les collections documentaires ont été labellisées « collection d’excellence ».
Ce GIS s’organise comme une infrastructure de recherche en informations scientifiques et techniques dont le but est de favoriser la fréquentation des collections des bibliothèques tout en développant de nouveaux services aux chercheurs.
Il se donne plusieurs autres missions : porter une politique nationale de numérisation des documents, rendre visibles les collections par le référencement, enrichir l’offre documentaire par la négociation de ressources sous licences, labelliser les collections d’excellence pour la recherche.
Site web : https://www.collexpersee.eu
Colors for Data Scientists
Il s’agit d’un outil qui génère et affine des palettes de couleurs pour la visualisation de données scientifiques.
Site web : https://medialab.github.io/iwanthue/
Commentaire
Dans le domaine documentaire, il s'agit d'une explication, interprétation ou analyse d’un texte ; notes et éclaircissements destinés à faciliter l’intelligence d’un texte.
Dans le cadre des outils collaboratifs ou des blogs, le commentaire est une réaction à une contribution.
Voir Annotation et Collaboratif
Community Manager
Le Community Manager est un professionnel des communautés en ligne qu’il est chargé de fédérer et d’animer pour le compte d’une entreprise, d’une institution ou encore d’une association.
Une de ses missions principales consiste à développer et gérer la présence de son employeur sur les médias sociaux.
Compare Lists
Compare Lists est un outil permettant de comparer deux listes d’URLs pour découvrir leurs points communs et leurs différences.
Compare Networks Over Time
Il s’agit d’un outil qui compare dans le temps les réseaux établis par l’outil IssueCrawler et qui expose une liste hiérarchisée d’acteurs. Il est conseillé d’utiliser parallèlement Compare Networks Over Time et IssueCrawler.
Site web : https://tools.digitalmethods.net/beta/ic/comparenetworksovertime/
ConcQuest
ConcQuest est un logiciel, plus précisément un concordancier, consacré à la recherche d’expressions complexes à travers des corpus monolingues et multilingues alignés. Cette recherche peut s’effectuer selon divers critères comme les formes, les lemmes, les catégories, les traits morphosyntaxiques.
Ce logiciel permet également la recherche d’expressions discontinues, l’extraction de statistiques d'occurrences. Il comporte d’autres fonctionnalités décrites à l’adresse du site web.
Consortium
Association d’institutions, de structures ou de partenaires individuels, constituée dans le but de réaliser un projet commun.
Consortium CAHIER
Le consortium « CAHIER » (Corpus d’auteurs pour les Humanités. Informatisation, édition, recherche) est un consortium interdisciplinaire de projets numériques, en accès libre, menés principalement dans les domaines des « corpus d’auteurs », qu’ils relèvent de la littérature, de la philosophie ou d’une thématique liée à une école ou à une pratique.
Site web : http://cahier.hypotheses.org
Coordonnées géographiques
Couple de valeurs exprimées en degrés sexagésimaux ou décimaux, ou en grades, appelées longitude et latitude, exprimant la position d’un point situé à la surface de la Terre.
CoReA
CoReA (Corpus et Ressources Archéologiques) est une bibliothèque numérique qui présente et rend accessible les ressources documentaires rassemblées par le Centre Camille Jullian au cours des 40 années de recherches archéologiques en Méditerranée.
Site web : https://ccj-corea.cnrs.fr
Corpus
Recueil de documents relatifs à une discipline ou une thématique, réunis en vue de leur conservation, leur édition ou leur exploitation.
Cortext
Cortext est une plateforme d'analyse de texte qui permet la constitution et la visualisation de réseaux.
Elle maintenue par le laboratoire LISIS.
Site web : https://www.cortext.net/
Cosma
Cosma est un logiciel de visualisation de graphe documentaire. Il permet de représenter des fiches interreliées sous la forme d’un réseau interactif dans une page web.
Cosma est pensé pour les travailleurs de la connaissance. Sa fonction première est de fournir une meilleure vision globale sur un ensemble de documents interreliés, tout en proposant une modalité de partage inédite, puisque l'export (HTML) donne accès aux mêmes fonctionnalités que l'application.
Site web : https://cosma.graphlab.fr
L'exemple du glossaire de Digit_Hum : https://www.arthurperret.fr/digithum-glossaire-hn.html
CoSo
Créé en 2018, le CoSo (ou Comité pour la Science ouverte) est chargé de définir et de mettre en œuvre une politique de soutien à l’ouverture des publications et des données de la recherche à l’échelle nationale et internationale et d’en assurer la coordination entre les établissements et les communautés de chercheurs.
Outre plusieurs groupes de travail, le CoSo comprend quatre collèges - le collège des publications, celui des données de la recherche, le collège compétences et formation ainsi que le collège Europe et international.
Site web : https://www.ccsd.cnrs.fr/project/coso/
Couperin
Couperin est un consortium unifié des établissements universitaires et de recherche pour l’accès aux publications numériques qui regroupe des universités, des centres de recherches, des grandes écoles. Il se charge notamment d’évaluer, de négocier et d’organiser l’achat de ressources numériques pour ses membres tout en contribuant à redéfinir et à faire évoluer les relations contractuelles avec les éditeurs.
Couperin assure également une veille et mène une réflexion sur les enjeux de la science ouverte qu’il soutient. Il œuvre au développement de la coopération nationale, européenne et internationale en matière de documentation et de ressources électroniques.
Site web : https://www.couperin.org/
CRAN
Le Comprehensive R Archive Network (CRAN) est un site web où se trouvent les bibliothèques à télécharger pour R.
Site web : https://cran.r-project.org
Creative Commons
Publiées dès 2002, les licences Creative Commons (CC) proposent une solution légale aux personnes souhaitant offrir une autorisation non exclusive de reproduire, distribuer et communiquer une œuvre au public à titre gratuit. Elles permettent de faire apparaître clairement au public les conditions de la licence de distribution et de réutilisation de cette création.
Site web : https://creativecommons.org/share-your-work/
Crowdsourcing
Le crowdsourcing, littéralement “approvisionnement par la foule”, est une pratique de production participative visant à externaliser une activité auprès d’un large réseau d’acteurs le plus souvent anonymes ; activité ordinairement effectuée en interne par une entreprise (ou une institution) ou en externe par un prestataire désigné. Il suppose un appel ouvert à tous, sans restriction de participation et sans discrimination.
Voir Web 2.0, folksonomie, Collaboratif
CSS
Les feuilles de style en cascade (Cascading Style Sheets) ou CSS constituent un langage informatique servant à la description de la présentation des documents HTML et XML en dehors de ces mêmes documents. Ainsi, il est possible de décrire la structure d’un document en HTML et de décrire à part toute sa présentation dans une feuille de style CSS.
De cette façon, les styles ou la mise en page ne sont appliqués qu’au moment de la consultation de la page web dans un navigateur web.
Cette séparation entre structure et présentation permet de modifier plus aisément la présentation d’un document, d’en améliorer l’accessibilité, et d’en diminuer la complexité architecturale.
CSV
Le CSV (Comma-separated values) est un format de stockage des données en texte brut d’une feuille de calcul. Ce format vise la facilité du partage. Il est lisible par la plupart des logiciels de tableur. En revanche il ne permet pas l’enrichissement typographique (gras, italique, etc.) : il conserve du texte brut.
CSV Rinse Repeat
CSV Rinse Repeat est un outil en ligne permettant d’améliorer, d’explorer et de visualiser des fichiers CSV en utilisant du code javascript.
Site web : https://medialab.sciencespo.fr/outils/csv-rinse-repeat/
Curvenote
Curvenote permet d’utiliser les fichiers du Jupyter Book pour créer un site web et faire son hébergement. Cet outil possède aussi une interface sans code qui permet de publier des articles dans un site internet (comme dans un blog) au format texte à partir de templates et de les exporter en format PDF ou en LaTeX.
Site Web : https://curvenote.com/
Tutoriel : https://www.youtube.com/watch?v=ZQTiAc2UXnk&t=2253s&ab_channel=curvenote
D3.js
D3.js est une bibliothèque Javascript permettant de publier des visualisations de données interactives dans des documents et pages web. Cet outil s'appuie sur les langages HTML et CSS ainsi que le format SVG. De plus, c'est un outil libre.
Site web (comprenant des exemples) : https://d3js.org/
Tutoriels : https://riptutorial.com/fr/d3-js
DARIAH
DARIAH (Digital Research Infrastructure for the Arts and Humanities) est une infrastructure paneuropéenne pour les chercheurs en arts et en sciences humaines qui travaillent avec des méthodes de calcul.
Elle soutient la recherche numérique ainsi que l'enseignement des méthodes de recherche numérique.
Site web : https://www.dariah.eu/
Services proposés par DARIAH : https://www.dariah.eu/tools-services/tools-and-services/
Lien vers la bibliothèque zotero du réseau DARIAH ERIC :https://www.zotero.org/groups/113737/doing_digital_humanities_-_a_dariah_bibliography
DART-Europe
Créé en 2005, DART-Europe est un partenariat entre bibliothèques nationales et universitaires et établissements européens d’enseignement supérieur qui fournit un portail d’accès aux thèses électroniques de 29 pays européens.
Site web : https://www.dart-europe.org/basic-search.php
Data Bnf
La bibliothèque de France nous guide dans ses ressources en regroupant sur une même page toutes les informations issues de ses différents catalogues, ainsi que de sa bibliothèque numérique Gallica.
Le projet Data BnF vise ainsi à accroître la visibilité des données de la BnF par une meilleure exposition sur le Web, à faciliter la réutilisation des métadonnées par des tiers, à fédérer les données de la BnF au sein et au-delà des catalogues, contribuer à la coopération et à l’échange de métadonnées par la création de liens entre des ressources structurées et de confiance.
Voir Web sémantique
Site web : https://data.bnf.fr/
Data Documentation Initiative
La Data Documentation Initiative (DDI) est une norme internationale permettant de décrire les données produites par les enquêtes et autres méthodes d'observation dans le domaine des sciences sociales, comportementales, économiques et de la santé. La DDI est une norme gratuite qui permet de documenter et de gérer les différentes étapes du cycle de vie des données de recherche, telles que la conceptualisation, la collecte, le traitement, la distribution, la découverte et l'archivage.
La documentation des données avec DDI facilite la compréhension, l'interprétation et l'utilisation des données par les personnes, les systèmes logiciels et les réseaux informatiques. La norme propose des outils de description des données (DDI Codebook) et du cycle de vie des données (DDI Lifecycle), des vocabulaires contrôlés (Controlled vocabularies) ainsi que des outils de représentation des classifications statistiques (XKOS) ou encore des opérations de transformation des données (SDTL).
Data paper
Un papier de données ou articles de données est un article scientifique visant à présenter un jeu de données : la méthode d’acquisition de ces données, leur structuration, et leur potentiel de réutilisation. Ce type d’article peut être publié dans des revues classiques, ou dans des data journals qui sont spécialisés dans la publication de data paper.
Voir aussi : Plan de gestion des données, Accessibilité des données
DBpedia
DBpedia est un projet universitaire et communautaire d'exploration et d’extraction automatiques de données dérivées de Wikipédia. Son principe est de proposer une version structurée et sous forme de données normalisées au format du web sémantique des contenus de chaque fiche encyclopédique.
DBpedia vise aussi à relier à Wikipédia (et inversement) des ensembles d'autres données ouvertes provenant du Web de données.
Voir Web sémantique, Open Data.
Site web : http://fr.dbpedia.org
DeepL
Plateforme de traduction automatique multilingue (voir Intelligence artificielle).
Site web : https://www.deepl.com/fr/translator
Déploiement d’outil
Le déploiement consiste à faire passer un prototype à une version pérenne accessible en ligne et une fois cette version stabilisée, à y intégrer les données traitées ou à venir.
Dépouillement
Première étape d'une analyse documentaire : repérage et sélection d'informations contenues dans un document en fonction de critères prédéterminés.
Le dépouillement commence par la sélection des parties composantes (articles, chapitres, images, séquences, etc.) qui seront décrites et analysées en fonction de la politique documentaire.
Désambiguïser
Faire disparaître l’ambiguïté d’un mot, d’une phrase en ne retenant qu’un seul sens et/ou en donnant des formes ou des annotations spécifiques aux différents sens.
Description de document
La description est formelle et ne concerne pas l’analyse ou toute interprétation du contenu. Le premier niveau de description d'un document est constitué par l’ensemble des métadonnées qui permettent aux utilisateurs et aux moteurs de recherche de retrouver le document. Le deuxième niveau de description d'un document est le plan structurel (structuration logique de son contenu).
Voir EAD, ISBD, Indexation
DH
Liste de discussion francophone concernant les Digital Humanities (DH), ouverte à toutes les disciplines de sciences humaines et sociales. Elle fait partie des services offerts par Humanistica, l'association francophone des humanités numériques (www.humanisti.ca) mais il n'est pas nécessaire d'être membre de l'association pour s'abonner à la liste.
Site web : https://groupes.renater.fr/sympa/info/dh
Dicto
Dicto est un outil permettant de délimiter, transcrire, traduire et commenter des extraits de médias audio et vidéo. Les annotations créées peuvent éventuellement être publiées sous la forme de sites web ou de code HTML.
Site web : https://dictoapp.github.io/dicto/
Digital Methods Initiative
La Digital Methods Initiative est un groupement européen de chercheurs et de doctorants dont les recherches portent sur l’étude de l’Internet.
Pour ce faire, elle développe des outils et des méthodes qui permettent de réutiliser les dispositifs et les plateformes en ligne (youtube, twitter, facebook, google) dans une optique de recherche sur des problématiques sociales et politiques. Un grand nombre d’outils est disponible sur le site web.
Site web : https://wiki.digitalmethods.net/Dmi/DmiAbout
Diigo
Diigo est une plateforme en ligne permettant de sauvegarder des pages et des contenus web depuis un navigateur et d’y ajouter des tags et des annotations.
Diigo permet un usage personnel ou collaboratif et le contenu d’un compte diigo peut être privé ou public.
Site web : https://www.diigo.com/
Dissemin
Dissemin est une plateforme web qui récolte des métadonnées depuis différentes sources et qui détermine la disponibilité (ou non) du texte intégral des publications des chercheurs. Cet outil aide leurs auteurs à les télécharger en un clic vers un dépôt ouvert. Grâce à lui, les chercheurs peuvent donc s’assurer que leurs publications sont librement accessibles.
Il a été conçu pour encourager l’usage des dépôts (plutôt que des pages personnelles) mais n’est pas un dépôt lui-même car il ne stocke pas le texte intégral des publications. Il fournit en revanche les liens vers les articles disponibles en texte intégral.
Voir Zenodo, HAL, Science ouverte, Open Access
Site web : https://dissem.in
Dive
Dive est un logiciel d’exploration, d’analyse et de visualisation de données.
Site web : https://medialab.sciencespo.fr/outils/dive/
Django
Django est un framework web open source en Python. Il a pour but de rendre le développement d’applications web simple et basé sur la réutilisation de code.
Site web : https://www.djangoproject.com/
Tutoriel : https://www.youtube.com/watch?v=rHux0gMZ3Eg&ab_channel=ProgrammingwithMosh
DMI-TCAT
Twitter Capture and Analysis Toolset (DMI-TCAT) capture et analyse de différentes façons les données de la plateforme twitter.
DOAB
DOAB (Directory of Open Access Books) est une plateforme en ligne créée en 2012 qui indexe des livres scientifiques en libre accès, autrement dit, des livres dont le contenu a été révisé et validé par les pairs.
L’objectif principal de DOAB est ainsi d’accroître la visibilité de ces publications en libre accès. Il invite en effet les éditeurs scientifiques à fournir les métadonnées de leurs ouvrages en libre accès de façon à rendre ces métadonnées moissonnables par les catalogues de bibliothèques ou les agrégateurs de contenu.
Site web : https://directory.doabooks.org
DOAJ
Créé en 2003, DOAJ (Directory of Open Access Journals) est un annuaire en ligne qui recense les revues scientifiques en libre accès. Il recense toutes les revues quel que soit leur champ disciplinaire, leur langue ou leur origine géographique.
Il entend ainsi augmenter la visibilité, l’accessibilité, la réputation et l’utilisation des revues scientifiques en libre accès.
Voir Open Access
Site web : https://doaj.org
Document
Un document renvoie à un ensemble formé par un support et une information, celle-ci enregistrée de manière persistante. Il a une valeur explicative, descriptive ou de preuve.
DOI
Le DOI (Digital Object Identifier / identifiant d’objet numérique) est le cœur d’un mécanisme d'identification de ressources numériques, comme les revues, articles scientifiques, rapports, vidéos, etc. Il est parfois comparé aux ISSN ou ISBN pour le web, mais c'est aussi une alternative à l’instabilité des URL par l’association de la localisation du document et des métadonnées qui lui sont liées.
Un DOI unique est attribué à chaque ressource et ne sera pas réutilisé. Ex. pour la Revue Cybergeo : DOI : 10.4000/cybergeo.2373.
Voir Référencement, Interopérabilité, ARK
Données de la recherche
Selon l’OCDE « Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. ».
Les données de la recherche forment également l’ensemble des informations et des matériaux produits par les chercheurs et s’apparentent ainsi à une partie des archives de la recherche. Les données sont donc à la fois des informations collectées et produites lors d’un processus de recherche.
Voir Enrichissement des données, FAIR Data, Plan de gestion des données, Open Data.
Données structurées
Dans les langages de formatage de type XML ou HTML, les données structurées sont des informations encadrées par des balises spécifiques dans les sources des pages et qui permettent à des outils d’édition ou d’exploitation, comme les moteurs de recherche, de les interpréter d'une certaine manière. Les données structurées répondent à un schéma d’utilisation (une norme) avec des règles de balisage.
DoRANum
DoRANum est un dispositif de formation à distance fournissant des ressources d’auto-formation (fiches synthétiques, infographies, webinaires, etc.) sur la thématique de la gestion et du partage des données de la recherche.
Site web : https://doranum.fr
DROID
DROID est un logiciel d’identification automatique massive de formats de fichiers, utilisé pour l’archivage numérique. Ce logiciel est développé et maintenu par les archives nationales du Royaume-Uni.
Droit d’auteur
Le droit d’auteur se décompose en deux ensembles :
a) Les droits moraux, inaliénables, qui concernent l’intégrité de l’œuvre, le droit de retrait et de repentance. Ils ne peuvent pas être cédés.
b) Les droits patrimoniaux qui concernent l’exploitation de l’œuvre (reproduction, représentation). Ils peuvent être cédés par l’ayant droit, à l’image d’un écrivain qui cède les droits de reproduction à son éditeur. Ces droits sont possédés par l’auteur de l’œuvre protégée. Il les transmet à ses héritiers – ou ayants droit – à sa mort.
Si, en France, la durée de protection des droits patrimoniaux est de soixante-dix ans après la mort de l’auteur (sauf dérogation : les auteurs morts pour la France pendant les Guerres mondiales bénéficient de trente ans de protection supplémentaire), les droits moraux sont eux inaliénables et perdurent dans le temps.
DTD
En XML, le DTD (Document Type Definition ou Définition de Type de Document) est un fichier ou une partie de fichier qui permet de définir le modèle ou la structure d’un document.
DtmVic
DtmVic, pour Data and Text Mining : Visualisation, Inférence, Classification, est un logiciel d'analyse textométrique.
Site web : https://corli.huma-num.fr/dtmvic/
Dublin Core
Le Dublin Core est un modèle de description de tout type de ressource numérique (audio, vidéo, livre, objet) qui propose un socle de quinze éléments. Ces quinze champs sont les suivants : Titre, Créateur, Sujet, Description, Source, Éditeur, Date, Couverture, Relation, Format, Langue, Type, Identifiant, Contributeur, Droit. Devenu standard international, il permet donc l’échange de données entre différents projets ou outils et facilite l’interopérabilité des données.
Pour plus de précisions sur l’application du Dublin Core, voir la présentation très précise sur le site de la BnF.
Le Dublin Core n’impose pas de compléter tous les champs mais pour une meilleure diffusion et pérennité des données, il est important d’en remplir le plus possible. Ces champs sont tous répétables, sans aucune limite.
Voir Interopérabilité
Site web : https://dublincore.org/
Duplicate
Duplicate est un outil de la Digital Methods Initiative qui sert à répliquer les tags d’un nuage de tags en fonction de leur valeur. Il peut être utilisé pour insérer un nuage de tags préformaté dans des services de type wordle.
Site web : https://tools.digitalmethods.net/beta/deduplicate/
E-book
Livre disponible en version numérique. Il se présente sous la forme d’un fichier qui peut être téléchargé, stocké et/ou lu sur les appareils électroniques qui en permettent l’affichage et la lecture sur écran.
Les e-books utilisent souvent le format epub (electronic publication).
E-Stampage
E-Stampage est une ectypothèque numérique qui permet la consultation en ligne des collections d’estampages (empreintes moulées des inscriptions épigraphiques) produites depuis la fin du XIXè siècle lors des fouilles et études archéologiques par les épigraphistes de l'École française d’Athènes.
Site web : https://www.e-stampages.eu/s/e-stampages/page/accueil
EAC
L’EAC (Encoded Archival Context) est un type de DTD qui permet la production en XML de notices d’autorité de personnes physiques, de familles ou de collectivités.
EAD
Encoded Archival Description : standard de description archivistique qui permet d’encoder en XML un inventaire d’archives.
Site web : https://www.loc.gov/ead/
Plus d'informations : https://www.bnf.fr/fr/ead-encoded-archival-description
EasyAlign
EasyAlign est un logiciel permettant de générer et d’aligner semi-automatiquement des annotations phonétiques à partir d’une transcription.
Site web : http://latlntic.unige.ch/phonetique/easyalign.php
EconAcademics.org
EconAcademics.org est un agrégateur de blogs spécialisés dans la recherche en économie. Il s’agit d’un des services développés par RePec.
Site web : https://econacademics.org
EconPapers
EconPapers est un moteur de recherche développé par RePec qui fournit un accès à divers types de publications relatives à la discipline économique.
Site web : https://econpapers.repec.org
ECW
ECW (Enhanced Compression Wavelet) est un format de compression d’images numériques élaboré pour l’imagerie aérienne et satellitaire. Il permet de compresser de très lourdes images à haute résolution. Cela implique des pertes.
EDIRC
EDIRC est un répertoire en ligne qui recense et indexe par pays et par champs les institutions économiques du monde entier.
Voir RePec
Site web : https://edirc.repec.org
ELAN
ELAN est un logiciel de création d’annotations complexes sur des ressources audio et vidéo.
Site web : https://archive.mpi.nl/tla/elan
ELite-HTS
ELite-HTS est un logiciel de création d’annotations complexes sur des ressources audio et vidéo.
Site web : http://cental.uclouvain.be/elitehts/v1/#_all_resources
EMAN
Plateforme d'édition de manuscrits et de fonds d'archives modernes numérisées.
Site web : http://www.eman-archives.org
Empreinte numérique
En informatique, l’empreinte numérique désigne un ensemble de contrôles lié à un fichier ou à un message. Elle sert à vérifier que l’intégrité du fichier a été préservée. Elle peut également désigner l’empreinte digitale d’un appareil électronique.
Dans le domaine de la sécurité informatique, l’empreinte numérique équivaut aux données récoltées sur un système informatique distant ou encore au procédé (« prise d’empreinte de la pile TCP/IP ») permettant de connaître l’identité du système d’exploitation utilisé sur une machine distante.
EMU-SDMS
EMU Speech Database Management System (ou EMU-SDMS) est une collection d’outils dédiés à la création, la manipulation, la gestion et l’analyse de bases de données orales.
Site web : https://ips-lmu.github.io/EMU.html
Encodage
Le terme d'encodage recouvre plusieurs acceptions.
De façon générale, il s'agit de l'action de transcrire des données selon un code ou un protocole.
L'encodage est une représentation normalisée de données textuelles : c'est l’action de structurer un texte avec des balises de différents formats (HTML, TEI, EAD, etc., chaque format possédant son propre langage mais également ses propres finalités). L’encodage peut concerner aussi bien des spécifications de mise en forme que des indications de structure ou des interprétations sémantiques.
En informatique, l'encodage désigne également la représentation des caractères par un nombre hexadécimal selon une norme. UTF-8 et ISO 8859-1 sont deux correspondances fréquemment utilisées entre des caractères et leur représentation hexadécimale.
Enregistrement
Terme consacré dans les bases de données, c’est l’ensemble des valeurs d’une ligne d’un tableau contenant lui-même un certain nombre de colonnes (que sont les champs). C’est équivalent à une notice ou à une fiche.
Enrichissement des données
Ajout d’informations complémentaires pour aider la lecture, comme la normalisation des noms propres, les annotations, etc. Différents types d’enrichissements :
Enrichissement par complétion : ajout de formes normalisées de noms propres et ajout de références bibliographiques (identifiants de notices d’autorités de catalogues en ligne).
Enrichissement par annotation : ajout de commentaires sur le sens du texte rédigé, ajout de rapprochements avec d’autres documents ou avec des œuvres dites et écrites, ajout de références complémentaires, etc.
ENT
ENT (Espace Numérique de Travail ou Environnement Numérique de Travail) est un ensemble d’outils permettant à un individu d’accéder à distance aux informations relatives à son travail (dossiers, boîte mail, fichiers, etc.) et de communiquer et collaborer avec ses collègues.
Souvent, l’ENT comprend un système de gestion documentaire, un moteur de recherche et un réseau social d’entreprise. Il rend plus flexible le lieu et le temps de travail.
Entité nommée
Une entité nommée est une expression linguistique référentielle, souvent associée aux noms propres et aux descriptions définies, qui a émergé avec le besoin d’applications de recherche d’information. Les entités nommées peuvent être objet de traitements à divers degrés de finesse (détection, extraction, reconnaissance, liaison). Elles sont l’objet d’une tâche du traitement automatique du langage naturel appelée reconnaissance d’entités nommées.
Entrepôt OAI-PMH
C’est un répertoire de serveur web sur lequel les fournisseurs de données peuvent déposer leurs métadonnées en attendant qu’un robot vienne les « moissonner » afin de les intégrer à son propre catalogue. Pour cela il faut utiliser le protocole OAI-PMH.
Environnement de développement intégré (IDE)
Un environnement de développement intégré, ou IDE, est un logiciel de création d'applications, qui rassemble des outils de développement fréquemment utilisés dans une seule interface utilisateur graphique (GUI).
Un IDE se compose habituellement des éléments suivants :
Éditeur de code source : un éditeur de texte qui aide à la rédaction du code logiciel, avec des fonctions telles que la coloration syntaxique avec repères visuels, la saisie automatique en fonction du langage et la vérification de bogues dans le code pendant la rédaction.
Utilitaires d'automatisation de version locale : des utilitaires qui permettent d'automatiser des tâches simples et reproductibles lors de la création d'une version locale du logiciel à destination du développeur lui-même, par exemple la compilation du code source en code binaire, la mise en paquet du code binaire et l'exécution de tests automatisés
Débogueur : un programme qui permet de tester d'autres programmes en affichant l'emplacement des bogues dans le code d'origine
Site web : https://www.redhat.com/fr/topics/middleware/what-is-ide
Épi-revue
Une épi-revue est une revue électronique en libre accès, composée d’articles évalués par les pairs et soumis via un dépôt dans une archive ouverte telle que HAL.
Voir aussi Science ouverte
Site web d'Episciences : https://www.ccsd.cnrs.fr/epi-revues
Episciences
Episciences est une plateforme qui héberge et donne accès aux épi-revues. La soumission des articles se fait par un processus de dépôt dans une archive ouverte.
Cette plateforme est développée et administrée par le CCSD.
Site web : https://episciences.org
ERMS
ERMS (Electronic Resource Management System) est un type de logiciels conçu pour favoriser la gestion globale des ressources numériques, notamment des bouquets de périodiques électroniques et des bases de données en ligne.
Il fournit de nombreuses fonctionnalités telles que le bulletinage des périodiques, la gestion des abonnements, la gestion des droits d’utilisation, la gestion des licences et des statistiques ou encore le suivi des collections.
Il existe des ERMS libres comme CORAL ou propriétaires comme Verde.
eScriptorium
eScriptorium est une plateforme web ayant pour but de fournir un ensemble d'outils pour transcrire, annoter, et éditer numériquement des documents historiques.
eScriptorium permet :
de transcrire automatiquement des documents manuscrits ou imprimés à l'aide de techniques d'apprentissage automatique (kraken) ;
l’emploi une interface utilisateur ergonomique pour segmenter ou annoter les documents textes sous forme d’image et réaliser des transcriptions manuelles ;
la manipulation, l’échange et la conversion de documents et images de différents formats: importation et exportation des transcriptions ou annotations avec ALTO-XML ou Page XML, importation d’images au format zip , IIIF, documents PDF vers les applications eScriptorium ;
de faciliter le travail collaboratif sur les corpus de documents (annotation collaborative, partage de modèles d’IA, versioning).
Site web et ressources : https://escriptorium.fr/
Présentation : https://ephenum.hypotheses.org/1412
Eulexis
Eulexis est un logiciel libre et gratuit de lemmatisation de textes en grec ancien. Il existe également une version web de ce logiciel appelée Eulexis-web.
Il s’apparente au logiciel Collatinus qui existe pour les textes latins.
Sites web : https://outils.biblissima.fr/fr/eulexis/ ; https://outils.biblissima.fr/fr/eulexis-web/
European Association for Digital Humanities
L'Association européenne pour les humanités numériques (European Association for Digital Humanities), anciennement connue sous le nom d'Association pour l'informatique littéraire et linguistique, est une organisation dédiée aux humanités numériques fondée à Londres en 1973. L'EADH rassemble et représente les Digital Humanities en Europe à travers l'ensemble des disciplines qui recherchent, développent et appliquent les méthodes et technologies des Digital Humanities. Ces disciplines comprennent, entre autres, l'histoire de l'art, les études culturelles, l'histoire, le traitement de l'image, les études linguistiques et littéraires, les études sur les manuscrits et la musicologie. L'EADH soutient également la formation de groupes d'intérêt DH en Europe, qui sont définis par région, langue, orientation méthodologique ou autres critères.
Site web : https://eadh.org/
European Strategy Forum on Research Infrastructures
L'ESFRI, le Forum stratégique européen des infrastructures de recherche (European Strategy Forum on Research Infrastructures), est un instrument stratégique visant à développer l'intégration scientifique de l'Europe et à renforcer son rayonnement international. L'accès compétitif et ouvert à des infrastructures de recherche de haute qualité soutient la qualité des activités des scientifiques européens, et attire les meilleurs chercheurs du monde entier.
L'ESFRI est à l'avant-garde de la politique scientifique européenne et mondiale et contribue à son développement en traduisant les objectifs politiques en conseils concrets pour les infrastructures de recherche européennes. La feuille de route sur les infrastructures de recherche de l'ESFRI offre un panorama des infrastructures de recherche européennes des SHS, qu'elles soient à l'état de projet ou bien arrivées à maturité en termes d'activité. DARIAH ou CLARIN figurent par exemple sur cette feuille de route.
Site web : https://www.esfri.eu/
Evernote
Comme Pocket, Evernote est un outil de veille qui sauvegarde et agrège les pages web sélectionnées mais c’est également un outil de gestion de projet.
Chaque page enregistrée dans Evernote peut être classée grâce à l’application de tag. Evernote permet également de prendre des notes, d’y joindre des documents, de créer des carnets de notes en fonction d’un projet, d’organiser des tâches.
Site web : https://evernote.com/intl/fr/
eXist
eXist est un système de gestion de base de données open source écrit avec le langage Java. Il sert à gérer des données en XML, et permet leur stockage de manière intelligente grâce à une organisation des données en différentes collections. La fonctionnalité de requête d'eXist repose sur le langage X-Query.
Site web : http://exist-db.org/exist/apps/homepage/index.html
Voir aussi : BaseX
EXMARaLDA
EXMARaLDA est un ensemble d’outils numériques permettant la transcription, l’annotation, la gestion, la recherche et l’analyse de corpus oraux.
Site web : https://exmaralda.org/en/
Expand Tiny URLs
Il s’agit d’un outil de la Digital Methods Initiative qui permet de déplier des URLs qui ont été raccourcies par des outils tels que tinyurl.com ou bit.ly, particulièrement utilisés sur les réseaux sociaux comme twitter ou facebook.
Site web : https://tools.digitalmethods.net/beta/expandTinyUrls/
Exposition virtuelle
L’exposition virtuelle est un moyen de plus en plus utilisé par les musées, les détenteurs de fonds culturels, ainsi que les artistes pour diffuser leurs œuvres sur le web. Elle permet de créer des parcours thématiques à partir des données publiées.
Expression régulière
Les expressions régulières sont aussi appelées expressions rationnelles, regex (mis pour Regular Expression) ou expressions normales. Les expressions régulières servent à tester la présence ou l'absence d'un motif dans une chaîne de caractère. Elles sont simples à utiliser, concises et puissantes. Elles sont présentes dans de nombreux logiciels (Word, Oxygen, etc.) et langages informatiques (Python, R, etc.).
Extract URLs
Il s’agit d’un outil qui extrait les URLs issues d’un fichier IssueCrawler. Il est utile pour récupérer une liste propre et les points de départ des acteurs dans le réseau.
Site web : https://tools.digitalmethods.net/beta/ic/getXmlUrls/
FACILE
FACILE (Format d’Archivage du Cines par analyse et expertise) est un outil en ligne mis au point par le CINES servant à vérifier que le format d’un fichier est valide pour son archivage pérenne sur la plateforme PAC du CINES.
Site web : https://facile.cines.fr/
FAIR data
L’objectif des principes FAIR (Faciles à trouver, Accessibles, Interopérables, Réutilisables) est de favoriser la découverte, l’accès, l’interopérabilité et la réutilisation des données partagées.
Chaque principe FAIR se décline en un ensemble de caractéristiques que doivent présenter les données et les métadonnées pour faciliter leur découverte et leur utilisation par les hommes mais aussi par les machines.
Voir : https://www6.inrae.fr/datapartage/Produire-des-donnees-FAIR - https://www6.inrae.fr/datapartage/Produire-des-donnees-FAIR/Comment-FAIR-en-pratique
Feedly
Feedly est une application web d’organisation de veille informationnelle qui permet de gérer les flux RSS de l’internaute en les agrégeant sur sa plateforme.
Voir aussi : InoReader, Netvibes
Site web : https://feedly.com
Feuille de style
Une feuille de style est un document qui permet de gérer la présentation, la mise en forme d’un autre document, notamment d’une page web.
Elle vise à séparer la présentation et le contenu d’une page et permet d’automatiser et d’uniformiser la présentation puisqu’une même feuille de style peut s’appliquer à plusieurs documents comme les pages HTML d’un site web.
Voir CSS
Fiche
Une fiche rassemble tous les champs saisis dans un formulaire.
Fichier (bibliothèque)
Répertoire de fiches (unité organique et ordre thématique). Avant l’informatisation des catalogues des bibliothèques, ces derniers se présentaient sous forme d’ensemble de fiches, généralement appelé catalogue ou fichier papier.
Depuis les années 1990, la majorité des catalogues ont été rétroconvertis pour être consultables de manière informatique. Il est toutefois fréquent que les bibliothèques conservent leurs fichiers papier.
Voir Rétroconversion.
Fichier informatique
Un fichier informatique est un ensemble de données numériques réunies sous un même nom, enregistrées en un seul contenant sur un support de stockage permanent. Un fichier informatique a un format numérique symbolisé par une extension finale généralement en trois ou quatre lettres.
Figma
Figma est un outil utilisé par les programmeurs pour concevoir des interfaces. L'application permet aux programmeurs de visualiser leur site internet ou leur application web avant leur création.
Figma permet aussi à plusieurs personnes de collaborer en temps réel sur le design d'une même interface, fonctionnalité utile lorsque plusieurs personnes travaillent sur le même site web.
Site web : https://www.figma.com/files/recent?fuid=1174750841094760407
Tutoriel : https://www.youtube.com/watch?v=FTFaQWZBqQ8
FileMaker Pro
FileMaker Pro est un logiciel de gestion de base de données développé par FileMaker Inc. Il permet de concevoir des tables de données liées, et de gérer les données.
Site web : https://www.claris.com/filemaker/pro/
Folksonomie
Néologisme formé à partir des termes anglais « folk » et « taxonomy », la folksonomie désigne le procédé d’indexation collaborative des documents numériques sur le web par les internautes à l’aide de tags.
Voir Crowdsourcing, Web 2.0
FONIO
FONIO est un logiciel d’écriture scientifique collaborative. Il permet d’utiliser l’architecture des sites web pour structurer des arguments, de présenter des références bibliographiques de façon homogène, d’éditer un glossaire ou encore de soigner le design de la publication.
Site web : https://fonio.medialab.sciences-po.fr/demo
Format libre/propriétaire
Le format libre est un format qui n’est la propriété de personne et donc exploitable par tous (ex. : PNG, JPEG). Le format propriétaire est un format rattaché à un brevet.
L’utilisation du format propriétaire n’est pas forcément payante mais seule l’entreprise détentrice du brevet en a le monopole (ex. : PDF, TIFF). Les formats propriétaires peuvent être des formats ouverts ou fermés.
Format ouvert/fermé
Chaque format de fichier possède sa façon de coder l’information. Les spécifications techniques du fichier peuvent être rendue publiques ou non.
Un format ouvert est un format dont les spécifications sont publiées (ex. : TIFF, ODF, PDF, etc). À l’inverse, un format fermé est un format dont on ne connaît pas les spécifications techniques (ex. : Excel, Word, etc.). L’ouverture ou la documentation d’un format n’empêche pas que celui-ci soit un format propriétaire.
Formulaire
On désigne par formulaire, une interface permettant de remplir des champs ou de spécifier des actions à réaliser. Le principe du formulaire est de saisir les données puis les sauvegarder à travers un bouton « Enregistrer / Sauvegarder ».
Fouille de texte
Extraction de connaissances à l'aide de mesures statistiques ou de repérage d'unités textuelles dans un ou plusieurs textes. La fouille de texte (text mining) permet ainsi d’extraire les entités nommées.
Framework
Un framework propose une infrastructure de développement pour un informaticien afin qu’il puisse créer une application (des lignes de code permettant de réaliser des actions).
Frantext
Frantext est une base de données de textes français. Elle contient principalement des textes littéraires et philosophiques, et quelques textes scientifiques et techniques.
La base de données a été développée à l’ATILF (laboratoire d'Analyse et Traitement Informatique de la Langue Française) dans l'optique de servir de réservoir d'exemples pour le Trésor de la Langue Française (TLF). Actuellement, elle est disponible en ligne. Elle est utilisée, par exemple, par les linguistes comme source d'exemples pour illustrer des faits de langue. Elle permet de faire des recherches simples et complexes sur des formes, des lemmes ou des catégories grammaticales.
Site web : https://www.frantext.fr/
Frantiq
Frantiq (Fédération et Ressources sur l’Antiquité) a été créée en 1984 et rassemble aujourd’hui une quarantaine d’unités mixtes du CNRS, des services du ministère de la Culture, des musées d’archéologie et des collectivités territoriales et autres acteurs publics.
Elle se donne pour mission de favoriser et faciliter un accès centralisé aux ressources documentaires spécialisées.
La fédération a mis au point plusieurs services à destination des archéologues : un catalogue collectif indexé, le thésaurus PACTOLS, le logiciel libre de gestion de thésaurus Opentheso et le portail Frantiq.
Site web : https://www.frantiq.fr/frantiq/missions/
FRBR
Modèle conceptuel de description bibliographique utilisé en bibliothèque. Il décompose la notice bibliographique comme un ensemble d’informations correspondant à 4 niveaux d’analyse : Item, Manifestation, Expression, Œuvre.
Voir : http://www.bnf.fr/fr/professionnels/modelisation_ontologies/a.modele_FRBR.html
Freeplane
Freeplane est un logiciel gratuit de cartes heuristiques, développé sous licence publique générale GNU. Il repose sur le langage de programmation Java, et peut être exécuté localement ou à partir d’un dispositif portable (USB par exemple). Freeplane sert à réaliser des prises de notes, à organiser les idées en les reliant. Les nœuds peuvent contenir du texte, des images, des vidéos, des liens hypertextes, des formules mathématiques écrite en LaTeX, … Les vues sont configurables car les branches peuvent être déplier dynamiquement.
Gallica
Bibliothèque numérique de la Bibliothèque nationale de France.
Site web : https://gallica.bnf.fr
Gargantext
Gargantext est un logiciel libre et un service web qui permet l’exploration interactive de grands corpus numériques. Il combine l’exploration de texte avancée, l’analyse de réseaux et la visualisation interactive.
Site web : https://iscpif.fr/projects/gargantext/
Gazouilloire
Gazouilloire est un logiciel serveur permettant de maintenir des collectes massives de données Twitter sur le long terme.
Site web : https://medialab.sciencespo.fr/outils/gazouilloire/
GDB GéoDataBase
Géodatabase de fichiers ESRI permettant de stocker des tables d'attributs et des ensembles de données vectorielles et/ou matricielles. Elle remplace la géodatabase personnelle MDB en offrant des performances plus élevées et des avantages en termes de stockage et de manipulation.
GED
La GED (Gestion Electronique des Documents) est un système informatisé permettant l’acquisition, le stockage, le classement, l’indexation, l’archivage des documents et des données dématérialisés. Ce système encourage le travail collaboratif ainsi que l’échange et la diffusion des données au sein d’un réseau, d’une institution, d’une entreprise.
Génétique
Science qui vise à analyser et à éditer tous les états d’un texte.
GEO IP
GEO IP est un outil développé par la Digital Methods Initiative qui permet de traduire des URLs ou des adresses IP en positions géographiques.
Site web : https://tools.digitalmethods.net/beta/geoIP/
GéOInformations
Espace interministériel de l’information géographique (avec un glossaire de l’information géographique.
GeoJSON
Format d'encodage ouvert conçu pour décrire des données géographiques et y ajouter attributs non spatiaux. Utilisé pour la cartographie Web et l'échange de fichiers, il stocke les données sous forme de texte en notation d'objet JavaScript (JSON).
Géolocalisation
Technique de détermination de la situation géographique précise d’un lieu ou, à un instant donné, d’une personne, d’un véhicule, d’un objet, etc.
Il existe de nombreuses techniques de géolocalisation, parmi lesquelles celles par satellite, par Wi-Fi, par adresse IP, etc. Sur le plan juridique, la géolocalisation fait l’objet d’un encadrement bien spécifique. La CNIL est notamment attentive à ce que cette technologie soit utilisée en conformité avec le respect des données à caractère personnel et de la vie privée. Voir GPS.
Géomatique
Le mot « géomatique » vient de la contraction des termes « géographie » et « informatique ». Il s’agit du domaine informatique ayant pour objet la gestion, de façon numérique, de l’information géographique. « Discipline ayant pour objet la gestion des données à référence spatiale [géoréférencées, c.a.d. localisables de façon géographique] et qui fait appel aux sciences et technologies reliées à leur acquisition, leur stockage, leur traitement et leur diffusion. » (Marcel Bergeron, 1992, Vocabulaire de la Géomatique).
Voir SIG.
GeoNames
Référentiel de noms géographiques.
Site web : https://www.geonames.org/
GeoServer
Serveur SIG open source qui permet de partager en ligne des données géographiques en mettant en œuvre les protocoles WFS, WMS et WMTS de l'Open Geospatial Consortium.
Site web : https://geoserver.org/
Gephi
Logiciel libre d’analyse et de visualisation de réseaux.
Site web : https://gephi.org/
Gestion des données
La gestion des données est l’ensemble des activités mises en œuvre pour faciliter l’exploitation et la sécurisation des données pendant un projet de recherche et leur préservation après la fin du projet.
Si elles n’impliquent pas leur partage, des bonnes pratiques de gestion sont un préalable indispensable à l’ouverture des données et à leur réutilisation (définition issue du site de l'INRAE https://datapartage.inrae.fr/Gerer).
Git
Git est un logiciel de gestion de versions, c’est-à-dire qu’il stocke des fichiers ainsi que leurs versions antérieures en sauvegardant la chronologie de toutes les modifications qu’ils ont subies.
Il s’agit d’un logiciel libre qui fonctionne de façon décentralisée.
Voir GitHub
GitHub
GitHub est une plateforme d’hébergement, de développement et de partage de logiciels et codes informatiques.
Différents outils sont associés à GitHub :
-
Github organizations meta-data lookup : permet d’extraire les métadonnées d’une organisation sur Github.
-
Github repositories meta-data lookup : récupère les métadonnées d’un répertoire sur Github.
-
Github repositories scraper : récupère les forks d’un répertoire Github. Les fork sont les évolutions technologiques créées à partir du code source d’un logiciel.
-
Github scraper : permet, à partir d’une liste d’utilisateurs de Github, de récupérer la liste des interactions entre des utilisateurs ainsi que celle des relations entre des utilisateurs et un répertoire.
-
Github user meta-data lookup : permet d’extraire les métadonnées relatives à un utilisateur sur Github.
-
GithubContributorsScraper : permet de savoir quels utilisateurs de Github ont contribué au code source d’un répertoire Github.
Voir Git
Site web : https://github.com
GitLab
Le GitLab d’Huma-Num se charge de l’hébergement sécurisé et du partage maîtrisé des fichiers de codes suivant le protocole git.
Ses principales fonctionnalités sont la gestion de versions et de dépôts, l’intégration continue, la gestion de tickets, la génération de sites web.
Site web : https://documentation.huma-num.fr/gitlab/
Google Autocomplete
Cet outil permet de récupérer les suggestions d’autocomplétion de Google.
L’autocomplétion est la fonctionnalité permettant d’accélérer la saisie des mots-clés dans la barre de recherche en proposant des suggestions de requêtes.
Site web : https://tools.digitalmethods.net/beta/scrapeGoogle/autocomplete.php
Google Bookmarklets
Les Google Bookmarklets sont deux boutons à ajouter aux favoris de son navigateur. Le premier permet, à partir d’une page de résultats Google de basculer sur l’ancienne version du moteur de recherche avec 100 résultats par page. Le second permet de télécharger ces résultats au format CSV ou de les stocker dans la mémoire du navigateur.
Site web : https://medialab.sciencespo.fr/outils/google-bookmarklets/
Google Play Store Scraper
Google Play Store Scraper est un outil permettant d'extraire les informations détaillées relatives à une application, de collecter les applications qui lui sont liées, de récupérer les permissions des applications ainsi que la liste des applications pour un mot-clé donné.
Voir aussi : Web scraping
Site web : https://wiki.digitalmethods.net/Dmi/ToolGooglePlayStoreScraper
GPKG GéoPackage
Format de données géographiques non-propriétaire, GeoPackage est construit comme une base de données SQLite autonome. Défini par l'Open Geospatial Consortium et publié en 2014, c'est le format de données par défaut du logiciel libre QGIS.
GPS
GPS (Global Positioning System) : système permettant de déterminer les coordonnées géographiques d’un point du globe à partir de l’observation des signaux radio émis par des satellites en orbite autour de la terre.
En fonction de la méthode d’utilisation, du nombre et du type de récepteurs exploités, la précision obtenue sur les coordonnées varie de 100 mètres à quelques centimètres. Ces satellites ont été mis en orbite par les États-Unis d’Amérique.
GPX GPS eXchange format
Format d'échange basé sur un schéma XML dédié aux données acquises par GPS.
Graph Recipes
Graph Recipes est une application web au croisement de l’exploration visuelle et du scripting. Elle permet d’importer des données réseaux au format GEXF pour en produire des statistiques et/ou des visualisations. L’utilisateur peut également écrire en Javascript ses propres scripts de traitement de réseaux.
Site web : https://medialab.github.io/graph-recipes/#!/upload
Graphology
Graphology est une librairie javascript implémentant les structures de données nécessaires à la représentation de nombreux types de réseaux ainsi que des algorithmes utiles en théorie des réseaux.
Site web : https://medialab.sciencespo.fr/outils/graphology/
GrassGIS
Suite logicielle libre de Système d'Information Géographique bureautique en développement continu depuis 1982, basée sur une architecture modulaire. Ses centaines de modules permettent de traiter efficacement tous types de données, sans offrir d'interface de conception cartographique.
Site web : https://grass.osgeo.org/
Hackathon
Contraction des termes « hack » (pirater) et « marathon », un hackathon désigne le regroupement de plusieurs informaticiens sur une courte période - quelques jours - dont le but est de collaborer à la création de programmes informatiques innovants.
HAL
L’archive ouverte pluridisciplinaire HAL est destinée au dépôt et à la diffusion d'articles scientifiques de niveau recherche, publiés ou non, et de thèses, émanant des établissements d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Voir Science ouverte).
Site web : https://hal.archives-ouvertes.fr
Handle
Handle est un identifiant attribué à une ressource par Isidore lors de son opération de moissonnage.
Harvester
Harvester extrait les URLs d’un texte, d’un code source, des résultats d’un moteur de recherche. Il fournit une liste propre d’URLs.
Site web : https://tools.digitalmethods.net/beta/harvestUrls/
HeatGraph
HeatGraph est un outil de visualisation permettant de créer des cartes de chaleur à partir de la densité des noeuds dans un réseau spatialisé.
Site web : https://medialab.github.io/heatgraph/
Heurist
Heurist est un logiciel open source de gestion de bases de données, conçu spécifiquement pour les chercheurs en Sciences Humaines.
Heurist anime des services gratuits sur le web, qui permettent aux chercheurs de créer et de gérer eux-mêmes, avec un simple navigateur web, des bases de données hétérogènes et richement connectées, sans installation ni programmation.
Une très large gamme de fonctions permet l'importation, l'analyse, la visualisation, le partage et l'archivage de données. Une fonction CMS génère des sites web intégrés directement dans la base, pouvant incorporer recherches facetées, listings, cartes, lignes de temps, diagrammes de réseau, etc. Heurist est également multi-utilisateur (accès contrôlé par groupes de travail au niveau de chaque enregistrement).
Ce logiciel est développé depuis 2005 par l'Université de Sydney (Australie).
Site web (description) : http://heuristnetwork.org/
Service : https://heurist.huma-num.fr/
History Flow
History Flow est un outil de visualisation des documents dynamiques et évolutifs et de visualisation des interactions de plusieurs auteurs. Il est notamment utilisé pour visualiser l’historique d’évolution des pages wikipédia.
Site web : https://wiki.digitalmethods.net/Dmi/HistoryFlowHowTo
HTML
Le HTML (HyperText Markup Language) est le langage dans lequel sont écrites les pages web. C’est un encodage formel, permettant d’écrire le « code source » d’une page structurée (c'est-à-dire avec une hiérarchie de titres) qui contient divers types d’éléments : texte, liens hypertexte, images, formulaires, ressources multimedia…).
La plupart des navigateurs permettent de voir la page web (c-à-d le code HTML interprété) mais aussi le code HTML sous-jacent (en général il existe une option qui permet de visualiser le « code source »).
HTR
Le HTR (Handwritten Text Recognition) est une technologie de reconnaissance automatique d’écriture manuscrite.
Voir Transkribus, eScriptorium
Hub de données
Un hub de données est une plateforme de stockage virtuel regroupant les données émanant de plusieurs systèmes d’informations. En centralisant les données en un seul endroit, le hub de données en permet une utilisation plus aisée et plus sécurisée.
Grâce à cette plateforme, les données peuvent également communiquer entre elles dans plusieurs directions.
Huma-Num
Très grande infrastructure de recherche consacrée au développement du numérique au sein des Sciences Humaines et Sociales.
Elle propose de nombreux services et outils aux acteurs des SHS en France, tels que Nakala, Isidore, ShareDocs, Stylo, GitLab, Huma-Num Box, Kanboard, Opentheso, Voyant Tools.
Site web : https://www.huma-num.fr/
Huma-Num Box
La Huma-Num Box est un dispositif de stockage sécurisé et de gestion de jeux de données volumineux. Elle est destinée aux données tièdes et froides c’est-à-dire que peu d’accès en écriture et en lecture seront faites durant la vie de ces données qui revêtent néanmoins une valeur patrimoniale. Le dispositif ne gère pas l’association entre les données et leurs métadonnées et seuls des fichiers (et non des bases de données) peuvent être stockés sur Huma-Num Box.
Humanistica
Humanistica est l’association francophone des humanités numériques/digitales. Elle cherche à réunir autour d’actions communes toutes les personnes intéressées par le mouvement des digital humanities telles qu’elles peuvent s’exercer et se penser en langue française. L'association rassemble, représente et anime la communauté des acteurs de la recherche et de l’enseignement supérieur gravitant autour des humanités numériques. L'association porte également des projets et héberge des groupes de travail. La revue Humanités numériques émane de l'association.
Site web : http://www.humanisti.ca/presentation/
Hyperbase
Hyperbase est un logiciel et une plateforme d’analyse textométrique qui combine deux types de fonctions, documentaires et statistiques, qui permettent de décrire, caractériser, classer et interpréter les textes.
Hyperbase est notamment utilisé pour détecter les thématiques ou isotopies des discours, grâce au calcul des univers lexicaux d’un mot-pole ou le traitement généralisé des cooccurrences.
Site web : <http://hyperbase.unice.fr >
Hyphe
Hyphe est un logiciel libre de crawler web permettant de créer des corpus constitués de pages web et des liens hypertextes existant entre elles sur un sujet spécifique.
Ces pages peuvent être regroupées en « webentités » et le logiciel permet également de visualiser des réseaux de relations.
Site web : https://hyphe.medialab.sciences-po.fr
Hyphe Browser
Hyphe Browser est une application à télécharger fournissant un navigateur web basé sur le moteur Chrome et permettant de naviguer sur le web tout en étant connecté à Hyphe. Cet outil permet de constituer un corpus web tout en visualisant les pages web des sites ce qui en facilite la sélection et la catégorisation.
Site web : https://medialab.sciencespo.fr/outils/hyphe-browser/
Hypotheses.org
Hypothèses est une plateforme web faisant partie du portail OpenEdition et qui regroupe des milliers de blogs (ou carnets) dans tous les domaines des sciences humaines et sociales. Ces blogs sont librement accessibles.
Site web : https://fr.hypotheses.org
IDEAS
IDEAS est une base de données bibliographiques spécialisée en économie et développée par RePec.
Site web : https://ideas.repec.org
Identifiant
En informatique, il s’agit d’un ensemble de caractères ou de symboles permettant d’identifier une entité précise au sein d’un type d’entité. L’identifiant est en principe unique pour chaque objet.
Il existe différents types d’identifiants, le plus commun étant l’identifiant utilisateur qui permet, dans un système multi-utilisateurs, à une personne de se connecter à son compte personnel (pour accéder à ses e-mails par exemple).
Dans ce cadre, l’identifiant est souvent composé d’un nom d’utilisateur et d’un mot de passe. Il existe également des identifiants pour identifier des objets informatiques au sein d’un langage informatique ou d’une base de données par exemple.
Identifiant pérenne
Un identifiant pérenne est un code alphanumérique associé à un objet ou une ressource de façon permanente. Il ne changera pas si l’objet est renommé et déplacé. Il est gérable et disponible à long terme.
Un identifiant pérenne peut également être attribué à une personne, c’est le cas de l’IdRef ou encore d’ORCID.
IdRef
Identifiants et Référentiels pour l’Enseignement supérieure et la Recherche. Application Web développée et maintenue par l’ABES (Agence bibliographique de l’enseignement supérieur, www.abes.fr/) qui permet, à des structures ou des usagers, d’interroger, consulter, créer et enrichir des notices d’autorité (https://www.idref.fr). Les catalogues Calames, SUDOC, theses.fr ou Persée l’utilisent pour leurs notices d’autorité.
Voir http://documentation.abes.fr/aideidrefutilisateur/index.html
IIIF
Le consortium IIIF (International Image Interoperability Framework) est né du constat que les bibliothèques numériques se sont développées sans concertation technique, notamment pour la production des images, ce qui rend aujourd’hui difficile leur partage. Si les protocoles d’échange des données (OAI-PMH par exemple) sont aujourd’hui très développés, rien n’existait pour les images.
L’objectif du consortium est de développer un cadre d’interopérabilité pour la diffusion d’images haute résolution grâce à des API développées par le consortium. Une application possible serait de consulter sur une même interface, des images numérisées de plusieurs bibliothèques numériques. Le visualiseur Mirador a été développé à cette fin.
Sites web : < https://iiif.io>, https://doc.biblissima.fr/iiif
Voir aussi : https://doc.biblissima.fr/
Image matricielle
Une image matricielle est une image numérique constituée d’un raster, qui est une matrice faite de cases, plus généralement appelées pixels. Chaque case contient une couleur codée par un nombre. La qualité d’une image matricielle dépend de la profondeur de la couleur par pixel (calculée en bits) ainsi que de la hauteur et la largeur de l’image (calculée en pixel).
Ce type d’image convient à la numérisation d’images complexes comme les photographies. Toutefois, ce sont des images qui pèsent lourd et prennent donc plus de place en mémoire. De plus, les images matricielles supportent mal les processus de redimensionnement (agrandissement, rétrécissement) qui se traduisent par une perte de qualité.
Voir Image vectorielle
Image numérique
Image acquise, créée, traitée et stockée sous forme binaire, c'est-à-dire acquise par des convertisseurs analogiques-numériques situés dans des dispositifs comme les scanners, les appareils photo, etc.
Les formats d’images numériques les plus fréquents sont le .JPG (compression destructrice, poids de l’image réduit), le .GIF (peut être animé, format léger), le .PNG (compression sans perte, bon compromis), le .PDF (possibilité de contenir des images en pixels et des données vectorielles, conserve la mise en page), le .TIFF (utilisé par les imprimeurs).
Les formats recommandés :
Image Scraper
Image Scraper récupère les images d’une page web donnée. Il suffit de saisir l’URL de la page en question dans Image Scraper pour extraire tous les fichiers images.
Voir aussi : Web scraping
Site web : https://tools.digitalmethods.net/beta/imagesDeep/
Image vectorielle
Une image vectorielle est une image numérique constituée à partir de formules mathématiques. En effet, l’image vectorielle est composée de formes (ligne, ellipse, polygone, etc.) qui possèdent des caractéristiques telles que hauteur, largeur, rayon, longueur, couleur. Ces formes sont elles-mêmes composées de vecteurs (d’où « vectorielle ») dont chacun possède une norme, une direction et un sens traduits par des formules mathématiques. Ainsi, l’intérêt de ce type d’image réside dans le poids plus léger et dans l’absence de perte de qualité en cas de redimensionnement puisque les formules mathématiques peuvent être re-calculées.
L’image vectorielle peut être générée automatiquement et certaines de ses formes animées. Du point de vue de la couleur, chaque forme contient une couleur ou son dégradé. Les images vectorielles ne peuvent pas être utilisées pour la numérisation d’images complexes. D’ailleurs, il est nécessaire d’employer des logiciels dédiés pour créer ce type d’images. Le format standard est le SVG. L’image vectorielle sert notamment à l’animation 2D ou à la cartographie quand les informations géographiques sont référencées dans un système de coordonnées géographiques connus.
Voir Image matricielle
IMPACT
IMPACT est un outil de consultation, d’annotation et de transcription de sources audio-visuelles développé par l’Université de Lausanne.
Site web : https://wp.unil.ch/impact
Indexation
L’indexation est l’opération qui consiste à analyser une ressource documentaire de façon à décrire le contenu de cette ressource dans sa notice bibliographique, au moyen d’un indice de classification ou de mots-clés.
Cette opération permet de rendre la ressource visible au sein du catalogue et d’en faciliter la recherche et l’accès.
Voir RAMEAU
Information géographique
Information qui est reliée à une localisation sur la Terre, exprimée par rapport à un système de référence.
Une information géographique est une information que l’on peut situer sur un plan, une carte, directement par des coordonnées ou indirectement par relation à une autre information géographique. C’est en particulier, l’information sur les objets ou phénomènes naturels, les ressources culturelles, humaines ou économiques.
Infrastructure de recherche
Une infrastructure de recherche se caractérise par des installations, ressources ou services essentiels, uniques et d’envergure nationale voire européenne ou internationale, dont l’objet est de conduire et soutenir une activité de recherche d’excellence. Elle comprend des équipements scientifiques, des ressources telles que des collections, archives et données scientifiques, des services et infrastructures numériques, et tout autre outil essentiel pour soutenir une recherche et des innovations au meilleur niveau.
InoReader
InoReader est une plateforme en ligne d’agrégation de contenus qui permet notamment la gestion des abonnements aux flux RSS.
Site web : https://www.inoreader.com/language/french
Inrae
Site de gestion et de partage des données scientifiques.
Site web : https://data.inrae.fr
Instapaper
Instapaper est un outil de veille permettant d’agréger, sauvegarder, annoter des pages web sur une interface personnelle.
Site web : https://www.instapaper.com
Intelligence artificielle
L’intelligence artificielle (IA, ou « AI » en anglais, pour Artificial Intelligence) est définie par l’un de ses créateurs comme « la construction de programmes informatiques qui s’adonnent à des tâches qui sont, pour l’instant, accomplies de façon plus satisfaisante par des êtres humains car elles demandent des processus mentaux de haut niveau tels que : l’apprentissage perceptuel, l’organisation de la mémoire et le raisonnement critique » (M. Lee Minsky).
Il s’agit en quelque sorte de l’utilisation des ordinateurs ou de processus électroniques dans le but d’imiter le comportement humain, dans les domaines du raisonnement (jeux ou pratique des mathématiques), de la compréhension des langues naturelles, dans la commande d’un robot, etc.
Interface
Jonction entre deux matériels ou logiciels leur permettant d’échanger des informations par l’adoption de règles communes ; module matériel ou logiciel permettant la communication d’un système avec l’extérieur.
Internet Archive Wayback Machine Link Ripper
Cet outil permet d’entrer une URL ou un hébergeur pour récupérer les liens correspondants qui ont été archivés par l’outil Wayback Machine. Il fournit un fichier texte qui liste les liens URL archivés.
Site web : https://tools.digitalmethods.net/beta/internetArchiveWaybackMachineLinkRipper/
Internet Archive Wayback Machine Network per Year
Cet outil permet de récupérer les versions archivées d’un ensemble d’URLs et il produit un fichier de réseau à partir de ces liens.
Site web : https://tools.digitalmethods.net/beta/waybackNetworkPerYear/
Interopérabilité
Possibilité de communication entre deux ou plusieurs systèmes, appareils ou éléments informatiques.
Voir Dublin Core ; HTML ; IIIF, OAI-PMH
Iramuteq
Iramuteq est un logiciel libre développé en R. Il offre une interface permettant de créer des Analyses Multidimensionnelles de Textes et de Questionnaires.
Site web : http://www.iramuteq.org/
IrcamCorpusTools
IrcamCorpusTools est une plateforme permettant la création, l’analyse et l’exploitation de corpus oraux. Elle permet également la gestion de divers formats.
Site web : http://articles.ircam.fr/textes/Beller09b/index.pdf
IRCOM
Le Consortium Corpus Oraux et Multimodaux a été labellisé en août 2011 par Huma-Num, jusqu'en décembre 2015. Il a pour missions principales :
- d’organiser et d’accompagner le développement de corpus (ensemble cohérent de ressources - sans nécessairement impliquer un "gros" volume) oraux et multimodaux en linguistique en aidant les chercheurs à s’approprier les outils nécessaires et à développer des standards communs de référence ;
- d’aider à développer la valorisation, la visibilité et l'accessibilité des fonds existants ;
- d’aider à améliorer leur mise à disposition et leur interopérabilité afin d’intégrer les réseaux internationaux (notamment CLARIN) ;
- d’intégrer la communauté des producteurs et utilisateurs de corpus oraux et multimodaux dans ces pratiques et réflexions.
Ceci passe notamment par l’organisation d’une concertation large sur les standards et formats de l’archivage et du traitement numérique, de sessions de formations et de définition de bonnes pratiques. Des groupes de travail ont été mis en place.
Site web : IRCOM
ISBD
L’ISBD (International Standard Bibliographic Description) est un ensemble de règles validées au niveau international qui déterminent la façon dont doit s’effectuer la description de tous de types de ressources documentaires publiées. Il est élaboré par l’IFLA (International Federation of Library Associations and Institutions).
L’ISBD définit tous les éléments de description bibliographique d’une notice (titre, auteur, éditeur, date, etc.) ce qui en garantit la rigueur, la fiabilité et en facilite la communicabilité entre bibliothèques.
ISBN
L’ISBN (International Standard Book Number) est un numéro international normalisé permettant l’identification d’un livre dans une édition donnée. Ce numéro doit figurer sur tous les exemplaires d’une même œuvre dans une même édition.
L’ISBN a été conçu pour simplifier le traitement informatisé des livres : les libraires peuvent passer des commandes standardisées, les distributeurs ont le même code pour traiter les commandes et les retours, les différentes opérations de gestion dans les bibliothèques et centres de documentation sont également facilitées. Par ailleurs, le caractère international de cette numérotation constitue, à l’étranger également, une référence unique pour tous les professionnels du livre.
En France, c’est l’Agence francophone pour la numérotation internationale du livre (AFNIL) qui attribue les ISBN. Ex. ISBN 978-2-07-078677-0.
Isidore
Isidore est un moteur de recherche permettant l’accès aux données numériques des sciences humaines et sociales. Il collecte, enrichit et fournit un signalement et un accès unifiés aux documents et aux données numériques en libre accès des SHS.
Site web : https://www.rechercheisidore.fr
Isilex
Isilex est à la fois un serveur web, un CMS et un gestionnaire de base de données XML ainsi qu’un gestionnaire privé de réseau social. Il permet de publier et de modifier des données, d’intégrer des contenus multimédias et des fiches liées.
Plus précisément, Isilex permet de créer un corpus seul ou en groupe et de le publier sur le web, de créer des groupes de rédacteurs par tâches de projets, d’exporter en .odt ou en .PDF des données (par fiche ou par lot), de marquer en un clic toutes les occurrences d’un mot dans une fiche, de modifier les pages web du site en un clic, de modifier les données de la base XML en un clic, de demander la validation des données par le modérateur du projet, de modifier la configuration du site, de gérer un site bilingue, de créer un forum, de gérer un réseau social interne
Site web : https://isilex.github.io/easy-xml-fr/
ISO
L’ISO (International Organisation for Standardization) est une organisation non gouvernementale créée en 1947 constituée de 164 pays. L’ISO forme ainsi la fédération mondiale des organismes nationaux de normalisation. La France est ainsi représentée par l’AFNOR au sein de l’ISO.
Les travaux de cette organisation se traduisent par des accords internationaux qui sont publiés sous la forme de normes internationales. Elle a donc pour missions d’encourager le développement de la normalisation dans le but de favoriser entre les nations, les échanges de biens et de services ainsi que la coopération dans les domaines intellectuels, économiques, scientifiques et techniques.
ISSN
ISSN (International Standard Serial Number) : identifiant bibliographique unique et standardisé qui s’applique aux publications en série (revues, magazines, journaux, bulletins, etc.), en cours de parution ou ayant cessé de paraître, quel qu’en soit le support, gratuites ou non, en accès libre ou non.
Issue Dramaturg
Pour utiliser cet outil, il faut entrer jusqu’à trois URLs et un mot-clé. Issue Dramaturg va alors interroger Google avec ce mot-clé et récupérer le classement (Pagerank) des URLs à travers le temps. Le résultat apparaît sous forme de graphique.
Issue Geographer
Issue Geographer géolocalise les organisations d’une carte IssueCrawler et fournit une visualisation de l’implantation de ces organisations sur une carte géographique.
IssueCrawler
IssueCrawler permet à partir de plusieurs URLs de départ et de plusieurs mots-clés ou thématiques de construire une représentation graphique des acteurs de la controverse ou de la thématique.
Voir Compare Networks Over Time
Site web : https://www.issuecrawler.net
Documentation en français : http://www.govcom.org/GuideIssueCrawler2005-2006.pdf
ISTEX
ISTEX est une plateforme qui offre à l’ensemble des membres de la communauté de l’enseignement supérieur et de la recherche française un accès en ligne aux collections rétrospectives de la littérature scientifique dans toutes les disciplines. Istex met en oeuvre une politique d’achat centralisés d’archives scientifiques et de collections sous la forme de licences nationales.
Un budget de 54 millions d’euros a été consacré à des acquisitions définitives et pérennes de documents électroniques en texte intégral : livres électroniques, revues, corpus de textes, etc. Istex fournit également des services aux chercheurs leur permettant d’optimiser l’exploitation de ces corpus grâce à des outils de fouille de corpus (TDM) et de valorisation interactive.
Voir Fouille de corpus
Site web : https://www.istex.fr
ITunes App Store Scraper
Cet outil permet d’extraire les détails relatifs à une application, de collecter les applications liées et de récupérer une liste d’applications pour un mot-clé donné.
Voir aussi : Web scraping
Site web : https://wiki.digitalmethods.net/Dmi/TooliTunesAppStoreScraper
Java
Java est un langage de programmation informatique orienté objet créé en 1995. Il permet d’écrire des logiciels qui sont facilement portés par différents systèmes d’exploitation (Windows, MacOS, GNU/Linux, UNIX) sans qu’il soit nécessaire d’apporter beaucoup de modifications selon les systèmes.
Java est donc un langage informatique mais aussi la plateforme qui garantit la portabilité des logiciels développés en langage Java.
JournalTOCs
JournalTOCs est un outil de veille sur les sommaires de revues scientifiques. Il permet d’importer les flux RSS des sommaires de plus de 20 000 revues, de suivre les sommaires de plusieurs revues en créant un compte, d’exporter plusieurs sommaires via un fichier OPML à importer dans Netvibes.
Site web : https://www.journaltocs.ac.uk/index.php
JPG/JPEG
JPEG (Joint Photographic Experts Group) : format standardisé d’images numériques qui permet une visualisation dans la plupart des logiciels d’images ainsi que sur les navigateurs internet. C’est le format image par excellence pour internet.
Ce format ouvert et libre est associé à une méthode de compression avec pertes qui permet de diffuser des images au moindre coût taille/qualité. Mais la perte d’informations due à la compression est irréversible. Si la compression est trop forte, l’image s’affichera dans une qualité médiocre, voire de façon pixellisée. On parle aussi d’« image brûlée ».
Les préconisations sont de numériser dans des formats non compressés et de haute qualité (TIFF généralement) puis de faire une copie JPEG pour la visualisation. Il existe désormais un nouveau format JPEG : le JPEG 2000 dont la méthode de compression est nettement moins destructive. À ratio équivalent, la compression JPEG 2000 est de meilleure qualité. Le JPEG 2000 peut également être utilisé sans compression, ce qui le rend très intéressant en termes de taille/qualité, notamment pour des fichiers de haute qualité. La BnF l’a adopté comme format de numérisation haute résolution et d’archivage pérenne.
JSON
JSON (JavaScript Object Notation) est un format d'échange de données structurées inspiré du langage objet.
L'échange se fait par transmission de chaînes de caractères (donc faciles à écrire et à lire par des humains).
JSON-LD JavaScript Object Notation for Linked Data
Le JSON-LD (JavaScript Object Notation for Linked Data) est une méthode d’intégration de données structurées sur le web, basée sur le format JSON. Il fait partie des recommandations du W3C.
Site web : https://json-ld.org/
Jupyter
Jupyter est un projet et une communauté dont l'objectif est de développer des logiciels open source, des standards ouverts et des services pour l'informatique interactive à travers des dizaines de langages de programmation.
Le nom du projet Jupyter fait référence aux trois principaux langages de programmation pris en charge par Jupyter, à savoir Julia, Python et R, et est également un hommage aux carnets de Galilée qui enregistraient la découverte des lunes de Jupiter.
Le projet Jupyter a développé et soutenu les produits informatiques interactifs Jupyter Notebook, JupyterHub et JupyterLab. Jupyter est un projet sponsorisé fiscalement par NumFOCUS.
Site web : https://jupyter.org/
Conférences ou tutoriels :
https://www.youtube.com/watch?v=NzlAUmj5fkg
https://github.com/quinnanya/dh-jupyter
https://digitalhumanitiesnow.org/2019/12/introduction-to-jupyter-notebooks/
https://www.cdh.cam.ac.uk/events/first-steps-coding-jupyter-notebooks
https://curriculum.dhinstitutes.org/workshops/text-analysis/
Jupyter Book
Jupyter Book est un outil open source permettant de créer des documents PDF, des documents LaTeX ou de publier un site web à partir d’une combinaison de différents types de fichiers tels que les Jupyter Notebooks et les fichiers Markdown.
Cet outil permet de faciliter la publication d’articles scientifiques ou la publication de sites internet.
Site web : https://jupyterbook.org/en/stable/intro.html
Tutoriel : https://www.youtube.com/watch?v=wuP54pQpK00
Kanboard
Kanboard est un logiciel de gestion de projet collaboratif qui peut également être employé comme mur collaboratif. Il utilise la méthode Kanban. Il permet la mise à jour en temps réel entre plusieurs utilisateurs, l’administration et la personnalisation des projets (couleurs, tableaux), la gestion des tâches et des sous-tâches, la classification des éléments par couleur et catégorie, l’attribution des tâches, la définition des échéances, l’importation de pièces-jointes, l’exportation des projets, la définition des autorisations d’accès, la recherche et le filtrage.
Site web : https://kanboard.org
Khartis
Outil de cartographie en ligne, développé par Sciences Po, pour créer simplement des cartes thématiques.
KML/KMZ Keyhole Markup Language
Langage basé sur un schéma XML pour l'affichage des données géographiques. Principalement utilisé par Google Earth, il est devenu une norme internationale de l'Open Geospatial Consortium en 2008.
Langage de balisage
En informatique, les langages de balisage représentent une classe de langages spécialisés dans l'enrichissement d'information textuelle. Ils utilisent des balises, unités syntaxiques délimitant une séquence de caractères ou marquant une position précise à l'intérieur d'un flux de caractères (par exemple un fichier texte).
L'inclusion de balises permet de transférer à la fois la structure du document et son contenu. Cette structure est compréhensible par un programme informatique, ce qui permet un traitement automatisé du contenu.
Language Detection
Language Detection permet de détecter les langues d’une série d’URLs. Les mille premiers caractères de la page web sont extraits ce qui permet de détecter la langue dans laquelle la page est écrite.
LaTeX
LaTeX est un langage et un système de composition de documents de haute qualité. Il s’agit d’une collection de macro-commandes destinés à faciliter l’utilisation du « processeur de texte » TeX de Donald Knuth. Il comprend des fonctionnalités conçues pour la production de documents techniques et scientifiques. LaTeX est le standard de facto pour la communication et la publication de documents scientifiques. LaTeX est disponible en tant que logiciel libre.
Site web : <https://www.latex-project.org/ https://www.latex-project.org/help/documentation/>
Le Trameur
Le Trameur est un logiciel d'analyse textométrique. Il dispose d'une version en ligne iTrameur qui reprend en partie les fonctionnalités du Trameur.
Site web : http://www.tal.univ-paris3.fr/trameur
Leaflet
Bibliothèque javascript open source de cartographie développée à partir de 2011. Elle est plus légère et plus simple qu'OpenLayers, mais avec moins de possibilités. Elle dispose d'une importante communauté de développeurs et de nombreux plugins existent pour la compléter.
Documentation en anglais : https://leafletjs.com/.
Exemples de tutoriels en français :
Lexico 5
Lexico 5 est un logiciel d'analyse textométrique.
Site web : http://www.lexi-co.com
Lexicoscope
Lexicoscope est une interface web d’exploration de corpus textuels. Il permet d’explorer l’environnement lexicosyntaxique des mots du corpus. Il s’agit d’un outil spécialement dédié à l’analyse des contextes et des cooccurrences.
Il est possible pour l’utilisateur de créer des corpus personnels à partir des corpus préexistants ou de télécharger et traiter leurs propres corpus.
Site web : http://phraseotext.univ-grenoble-alpes.fr/lexicoscope_2.0/
Librairie
Librairie (Library) / bibliothèque logicielle ou de programmes : ensemble de fonctions utilitaires, regroupées et mises à disposition sous forme de routines ou modules préprogrammés afin de pouvoir être utilisées sans avoir à les réécrire.
Licence libre
Un auteur peut décider de placer son œuvre sous licence libre, c’est-à-dire qu’il donne l’autorisation gratuite, à tous et par avance, d’utiliser son œuvre dans les conditions fixées dans la licence. Il existe plusieurs standards de licences libres (par exemple, pour les logiciels, les licences CeCILL, GNU GPL).
Pour les créations, il existe les licences en Creative Commons (CC) ou encore Art Libre. Par exemple, les licences CC permettent à l’auteur, par le biais de variantes, d’indiquer aux utilisateurs de quelles libertés ils disposent sur l’œuvre et quelles sont leurs obligations. Les 6 licences CC type autorisent toujours la libre diffusion de l’œuvre, mais peuvent interdire l’utilisation commerciale (NC) et les modifications (ND) ou encore imposer le maintien de la licence pour les œuvres dérivées (SA). Elles imposent toutes la mention du nom de l’auteur (BY). Par conséquent, lorsqu’une œuvre est placée sous ce type de licence, à condition d’en respecter les termes, toute personne peut utiliser l’œuvre sans avoir à solliciter une autorisation spéciale auprès de l'auteur.
Voir aussi : Creative Commons ; Open Source
Lien utile : Les contenus sous licences libres sur le site economie.gouv.fr.
Licence nationale
Il s’agit d’un format d’acquisition pérenne de documentation numérique qui complète les abonnements à la documentation électronique auxquels souscrivent les bibliothèques de l’enseignement supérieur et de la recherche.
Le dispositif des licences nationales garantit l’accès aux ressources à partir des plateformes des éditeurs et/ou de la plateforme ISTEX ainsi que, le plus souvent, l’exploitation des données, notamment la fouille de textes et de données, la réutilisation et la reproduction d’extraits dans le cadre de travaux de recherche et d’enseignement.
Ce dispositif implique plusieurs acteurs au niveau national : l’ABES, le consortium Couperin, l’Inist-CNRS, le GIS (Groupement d’Intérêt Scientifique) Collex-Persée et l’Université de Lorraine.
Lien hypertexte
Lien opéré par un code HTML qui relie deux pages ou deux endroits accessibles par le protocole HTTP (web), il permet de passer automatiquement d’un document à un autre.
Quand on clique sur un lien hypertexte, le navigateur nous envoie à une autre page internet (du même site ou d’un autre site) ou à un autre endroit dans la même page (lien interne avec une ancre), soit dans la même fenêtre, soit dans un nouvel onglet.
Link Ripper
Link Ripper permet d’extraire tous les liens internes et/ou externes d’une page web.
Site web : https://tools.digitalmethods.net/beta/linkRipper/
Linked Data
Notion introduite en 2006, par Tim Berners-Lee. Il s’agit d’une méthode de publication de données structurées, de manière à ce qu’on puisse établir efficacement des relations (liens) entre les données. Cela permet la création d’un réseau global d’informations et le décloisonnement des données.
Voir Web sémantique.
Lippmannian Device
L’outil Lippmannian Device permet de détecter la partisanerie ou les partis pris d’un acteur sur le web. Un des principaux usages de cet outil consiste à rechercher la présence et le classement de sources spécifiques au sein des résultats d’un moteur de recherche. L’outil est également utilisé dans les recherches sur la censure.
L'outil Lippmannian Device to Gephi permet par ailleurs de visualiser les résultats obtenus sous forme d’un réseau Gephi.
Sites web : https://tools.digitalmethods.net/beta/lippmannianDevice/, https://tools.digitalmethods.net/beta/lippmannianDeviceToGephi/
Lodex
Lodex est un logiciel open source permettant de publier selon les normes du web sémantique des tableaux comportant des données brutes, d’en faciliter la transformation en données structurées, d’explorer le jeu de données publié selon différents angles de vues, de référencer et valoriser chaque ressource, d’aider à aligner les données à publier avec des données similaires ou connexes.
Site web : https://lodex.inist.fr
LogEc
LogEc est un outil qui collecte les statistiques d’accès aux ressources de RePec. Il permet ainsi de connaître les sujets les plus traités par les économistes ainsi que l’impact de sa propre recherche.
Site web : https://logec.repec.org
Logiciel
En informatique, un logiciel est un ensemble de séquences d’instructions interprétables par une machine (ou programmes informatiques) et d’un jeu de données nécessaires à ces opérations.
Le logiciel détermine donc les tâches qui peuvent être effectuées par la machine, ordonne son fonctionnement et lui procure ainsi son utilité fonctionnelle.
Login
Le login est un code d’accès unique permettant à un utilisateur de se connecter à un ordinateur, à un système informatique ou un site internet. Le login est une mesure de sécurité qui se compose le plus souvent d’un identifiant et d’une authentification.
Voir Identifiant
Loi pour une République numérique
Il s’agit d’une loi française promulguée le 7 octobre 2016 suite à la proposition de la secrétaire d’Etat au numérique Axelle Lemaire.
Elle se construit autour de trois axes principaux : rendre le numérique accessible à tous, favoriser la protection des individus dans la société du numérique et favoriser la circulation des données et du savoir. Elle prévoit notamment le libre accès aux publications scientifiques de la recherche publique ainsi qu’aux données publiques comme celles de l’INSEE.
Voir Science ouverte, CoSo
Looping
Looping est un logiciel gratuit et libre d’utilisation développé par l’université de Toulouse III. Il sert à modéliser la structuration d’une base de données (diagramme UML), et génère automatiquement les scripts de requête en SQL.
Site web : https://www.looping-mcd.fr/
Voir aussi : Modèle conceptuel de données
Magrit
Il s'agit d'une solution pour créer des cartes thématiques.
Site web : http://magrit.cnrs.fr/
Mallet
Mallet est une librairie Java de textométrie et d’analyse textuelle. Cette librairie est utilisée pour le traitement statistique du langage naturel, la classification de documents, le regroupement, la modélisation de sujets, l'extraction d'informations et d'autres applications d'apprentissage automatique au texte.
Site web : https://mimno.github.io/Mallet/index
Manylines
Manylines est une application web, aujourd’hui archivée, permettant d’afficher, de spatialiser, de catégoriser un réseau. Avant son archivage, elle permettait également d’écrire et publier un récit composé de vues spécifiques du réseau.
Mapbox
Fournisseur de cartes en ligne personnalisables (gratuit jusqu'à une certaine limite), mapbox est aussi un contributeur important à certaines bibliothèques open source et à la spécification MBTiles (format stockant des tuiles cartographiques dans un seul fichier)
Site web : https://www.mapbox.com/
MARC
MARC (Machine Readable Cataloging) est un ensemble de formats informatiques de structuration des données bibliographiques qui respectent l’application de la norme ISO 2709 qui, elle-même, définit le format d’échange informatique des notices bibliographiques.
Le premier format MARC a été créé en 1965 notamment parce que le catalogage en ISBD n’était pas lisible par ordinateur. Il existe aujourd’hui deux grands types de format MARC : le format MARC21 géré par la Bibliothèque du Congrès à Washington et la Bibliothèque et archives nationales du Canada ; le format à vocation internationale UNIMARC géré par l’IFLA. Les formats MARC déterminent la manière dont les informations qui décrivent un document sont sélectionnées, organisées et présentées dans les catalogues de bibliothèques.
Markdown
Markdown est un langage informatique créé en 2004 par John Gruber. Plus particulièrement, il s’agit d’un langage de balisage conçu pour être plus simple d’utilisation que le langage HTML.
Un document écrit en markdown peut être peut être lu en l’état sans donner l’impression d’avoir été balisé ou formaté par des instructions particulières. Il peut également être converti en différents formats, en HTML ou en PDF par exemple.
Site web : https://www.ionos.fr/digitalguide/sites-internet/developpement-web/markdown/
Mashup / Application composite
Un mashup est une application qui permet sur un site web d’agréger ou retraiter de l’information en provenances d’une ou plusieurs sources extérieures. Un mashup se caractérise par la combinaison, la visualisation et l’agrégation de données. Google Maps est ainsi un mashup car il est utilisé par d’autres sites pour faire fonctionner leur système de géolocalisation.
MATE-SHS
Le réseau Mate-shs (Méthodes, Analyses, Terrains, Enquêtes en SHS) entend réunir les professionnels de la recherche s’intéressant, de manière large, à la production, au traitement, à la visualisation et à la préservation de données et de corpus en sciences humaines et sociales. Mate-shs a pour ambition de devenir un des lieux de référence de discussion, transmission et construction des pratiques professionnelles du métier ; de découverte et de maîtrise de nouvelles méthodes / nouveaux logiciels par la communauté ; et d’être, sur tous ces sujets, un interlocuteur reconnu et légitime auprès des institutions chargées de l’organisation de la recherche.
Site web : https://mate-shs.cnrs.fr/
Formulaire d'inscription sur la liste de diffusion : https://www.enquetes.mate-shs.cnrs.fr/index.php/113498?lang=fr
MCD
Un modèle conceptuel de données (ou MCD) est une représentation graphique des données permettant de comprendre quelles relations lient les éléments entre eux grâce à des diagrammes codifiés. Il s’agit d’une des étapes de création d’une base de données.
Plusieurs éléments composent les diagrammes notamment les entités qui correspondent à un objet, les propriétés qui sont la liste des données de l’entité, les relations qui expliquent comment les entités sont reliées entre elles et les cardinalités qui caractérisent les liens entre les entités.
Il existe différents modèles de MCD : le modèle « entité-association », le modèle binaire ou encore le modèle Z.
Des logiciels spécialisés existent pour réaliser ces modèles. Ils peuvent être propriétaires (Microsoft Visio, Maestro SQL, Oracle Designer) ou libres (MySQL Workbench, DBDesigner).
Voir SQL
Mercury
Mercury est un framework qui permet de créer des pages HTML interactives à partir de widgets. Cela permet de partager des widgets qui peuvent être ensuite utilisés dans un site web pour augmenter son interactivité.
Site web : https://mljar.com/mercury/
Tutoriel : https://www.youtube.com/watch?v=WcD908-a7Z8&ab_channel=MLJAR
Métadonnées
On appelle « métadonnées » des données structurées décrivant une ressource ou une autre donnée. Une notice bibliographique, qui décrit selon un format ordonné un document en segmentant ses informations, contient des métadonnées.
Les métadonnées servent à référencer, identifier et partager correctement un document. Elles permettent la description et le traitement des ressources numériques (ou papier), elles sont généralement standardisées et à l’extérieur ou en entête du texte ou du document qu’elles décrivent.
On distingue plusieurs types de métadonnées, descriptives (EAD, Dublin Core, MODS), techniques (EXIF, MIX-NISO, etc.), de structure (ALTO, METS, TEI).
METS
Standard XML de métadonnées permettant de décrire un document numérique dans toutes ses dimensions (notamment bibliographiques, techniques, juridiques), dans le but de faciliter son échange, sa gestion et sa préservation.
Minet
Minet est une librairie et un outil en ligne de commande écrit en langage python qui permet d’aider à accomplir des tâches d’analyse du web ou webmining.
Site web : https://medialab.sciencespo.fr/outils/minet/
MiniVan
MiniVan est une application web permettant de publier et d’analyser des réseaux.
Site web : https://medialab.github.io/minivan/#/
Mir@bel
Mutualisation d’information sur les revues et leurs accès dans les bases en ligne. Site web qui facilite l’accès aux revues (principalement celles de sciences humaines et sociales) en indiquant pour chacune les liens vers le texte intégral, les sommaires, les résumés ou l’indexation des articles.
Il est alimenté par les établissements du type bibliothèque, par les éditeurs et par les ressources en ligne.
Site web : https://reseau-mirabel.info
Mirador
Mirador est un visualiseur web d’images numériques répondant au standard de description des images IIIF. Il permet de comparer des images provenant de différentes institutions sur un même écran, de zoomer, et d'annoter certaines parties des images.
Site web : https://projectmirador.org/
Moissonnage
Le moissonnage est un mécanisme permettant de récolter des métadonnées sur un catalogue distant, une base de données distante ou encore sur le web puis de les stocker sur un serveur local pour y accéder plus rapidement.
Le moissonnage s’effectue automatiquement et régulièrement et nécessite les mêmes protocoles entre l’organisme qui moissonne et celui qui est moissonné.
C’est dans cette optique que sont développés les protocoles comme l’OAI-PMH qui sert notamment au moissonnage des archives ouvertes.
Voir Moteur de recherche
MOOC - Massive open online courses
Les MOOC sont des cours en ligne ouvert à tous. Ce type de formation peut donner droit à des crédits ECTS, et/ou à des certifications de suivi avec succès. Les MOOC sont généralement basés sur des vidéos pédagogiques, des QCM d'évaluation, et des forums de discussion avec les autres apprenants et parfois les professeurs.
Plateforme de MOOC : OpenClassRooms, FUN mooc (France Université Numérique), Coursera
Moteur de recherche
Un moteur de recherche est une machine (matérielle et logicielle) qui permet de rechercher sur le web des informations, des documents, des ressources à partir d’une requête par mots-clés. Les moteurs de recherche fonctionnent grâce à des robots appelés crawler ou spider qui parcourent le web et indexent les pages web dans leurs bases de données.
Autrement dit, à chaque page web sont attribués des mots-clés si bien que quand l’internaute donne les mots-clés de sa recherche, le moteur de recherche consulte sa base de données et renvoie comme résultats les pages web indexées avec les mêmes mots-clés que ceux de l’utilisateur. Les résultats de la requête sont classés selon leur pertinence et des critères propres à l’algorithme de chaque moteur de recherche.
Il existe différents moteurs de recherche, le plus connu est Google. Certains sont spécialisés, ainsi Startpage s’est spécialisé dans la protection des données et l’anonymat de ses utilisateurs ; Ecosia et Lilo dans l’écologie et la solidarité (à chaque recherche, un arbre est planté ou de l’argent est reversé à des associations).
Voir : Opérateurs booléens, Troncature
Munich Personal RePEc Archive
Munich Personal RePEc Archive est un service qui permet au chercheur de déposer les travaux qu’il souhaite diffuser sur les autres services du réseau RePec comme IDEAS ou EconPapers.
Site web : https://mpra.ub.uni-muenchen.de
MuseScore
MuseScore est un logiciel open source d’édition de partition. La plateforme en ligne propose également des partitions à télécharger.
Site web : https://musescore.org/fr
myST
Les fichiers markdown du Jupyter Book peuvent être écrits grâce à myST (Markedly Structured Text), une version spéciale de Markdown qui a été conçue pour faciliter la création de documents informatiques en fournissant des fonctionnalités supplémentaires. myST permet d’améliorer la mise en page des documents markdowns qui peuvent ensuite être exportés en format pdf, LaTeX ou en format web.
Site web : https://myst-tools.org/
Tutoriel : https://www.youtube.com/watch?v=NxSNVt9XsCI&t=1490s&ab_channel=curvenote
NAKALA
NAKALA est un service d’Huma-Num permettant à des chercheurs, enseignants-chercheurs ou équipes de recherche de partager, publier et valoriser tous types de données numériques documentées (fichiers textes, sons, images, vidéos, objets 3D, etc.) dans un entrepôt sécurisé afin de les publier en accord avec les principes du FAIR Data (Facile à trouver, Accessible, Interopérable et Réutilisable).
Site web : https://documentation.huma-num.fr/nakala/
Navigateur web
Un navigateur web (web browser en anglais) est un logiciel conçu pour consulter et afficher le World Wide Web. Techniquement, c'est au minimum un client HTTP (logiciel conçu pour se connecter à un serveur HTTP, Hypertext Transfer Protocol).
Il existe de nombreux navigateurs web, pour toutes sortes de matériels (ordinateur, tablette, téléphone mobile et pour différents systèmes d'exploitation (GNU/Linux, Windows, Mac OS, iOS et Android). Actuellement, les navigateurs les plus utilisés sont Google Chrome, Mozilla Firefox, Internet Explorer/Edge, Safari, Opera.
Netvibes
Netvibes est un outil en ligne de veille informationnelle. Il s’agit d’un agrégateur d’abonnements à des flux RSS. Il offre la possibilité de consulter le site web agrégé à l’intérieur de l’agrégateur.
Voir aussi : InoReader, Feedly
Site web : https://www.netvibes.com/fr
Netvizz
Netvizz permet d’extraire des données à partir de différentes sections de Facebook (groupes, pages, recherches).
Site web : https://www.facebook.com/login/?next=https%3A%2F%2Fapps.facebook.com%2F107036545989762%2F
New Economic Papers
NEP (New Economic Papers) est un service de veille du réseau RePec qui envoie à ses abonnés des notifications sur les nouvelles ressources téléchargeables sous formes d’e-mail, de RSS et de tweets.
Il est possible de s’abonner à des fils thématiques comme le Big Data, la Banque centrale ou encore la géographie économique.
Site web : http://nep.repec.org
News Agencies Scraper
Cet outil permet d’interroger différentes agences de presse avec un mot-clé et d’en extraire les titres, images, dates, et textes intégraux correspondant au mot-clé.
Voir aussi : Web scraping
Site web : https://wiki.digitalmethods.net/Dmi/ToolNewsAgencies
Nooj
Nooj est un logiciel de traitement de corpus conçu pour l’analyse et le traitement des langues et de la linguistique.
Il permet notamment de créer et gérer des dictionnaires et des grammaires électroniques à large couverture puisqu’il peut formaliser huit niveaux de phénomènes linguistiques (orthographe, typographie, morphologie flexionnelle et dérivationnelle, syntaxe locale et structurelle, grammaire transformationnelle et analyse sémantique).
Site web : http://nooj4nlp.org/index.html
Noota
Noota est un service propriétaire de transcription d’enregistrements audios. La plateforme web propose également des solutions d’enregistrement de réunion, d’analyse de texte et d’audios, d’annotation et de sous-titrage de vidéo.
Site web : https://noota.io/
Notebook
Un notebook est un environnement où on peut inscrire du code avec des données et de la prose, exécuter le code et visualiser simultanément les résultats.
Voir aussi : Jupyter, Observable, R Markdown, …
Définition issue de https://www.arthurperret.fr/blog/2021-06-11-du-notebook-au-bloc-code.html
Notice bibliographique
Une notice bibliographique est un fichier qui contient l’ensemble des éléments descriptifs d’un document tels que le type de document, le titre, l’auteur, la maison d’édition, la date de publication. Elle peut également comprendre des éléments permettant la localisation du document (cote, adresse URL).
Après une analyse du document, la notice peut présenter un résumé, des mots-clés ou encore un indice de classification qui donnent à voir le contenu du document. Les notices bibliographiques se rencontrent par exemple dans les bibliographies, les catalogues de bibliothèques ou encore les bases de données.
Les notices bibliographiques sont normées et respectent des règles de présentations strictes. Ces règles peuvent avoir une portée internationale comme c’est le cas de l’ISBD mis au point par l’IFLA. En France, l’AFNOR établit des normes en suivant les recommandations de l’IFLA.
Notice d’autorité
Une notice d’autorité est la forme normalisée et validée de noms d'œuvres, de noms d’auteurs, de noms géographiques. Elle sert à identifier et retrouver tous les documents produits par une même entité en évitant les ambiguïtés et les doublons.
Ainsi, dans les catalogues informatisés, le catalogage des points d’accès auteurs et sujets s’effectue à partir des notices d’autorités. Les notices d’autorités s’organisent en listes d’autorités, telles que le RAMEAU, qui constituent elles-mêmes un langage d’indexation.
NTIC
NTIC (Nouvelles Technologies de l’Information et de la Communication) désigne l’ensemble des technologies permettant le traitement et la transmission des informations principalement numériques.
Les téléphones portables, les ordinateurs, les messageries instantanées, internet font partie des NTIC.
Numérisation
Processus qui consiste à convertir des informations d’un support (texte, image, audio, vidéo) ou d’un signal électrique en données numériques.
OAI-PMH
L’OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting) est un protocole informatique développé afin d’échanger des métadonnées – uniquement celles-ci et non les ressources elles-mêmes.
L’OAI-PMH définit deux types d’acteurs : les fournisseurs de données, qui déposent leurs métadonnées sur un serveur web appelé « entrepôt », et les fournisseurs de service qui collectent (qui « moissonnent ») ces données. Le moissonnage s’effectue à partir de requêtes formalisées à l’adresse de l’entrepôt, les résultats sont alors intégrés dans l’index ou le répertoire du site moissonneur. La liste des requêtes peut être consultée par exemple sur le site de la BNF. Le standard de base d’échange du protocole OAI-PMH est le Dublin Core mais d’autres formats de métadonnées peuvent être exposés (EAD, RDF, etc.).
Ce protocole est utilisé notamment par les Archives Ouvertes et les entrepôts institutionnels, il s’est aujourd’hui largement répandu dans les institutions patrimoniales et notamment les bibliothèques. Il permet entre autres de construire des sites portails thématiques avec uniquement le résultat de requêtes sur les entrepôts repérés sur cette thématique. Europeana, la bibliothèque numérique européenne, est alimentée via le protocole OAI-PMH.
Voir Interopérabilité
Lien utile : Europeana
Océrisation
L’océrisation désigne le processus d’utilisation d’un logiciel de reconnaissance optique de caractères (Optical Character Recognition - OCR) permettant de transformer l’image numérisée d’un texte imprimé en document textuel et de le sauvegarder sous forme d’un fichier ensuite exploitable dans un logiciel de traitement de texte.
OCR
La reconnaissance optique de caractère (optical character recognition, OCR, en anglais) est une technologie qui transcrit l’image d’un texte dactylographié en un fichier textuel numérique.
Contrairement à l’HTR, l’OCR se focalise uniquement sur la reconnaissance des caractères un par un, sans prendre en compte leur contexte que ce soit dans un mot, une phrase ou une ligne.
Voir aussi : HTR, Transcription
OldMapsOnline
Il s’agit d’un moteur de recherche qui indexe plus de 400 000 cartes historiques grâce à la participation de bibliothèques universitaires et d’établissement de recherche.
Site web : https://www.oldmapsonline.org/about/
Omeka
Logiciel de gestion de bibliothèque numérique mis à disposition sous licence libre (GNU – General Public License).
De conception modulaire, l’outil permet à chaque site d’adapter les fonctionnalités proposées à l’aide de plugins et de thèmes. L’outil est développé aux États-Unis par le Roy Rosenzweig Center for History and New Media (CHNM) de l’Université George Mason qui est aussi à l’origine du logiciel de gestion bibliographique Zotero.
Site web : https://omeka.org
Onglet
Un onglet est, dans un fichier ou autre système de rangement, une petite excroissance visuelle porteuse d'une étiquette (typiquement, alphabétique) permettant un accès direct aisé aux documents ou une partie du document.
Par analogie, sur les navigateurs internet, il permet d’avoir accès à plusieurs sites ou pages sur une seule fenêtre et de pouvoir passer rapidement d’une page à une autre. Cette interface riche sur une seule fenêtre provoque le risque d’avoir trop d’onglets ouverts…
Ontologie
L’ontologie est une branche de la philosophie qui vise à élucider le sens de l’être considéré en tant qu’être général, abstrait, essentiel et en tant qu’être singulier, concret, existentiel. Il s’agit également de l’étude des être en eux-mêmes et non tels qu’ils nous apparaissent.
Par extension, le terme signifie l’ensemble des vérités fondamentales de l’être. Du point de vue de l’histoire de la médecine, l’ontologie se réfère à l’étude de l’être de la maladie ou à l’étude des êtres vivants et des phénomènes individuels.
En informatique, une ontologie est « la spécification d'une conceptualisation d'un domaine de connaissance » (Th. Gruber), autrement dit c’est un modèle structuré de concepts se rapportant à une discipline. Pour chaque concept, une ontologie définit des « classes », des « attributs » aussi nommés « propriétés », et des « relations ». Souvent une ontologie est représentée par un schéma explicitant ces différents éléments.
Site web : https://www.cnrtl.fr/lexicographie/ontologie
Site web : https://tomgruber.org/writing/ontology-in-encyclopedia-of-dbs.pdf
Ontome
Ontome est un environnement de gestion d’ontologie en ligne. Il permet de gérer un projet de création et de maintien d’une ontologie collaborative. Cet outil sert à aligner une ontologie avec celle du CIDOC-CRM.
Site web : https://ontome.net/
Open Access
L’Open Access (ou aussi « libre accès », ou encore « accès ouvert ») à la littérature scientifique est un mode de diffusion des articles de recherche sous forme numérique, gratuite et dans le respect du droit d’auteur. Cette notion recouvre l’accès ouvert (gratis open access), les données diffusées en ligne gratuitement et le libre accès (libre open access), données diffusées en ligne gratuitement et librement, c'est-à-dire soumises à une licence d’utilisation dite libre (ex. Creative Commons). On distingue plusieurs modèles ou voies de l’open access : la voie verte et la voie dorée.
Lien utile : Comment définir l'Open Access
Open Data
Données ouvertes, dont l’accès est public et libre de droit, tout comme leur exploitation.
Open Geospatial Consortium
L’Open Geospatial Consortium est un regroupement de professionnels, d’entreprises et d’institutions qui travaillent à la valorisation des données géographiques, notamment à travers le respect des principes FAIR Data. Le consortium met également en place des référentiels pour le partage et l’interopérabilité des données géographiques.
Site web : https://www.ogc.org/
Open Source
Cela désigne le « code source ouvert » et s'applique aux logiciels dont la licence respecte les possibilités d'accès au code source du logiciel, de libre redistribution de ce code et de possibilités de travaux dérivés à partir de celui-ci.
On peut ainsi adapter le code source d’un logiciel open source à ses propres besoins. La principale licence pour le logiciel open source est la licence GNU (General Public License). De plus en plus, on étend la définition de « l’open source » aux données et plus uniquement au code informatique, on parle alors d’Open Data.
Voir GitHub
OpenAIRE
OpenAIRE (Open Access Infrastructure for Research in Europe) est un projet européen dont la mission consiste à favoriser le libre accès de l’information scientifique en créant un réseau d’experts de la science ouverte pour mettre au point des formations et une infrastructure technique ouverte pour la centralisation, la gestion et le partage des publications scientifiques et des données de la recherche.
Site web : https://www.openaire.eu
OpenArcheo
OpenArcheo est une plateforme en ligne mettant à disposition des données issues de l’archéologie alignée sur le modèle du CIDOC-CRM. Les deux interfaces proposées reposent sur le langage de requête SPARQL. Les données sont issues des travaux du Consortium MASA (mémoire des archéologues et des sites archéologiques), et sont hébergées par Huma-Num.
OpenDOAR
OpenDOAR (Directory of Open Access Repositories) est un annuaire qui recense à l’échelle mondiale les archives ouvertes et les dépôts en libre accès.
La recherche et la navigation au sein des résultats peuvent être filtrées par nom, par région du monde, par pays ou encore par logiciel.
Site web : https://v2.sherpa.ac.uk/opendoar/search.html
OpenEdition
Ressources électroniques en sciences humaines et sociales.
OpenEdition est une infrastructure complète d’édition électronique au service de la communication scientifique en sciences humaines et sociales. Elle rassemble quatre plateformes complémentaires dédiées (OpenEdition Journals, OpenEdition Books, Hypothèses, Calenda).
Voir Science ouverte
Site web : https://www.openedition.org
OpenLayers
Bibliothèque JavaScript open source publiée en 2006 permettant d'afficher des cartes dans un navigateur web. Elle offre des fonctionnalités équivalentes à un logiciel SIG.
Site web : https://openlayers.org/
OpenRefine
OpenRefine est une application permettant de traiter des fichiers de données comportant des incohérences internes dans les formats ou la structure des données ou encore dans la terminologie employée. Cet outil normalise et nettoie les données sans modifier les données originales.
Site web : https://openrefine.org
OpenStreetMap
OpenStreetMap est une application web de cartographie. Elle partage également des données géographiques libres d'utilisation.
Site web : https://www.openstreetmap.org/
Opentheso
Opentheso est un logiciel libre de gestion de thésaurus multilingue créé suite à la collaboration entre Frantiq et la plateforme « Tête de réseaux documentaires » de la Maison de l’Orient et de la Méditerranée.
Voir PACTOLS
Site web : <https://documentation.huma-num.fr/opentheso/ >
Logiciel : https://github.com/miledrousset/Opentheso2
Opérateurs booléens
Les opérateurs booléens permettent d’affiner une recherche dans un moteur de recherche ou un ensemble de résultats en combinant des critères de recherche logiques. Les principaux opérateurs booléens sont «ET », « OU » et « SAUF ».
L’opérateur « ET » présente uniquement les résultats contenant les deux mots qui l’entourent. L’opérateur « OU » présente les résultats des deux termes qui l’entourent ou uniquement l’un des deux termes. L’opérateur « NOT » ne présente que les résultats qui contiennent le mot précédent l’opérateur tout en excluant ceux qui contiennent le second terme.
Voir Troncature
OPIDoR
OPIDoR (Optimiser le Partage et l’Interopérabilité des Données de la Recherche) est un portail mis en place par l’Inist-CNRS à destination de la communauté de l’enseignement supérieur et de la recherche qui propose un ensemble d’outils et de services facilitant la mise en application des principes du FAIR Data.
OPIDoR propose trois services.
-
DMP OPIDoR, outil d’aide à la création en ligne de plans de gestion des données.
-
Cat OPIDoR, catalogue qui recense et décrit les services français qui participent à la gestion, au partage et à la réutilisation des données.
-
PID OPIDoR, service permettant d’attribuer des identifiants pérennes (DOI) aux données de la recherche.
Site web : https://opidor.fr
ORCID
L'Open Researcher and Contributor ID (ORCID) est un code qui permet d'identifier de manière unique les auteurs de contributions académiques et scientifiques.
Site web : https://orcid.org
Ortolang
Ortolang est une plateforme de données (corpus, lexiques, dictionnaires, etc.) et d’outils sur la langue et son traitement.
Elle propose également un service d'hébergement et d'archivage de projets en linguistiques. Elle met à disposition des outils de traitement automatique de la langue française.
Site web : https://www.ortolang.fr/
Ovide
Ovide est un logiciel d’écriture et d’édition. Il permet de travailler avec des images, des vidéos, des références bibliographiques et de produire diverses éditions imprimées et web à partir d’un même corpus d’écrits. Il fonctionne en tandem avec l’éditeur Fonio.
Site web : https://peritext.github.io/ovide/
OxGarage
OxGarage est un service web proposant et gérant la conversion de documents en plusieurs formats de fichiers.
Sites web : https://oxgarage2.tei-c.org/# ; https://github.com/TEIC/oxgarage/
PACTOLS
PACTOLS est un thésaurus créé par Frantiq dans le but d’organiser les mots-clés utilisés dans l’indexation des ressources documentaires de domaine archéologique. Il couvre toutes les thématiques de l’archéologie, de la préhistoire à l’époque contemporaine. Les concepts sont classés dans sept thématiques : Peuples, Anthroponymes, Chronologie, Toponymes, Oeuvres, Lieux, Sujets (PACTOLS).
Le thésaurus est interopérable et multilingue (7 langues), chaque concept possède un identifiant ARK qui en fait un objet web unique, citable et réutilisable sur le web sémantique.
Site web : https://pactols.frantiq.fr/opentheso/
Page web
C’est l'unité de base du web. Elle est conçue pour être consultée par un navigateur web et elle est identifiée par une adresse web.
Elle est généralement constituée d’une structure en HTML, avec du texte et souvent d’images, de feuilles de style ou de scripts permettant l’affichage de données venant de bases de données. Elle est fabriquée à partir d’un éditeur HTML et localisée sur un serveur web (hébergement). Son affichage peut être paramétré pour s’adapter aux conditions locales de consultation (écran d’ordinateur fixe ou portable, écran de télévision, téléphone mobile, etc.) à travers une feuille de style.
Palladio
Palladio est une plateforme de visualisation développée par l'Université de Stanford (USA).
Palladio est un ensemble d'outils permettant de télécharger facilement des données et de les étudier. Il s'agit d'un ensemble de visualisations entrelacées conçues pour des données complexes et multidimensionnelles. C'est un produit du projet "Networks in History" qui trouve ses racines dans un autre projet de recherche en sciences humaines basé à Stanford : Mapping the Republic of Letters (MRofL).
Site web : https://hdlab.stanford.edu/palladio/
Parser/Parseur
Un parseur est un programme informatique d’analyse syntaxique qui peut être appliqué à du langage naturel ou à un langage informatique en fonction de sa configuration. Il sert notamment à extraire les informations essentielles d’un fichier ou d’une page web.
Le PDF (Portable Document Format) est un format qui préserve la mise en forme d’un document – polices de caractère, images, objets graphiques, etc. – telle qu’elle a été définie par son auteur – et cela quels que soient le logiciel, le système d’exploitation et l’ordinateur utilisés pour l’imprimer ou le visualiser (au contraire des formats des traitements de texte).
Il s’est très vite imposé comme format d’échange et d’archivage. Le format PDF n’est pas figé : il peut avoir des options personnalisées (compression des images et des textes, interdiction d'impression ou de modification…). Il peut surtout être uniquement graphique (vous ne pouvez pas copier le texte que vous voyez, il s’agit généralement d’une image qu’on a transformée en PDF) ou avoir une structure textuelle (vous pouvez copier le texte que vous voyez dans le fichier PDF).
Voir Image.
Pearltrees
Pearltrees est un outil en ligne qui permet d’agréger, d’organiser des pages web, des fichiers, des photos, des notes en créant des collections thématiques. Les collections sont publiques et accessibles à tous sauf pour les membres premium qui ont la possibilité de rendre leurs collections privées.
Site web : https://www.pearltrees.com
Périscope
Application web développée par l’ABES permettant de rechercher et afficher les états de collection des périodiques signalés dans le SUDOC. Elle est librement accessible mais il est impossible de modifier les données affichées.
Site web : https://periscope.sudoc.fr/
Perl
Perl est un langage de programmation créé en 1987 pour manipuler du texte. Il dérive du langage C et des scripts Shell, et intègre dans sa syntaxe les expressions régulières.
Formation : https://formation-perl.fr/guide-perl.html
Persée
Persée est une structure de service ayant pour mission de valoriser le patrimoine documentaire au bénéfice de la recherche en assurant sa diffusion, son enrichissement et sa préservation. Il s’agit d’un portail de diffusion de publications scientifiques, principalement dans le domaine des SHS. Il assure ainsi la diffusion de collections patrimoniales et propose des services tels que la recherche plein texte, le téléchargement au format PDF ou encore l’export des références bibliographiques.
Site web : https://www.persee.fr
Phon
Phon est un logiciel de création et d’analyse de corpus textuels et de corpus de données phonologiques.
Site web : https://www.phon.ca/phon-manual/getting_started.html
Plan de gestion des données
Le plan de gestion des données est un outil de gestion. Il se présente sous forme d’un document structuré en rubriques. Il a pour objectif de synthétiser la description et l’évolution des jeux de données de votre projet de recherche. Il prépare le partage, la réutilisation et la pérennisation des données.
Voir données de la recherche, FAIR Data, OPIDoR
Voir aussi le site de DoRANum - Cours en ligne (formation URFIST)
Plateforme
Une plateforme informatique est un espace de travail virtuel qui permet d’utiliser un ensemble de logiciels, de stocker et de diffuser des données, et enfin de travailler à plusieurs. Elle se confond souvent avec un site internet (qui n’est basé que sur une seule technologie) ou avec une bibliothèque numérique (qui rassemble des contenus ayant un lien entre eux).
Plugin
En informatique, un plugin ou plug-in, aussi nommé module greffon ou plugiciel (ou extension dans les CMS ou Omeka), est un paquet structuré de codes informatiques qui complète un logiciel hôte pour lui apporter de nouvelles fonctionnalités.
PNG
PNG (Portable Network Graphics) : format d’image ouvert standardisé par le W3C. Il a été conçu pour contourner le format GIF devenu semi-propriétaire et restrictif (nombre de couleurs notamment). Il s’agit d’une alternative intéressante par rapport au format JPEG car sa compression n’est pas destructive, ce qui implique aussi que son poids sera plus important.
Malgré de nombreux avantages (gestion de la transparence notamment), il reste encore peu utilisé car souvent associé à un usage web uniquement.
Pocket un est outil de veille documentaire qui permet de télécharger, sauvegarder, archiver, partager et tagger des liens hypertextes sur son ordinateur et/ou sur son smartphone.
Grâce au téléchargement, il est possible de lire les pages web sélectionnées hors connexion.
Site web : https://getpocket.com
Post-édition
La post-édition désigne l’activité qui consiste à repasser derrière un texte pré-traduit automatiquement pour le rendre humainement intelligible. Le langagier chargé d’effectuer cet exercice, à savoir le post-éditeur, a donc pour tâche de compléter, modifier, corriger, remanier, réviser et relire ce texte brut.
Voir Traduction ; Traduction automatique.
En savoir plus : https://journals.openedition.org/traduire/460.
PostGIS
Extension externe à PostgreSQL qui ajoute un support pour les objets géographiques. Elle permet d'exécuter des requêtes de localisation en SQL et peut être directement exploité dans plusieurs logiciels SIG.
PostgreSQL
PostgreSQL est un système open source de gestion de base de données relationnelles développé par l’université de Californie. Son nom a repris le nom du langage SQL qu’il utilise pour plusieurs fonctionnalités notamment les requêtes.
Site web : https://www.postgresql.org/
Praat
Praat est un package logiciel d’analyse phonétique et phonologique de corpus oraux.
Site web : https://www.fon.hum.uva.nl/praat/
Pré-publication
La pré-publication (ou preprint) est la version d’un article scientifique antérieure à la publication dans une revue scientifique et généralement antérieure à la révision par les pairs.
La pré-publication peut être déposée en libre accès via des serveurs dédiés ou des archives ouvertes telles que HAL.
PROGEDO
L’infrastructure de recherche PROGEDO a pour but de développer la culture des données, d’impulser et structurer une politique des données d’enquêtes pour la recherche en sciences sociales.
Quetelet-Progedo-Diffusion contribue à répondre aux problématiques d’archivage, de documentation et de diffusion des données françaises pour la recherche en sciences humaines et sociales. Le Centre d'Accès Sécurisé aux Données (CASD) organise l'accès aux données confidentielles. L'infrastructure organise enfin l'accès aux enquêtes internationales européennes ainsi qu'autres catalogues de données comme l'Inter-university Consortium for Political and Social Reasearch (ICPSR) américain.
Site web : https://www.progedo.fr/
Progiciel
Un progiciel est un ensemble de programmes informatiques élaborés pour être fourni à plusieurs utilisateurs en vue d’une même application ou d’une même fonction.
Il s’agit donc d’une catégorie de logiciels qui répond aux besoins communs de plusieurs utilisateurs à la différence des logiciels développés au sein d’une entreprise pour répondre à un besoin spécifique à cette entreprise.
Le terme est également employé pour désigner les logiciels professionnels composés de plusieurs modules communiquant entre eux et dont chacun assure une fonction.
Programmation informatique
Dans le domaine de l'informatique, la programmation, appelée aussi codage, est l'ensemble des activités qui permettent l'écriture des programmes informatiques. C'est une étape importante du développement de logiciels (voire de matériel).
Site web de MOOCs pour se former en programmation : https://www.my-mooc.com/fr/categorie/programmation
Programme informatique
Un programme informatique est un ensemble d'opérations destinées à être exécutées par un ordinateur. Un programme source est un code écrit par un informaticien dans un langage de programmation. Il peut être compilé vers une forme binaire, ou directement interprété.
Protégé
Protégé est un logiciel qui permet la création d'ontologies. Il peut lire, créer, et sauvegarder des fichiers d'ontologie dans la plupart des formats : RDF, RDFS, OWL.
Site web : https://protege.stanford.edu/
Python
Python est langage informatique de programmation majoritairement utilisé dans les domaines de Data Science, Big Data et Machine Learning. Il permet d’automatiser l’écriture de script ce qui facilite son utilisation et fonctionne sur tous les principaux systèmes d’exploitation.
Il est employé à différentes fonctions comme la création de logiciel, l’analyse de données, la gestion d’infrastructures, à l’inverse du langage HTML dédié à la programmation web.
QGIS
QGIS est un logiciel libre et open source de traitement des données géographiques. Il est multi-plateforme et peut être utilisé sur plusieurs systèmes d’exploitation.
Il gère à la fois les
QGIS est une alternative à ArcGIS et fédère une large communauté. Il implique de nombreuses dépendances comme SQLite, GDAL ou PostGIS.
Site web : https://www.qgis.org/fr/site/
QR Code
Le QR Code (Quick Response Code) est un code-barre en deux dimensions dont l’agencement des points (noirs sur fond blanc) définit l’information contenue dans le code.
Ce code permet de stocker des données facilement lues par des applications et déclenchant des actions telles que la connexion à un site web, l’envoi d’un SMS, la connexion à une borne wifi, l’affichage d’un texte.
Il est lisible par les téléphones mobiles pourvus d’une application dédiée à sa lecture.
QUANTI
La liste de discussion "Quanti", créée après la journée d'études "Enseigner le quanti" qui a eu lieu à Paris le 5 juin 2015, a pour vocation d'accueillir les contributions et les échanges de toutes celles et tous ceux qui s'intéressent aux questions d'enseignement des méthodes quantitatives dans les sciences sociales.
Le wiki de la liste de diffusion propose une liste de logiciels généralistes et de logiciels spécialisés pour la construction et l'analyse de données d'enquêtes ou encore de données textuelles et de réseaux.
Site web : https://groupes.renater.fr/sympa/info/quanti
R
R est un outil de programmation (comme SPSS ou SAS, par exemple) et un langage de programmation.
Il permet de manipuler des données, faire des calculs et créer des graphiques. Il est libre et ouvert au développement, chaque utilisateur peut développer ses propres packages.
RAMEAU
RAMEAU, pour Répertoire d’Autorité-Matière Encyclopédique et Alphabétique Unifié, est langage documentaire d’indexation matière. Le langage RAMEAU permet l’indexation analytique de tous les types de documents. Il s’agit d’un répertoire qui contient des notices d’autorité-matière reliées entre elles et qui permet la recherche par sujet dans les catalogues.
Site web : https://www.bnf.fr/fr/indexation-sujet-les-referentiels-utilises-par-la-bnf#bnf-rameau
RawGraphs
RawGraphs est un outil en ligne de visualisation de données tabulaires. Il est possible de télécharger les visualisations ainsi constituées sous forme d’images prêtes à la publication ou sous forme de fichiers .svg pouvant être retravaillés avec des logiciels d’édition d’images vectorielles.
Site web : https://app.rawgraphs.io
RCommander
RCommander (Rcmdr) est un package R. Son interface graphique permet à l'utilisateur l'analyse statistique de documents textuels sans avoir à programmer, à rédiger des scripts R.
RDA-FR
Le RDA est un code de catalogage à vocation internationale qui fonde ses règles d’identification et de description des ressources sur le modèle FRBR.
Le RDA-FR constitue la transposition du code RDA au contexte de catalogage français. Il remplace progressivement les normes AFNOR de catalogage.
RDF
RDF (Resource Description Framework) : modèle simplifié de description de données dont le principe de base consiste à transformer l’information des ressources afin qu’elles puissent être lisibles par les machines et permettre, par conséquent, la création de liens à partir des valeurs des relations. Sa « grammaire » est constituée de triplets de trois éléments : sujet, prédicat et objet. Les données RDF sont stockées dans un triple store.
Voir Web sémantique.
Re3Data
Il s’agit d’un répertoire mondial qui recense les entrepôts de données de recherche.
Il fournit un moteur de recherche qu’il est notamment possible d’interroger par discipline.
Site web : https://www.re3data.org/search
React
React est une bibliothèque JavaScript open source utilisée pour la création d’interfaces utilisateur interactives et réactives. Il est possible d’ajouter React à une page HTML de manière très facile. React est très utilisé pour concevoir des sites web ou bien des applications mobiles.
Site web : https://react.dev/
Tutoriel : https://www.youtube.com/watch?v=Ke90Tje7VS0&ab_channel=ProgrammingwithMosh
READ
Recognition and Enrichment of Archival Documents. Plateforme de transcription et outil de reconnaissance automatique d’écriture manuscrite (HTR).
Voir Transkribus, eScriptorium
Reaveal.js
Reaveal.js est une librairie javascript open source servant à créer des présentations diaporama sur le web en codant en HTML. Un éditeur visuel nommé Slides a été développé pour ceux qui n’ont pas de compétences en codage. Cette librairie inclut un module d’écriture en markdown et un autre en LaTeX. Elle permet de faire des animations, d’intégrer des notes audios, ou encore d’exporter en pdf la présentation.
Site web : https://revealjs.com/
Recherche à facettes
La recherche à facettes est basée sur une classification préalable des données qui fonctionne à la manière d'un crible : les facettes proposent un résultat en fonction de l'indexation des données à l'intérieur de la classification.
Elle se distingue de la recherche avancée en ce qu'elle ne permet pas de construire des requêtes personnalisées, par exemple en ajoutant des opérateurs booléens (« et », « ou », « sauf »).
Recherche avancée
Recherche par requête ou multi-critères. La recherche avancée peut aussi porter sur des métadonnées ou des annotations.
Voir Opérateurs booléens
Recherche plein texte
La recherche plein texte consiste en une technique de recherche au sein d’un document électronique ou d’une base de données textuelles, dans laquelle le moteur de recherche examine tous les mots (chaînes ou suites de caractères) de chaque document enregistré.
Recherche simple
La recherche simple se concentre sur un seul champ de recherche (mot, auteur, titre), à l’inverse de la recherche avancée qui permet de croiser plusieurs critères de recherche (titre et auteur ; titre, auteur et date de publication, etc.).
Référencement
Le référencement est, sur le web, l’action de référencer, c’est-à-dire d’indexer toutes les pages web présentes, en faisant un lien d’une page vers une ressource, généralement un moteur de recherche.
Aujourd’hui, le référencement consiste surtout à améliorer la place d’un site dans les résultats afin d’être le plus consulté possible. Pour cela il existe deux pratiques :
-
le SEO pour Search engine optimization, aussi nommé « référencement naturel », qui est un ensemble de techniques et méthodes pour améliorer le classement de son site dans les pages de résultat d’un moteur de recherche ;
-
le SEA pour Search Engine Advertising, qui est une pratique marketing payante visant le même objectif.
Voir : http://aide.meabilis.fr/glossaire/r/definition-referencement.html
Référentiel
Ensemble d'informations servant de références, parce qu'elles font autorité, ou parce qu'elles représentent un point de vue privilégié ou offrent une description stable d'une réalité. Un dictionnaire, une nomenclature, un système de coordonnées sont des référentiels.
Certains référentiels sont constitués de données structurées selon des schémas et/ou des vocabulaires standardisés afin de pouvoir être mis en commun d'un système d’information à un autre. Plus généralement on appelle souvent référentiel un thésaurus vérifié et contrôlé permettant d'enrichir des données au sein d'un système d'information.
AURéHAL donne accès par exemple à l'ensemble des référentiels utilisés par la base de données de l'archive ouverte HAL, sous forme de thésaurus contrôlés. Certains de ces thésaurus sont ouverts (celui des auteurs peut être enrichi par les interventions des usagers de l'archive), d'autres sont fermés (le thésaurus des domaines de recherche associés aux publications par exemple). Pour produire et exposer des données de bonne qualité, la plupart des instruments numériques s'appuient sur de tels référentiels, ouverts ou fermés : l'un des plus impressionnant est Rameau qui tient lieu de méta-référentiel pour les données des catalogues de la BNF et les données d'autorité.
Voir Base de données ; Interopérabilité.
Exemples : voir Geonames, Rameau, VIAF.
Ressources web : Référentiels d'Isidore ; Référentiels de la BNF
RENATER
RENATER est le REseau NAtional de télécommunication pour la Technologie, l’Enseignement et la Recherche.
Il s'agit d'un groupement français d’intérêt public créé en 1993 qui assure la gestion du réseau d’interconnexion entre les établissements d’enseignement et de recherche.
Site web : https://www.renater.fr/
RePEc
RePEc (Research Papers in Economics) est un projet collaboratif dont le principal outil développé est une base de données bibliographique décentralisée spécialisée dans la recherche économique.
La base de données recense des papiers de recherche, des articles, des programmes et des logiciels. Les métadonnées collectées sont ensuite utilisées dans divers services tels que EconPapers, IDEAS, NEP ou encore LogEc.
Le réseau RePEc propose d'autres services :
-
RePEc Author Service : fournit un profil utilisateur au chercheur en économie qui le souhaite ;
-
RePEc Biblio : assure une veille bibliographique en économie et fournit de nombreuses bibliographies thématiques régulièrement mises à jour ;
-
RePEc Genealogy : permet de relier les profils de chercheurs entre eux selon des liens tels que « étudiant-professeur » ;
-
SocioRePEc : permet d’annoter les ressources documentaires en PDF et d’établir des relations scientifiques entre les ressources.
Site web : http://repec.org
Répertoire
Inventaire méthodique (énumération, liste, table, etc.) où les informations sont classées dans un ordre qui permet de les retrouver facilement, support d’informations. En informatique, un répertoire (dossier ou folder) est une liste de descriptions de fichiers. L’endroit de rangement de nos fichiers informatiques.
Requête
En informatique, le terme requête peut prendre plusieurs sens. Il peut s’agir d’une expression saisie dans un navigateur internet pour interroger un moteur de recherche afin de trouver l’adresse d’un site. Il désigne également l’URL d’une page web, saisie dans la barre d’adresse du navigateur web pour atteindre cette page.
Dans le monde des bases de données, une requête SQL est un ordre d’exécution de traitement sur les données (extraction ou modification de données, par exemple).
Réseau de neurones
En informatique, un réseau de neurones est un système qui imite le fonctionnement des neurones biologiques.
Les réseaux neuronaux, appelés RNA (réseaux de neurones artificiels) ou ANN (Artificial Neural Network) font partie des technologies utilisées en deep learning ou intelligence artificielle (IA).
Résolveur de liens
Un résolveur de lien est un outil informatique qui permet de faire le lien entre une citation bibliographique et le texte intégral d’une ressource documentaire numérique pour laquelle une bibliothèque a souscrit un abonnement.
Cet outil s’appuie sur la norme OpenURL qui décrit la syntaxe pour l’acheminement des métadonnées depuis la ressource jusqu’au résolveur de liens et jusqu’aux services de la bibliothèque.
Ressource électronique
Une ressource électronique est un document encodé de façon à être exploitable par un ordinateur.
Rétroconversion
Informatisation d’un catalogue papier afin de le rendre consultable via un catalogue en ligne. L’informatisation des catalogues permet aux lecteurs de pouvoir effectuer des requêtes plus ou moins complexes (recherche simple / recherche avancée) sur les collections, et offre de nouveaux services tels que l’affinage des résultats par facettes (recherche à facettes).
On parle aussi de plus en plus de rétroconversion pour tout processus de mise à disposition numérique d'un contenu auparavant imprimé (pour des anciens numéros de revues par exemple).
RGPD
L’acronyme RGPD, « Règlement Général sur la Protection des Données », encadre le traitement des données personnelles sur le territoire de l’Union européenne.
Le contexte juridique s’adapte pour suivre les évolutions des technologies et de nos sociétés (usages accrus du numérique, développement du commerce en ligne, etc.). Ce nouveau règlement européen s’inscrit dans la continuité de la Loi française Informatique et Libertés de 1978 et renforce le contrôle par les citoyens de l’utilisation qui peut être faite des données les concernant. Il harmonise les règles en Europe en offrant un cadre juridique unique aux professionnels. Il permet de développer leurs activités numériques au sein de l’UE en se fondant sur la confiance des utilisateurs.
Rip Sentences
Rip Sentences extrait le texte d’une page web spécifique et force les sauts de ligne entre les phrases.
Robots.txt Discovery
Cet outil permet d’exposer le protocole d’exclusion des robots, protocole placé à la racine des sites web et qui contient la liste des ressources des sites web qui ne doivent pas être indexées par les moteurs de recherche.
Site web : https://tools.digitalmethods.net/robots/
RSS
Le RSS (Really Simple Syndication) est une famille de formats basée sur le langage XML dont l’objectif est la syndication de contenus web. Il est souvent utilisé pour obtenir des mises à jour d’information et effectuer de la veille informationnelle.
Un flux RSS est un fichier contenant une liste de contenus ou de pages web. Cette liste peut présenter les diverses métadonnées associées aux contenus ou aux pages web ainsi que les liens permettant d’y accéder.
SailAlign
SailAlign constitue un boîte à outils d’alignement phonétique acceptant de très longues séquences et prenant en charge les langues anglaise et espagnole.
Sandcrawler
Sandcrawler est une librairie JavaScript fournissant des outils d’aide à la conception de crawlers et de scrapers complexes.
Cette librairie est considérée comme archivée, n'étant plus maintenue depuis longtemps.
Voir aussi : Web scraping
Site web : http://medialab.github.io/sandcrawler/
Science ouverte
Le mouvement de la science ouverte (open science) vise à construire un écosystème dans lequel la science sera plus cumulative, mieux soutenue par les données, plus transparente, plus rapide et offrant un accès universel. Il s’agit de rendre la recherche scientifique et les données qu’elle produit accessibles à tous et dans tous les niveaux de la société.
Ce mouvement oeuvre pour des sciences participatives et citoyennes.
Voir Open archives (archive ouverte) ; HAL ; Open data (donnée ouverte) ; Open access (Accès ouvert), Épi-revue ; Episciences, Couperin
Site web : https://www.ouvrirlascience.fr/open-science/
Définition sur le site du MESR - L'Open Science sur le site de l'université d'Angers
ScienceScape
ScienceScape est un environnement en ligne fournissant des outils scientométriques tels que des outils de conversion de fichiers ou encore de production et de visualisation de réseaux.
Site web : https://medialab.github.io/sciencescape/
Sciencesconf
Sciencesconf est une plateforme web multilingue à destination des organisateurs de colloques, conférences scientifiques, workshops. Elle est réservée aux établissements de l’enseignement supérieur et de la recherche.
Elle permet de gérer et de faciliter les différentes étapes de planification des manifestations scientifiques : de la réception des contributions en passant par la relecture et la programmation des axes et thématiques jusqu’à l’édition automatique des actes.
Il s’agit d’un service géré par le CCSD.
Scoop-it
Scoop-it est un outil de veille et de curation de contenu qui permet de créer des pages web thématiques alimentées par les contenus découverts grâce à la veille et de les partager avec d’autres utilisateurs.
Site web : https://www.scoop-it.fr
Screenshot Generator
Il s’agit d’un outil permettant de générer des captures d’écran à partir d’une liste d’URLs.
Site web : https://wiki.digitalmethods.net/Dmi/ToolScreenshotGenerator
Scripta-PSL
Le programme Scripta-PSL vise à relier les sciences fondamentales de l’écrit (paléographie, épigraphie, codicologie, etc.) ainsi que d’autres SHS comme la linguistique, l’histoire ou encore l’anthropologie aux humanités numériques autour de l’étude de l’écrit.
Site web : https://scripta.psl.eu/presentation/
Search Engine Scraper
Cet outil permet de récupérer les résultats des moteurs de recherche générés suite à une requête. Il permet notamment de comparer les résultats de différents moteurs de recherche pour une même requête.
Voir aussi : Web scraping
Site web : https://tools.digitalmethods.net/beta/searchEngineScraper/
SeeAlsology
SeeAlsology est un outil permettant d’explorer la zone sémantique des pages wikipédia en produisant un graphe des liens de la section « Voir aussi » des articles.
Site web : https://densitydesign.github.io/strumentalia-seealsology/
SEO Search Engine Optimization
Le SEO pour Search Engine Optimization, aussi nommé « référencement naturel », est un ensemble de techniques permettant à un site web d’améliorer son classement dans les pages de résultat d’un moteur de recherche. Le SEO repose sur la conception technique du site web, sur son contenu informatif, et sur l’affluence des visiteurs.
Le SEO est à différencier du SEA Search Engine Advertising qui est une pratique marketing payante permettant de faire apparaître un site web dans les premiers résultats d’un moteur de recherche.
Serveur
Un serveur informatique est un ordinateur qui offre des services à un ou plusieurs clients (parfois des milliers). Généralement, on parle de serveur pour désigner la machine qui héberge et diffuse des sites internet.
Shapefile
Shapefile (.shp) : format de fichier SIG le plus courant développé et publié par ESRI en 1998 en parallèle du SIG ArcGIS. De spécification ouverte, ce format est devenu un standard, utilisé par la plupart des logiciels SIG (libres ou commerciaux). Il consiste en une collection de fichiers de même noms et d'extensions propres, dont trois sont obligatoires : .SHP (la forme géométrique), .SHX (l'index de la géométrie) et .DBF (les données attributaires).
ShareDocs
ShareDocs est une plateforme de gestion de fichiers. Il s’agit d’un service développé par Huma-Num qui permet le stockage et le partage de fichiers.
Le stockage est déporté en ligne sur le réseau de recherche français. Les données hébergées peuvent être cryptées grâce à des outils comme ZED encrypt. ShareDocs est souvent utilisé pour la préparation de fichiers en vue d’une édition ou d’une diffusion en ligne.
Site web : https://documentation.huma-num.fr/sharedocs-stockage/
SHS
Les Sciences Humaines et Sociales (SHS) sont un ensemble de disciplines s'intéressant aux phénomènes qui touchent à l'humain (linguistique, psychologie, perception, cognition) ou aux groupes d'hommes (sociologie, histoire, géographie, etc.).
SIG
Le terme de système d’information géographique renvoie aussi bien à des technologies, qu’à des processus et méthodes. Les logiciels de SIG sont conçus pour acquérir, stocker, traiter et diffuser de l’information géographique, sous forme de plans et de cartes.
Ces logiciels sont parfois disponibles sous forme d’application disponibles sur des sites web, on les appelle alors WebSIG.
Voir Géomatique, Chronocarto, ArcGIS, QGIS, GrassGIS, GeoServer
Sigma.js
Sigma.js est une librairie JavaScript permettant de visualiser des réseaux directement dans le navigateur.
Site web : http://sigmajs.org
Signet
A l’origine, un signet (bookmark) s’apparente à un marque-page. Il s’agit d’un ruban ou d’un filet inséré entre deux pages d’un livre de façon à signaler l’endroit que l’on souhaite retrouver.
Du point de vue numérique, le signet constitue un mode d’accès rapide à un site web dont l’adresse est préalablement stockée en mémoire par l’internaute. Un signet ne stocke que la localisation d’un site ou d’une page web et pas son contenu. Il est possible de créer des répertoires de signets pour conserver et classer plusieurs adresses électroniques.
SILL
Le SILL, socle interministériel des logiciels libres, est un catalogue de logiciels recommandés pour les administrations.
Site web : https://sill.etalab.gouv.fr/software
Site
Un site web, ou simplement site, est un ensemble de pages web et de ressources reliées par des liens hypertextes ; il est défini et accessible par une adresse web. Un site est hébergé sur un serveur web accessible via le réseau mondial internet ou via un intranet local. L’ensemble des sites web constitue le World Wide Web.
Sketch Engine
Sketch Engine est une plateforme qui héberge des corpus. Il permet d'analyser des textes en langue naturelle, et prend en charge plus de 90 langues. Il est utilisé par les linguistes, les traducteurs.
Site web : https://www.sketchengine.eu/
SKOS
Le SKOS (Simple Knowledge Organization System, en français système simple d’organisation des connaissances), est un modèle de données servant à décrire un vocabulaire structuré tel qu'un thésaurus. Le SKOS est développé par le W3C, en suivant le format RDF afin d’être interopérable.
Site web : https://www.w3.org/TR/2009/REC-skos-reference-20090818/
SKOS Play
SKOS Play est un service en ligne gratuit de visualisation de thésaurus suivant le format SKOS. Il permet pour un vocabulaire d’en vérifier la conception, de le communiquer à des collaborateurs, de le publier, et d’en faire des représentations graphiques. L’outil propose également de convertir des feuilles de calcul Excel en fichier SKOS.
Site web : https://skos-play.sparna.fr/play/
Software Heritage
Software Heritage est une plateforme d’archivage de logiciels open source sous la forme de leur code source. Elle est développée par l’INRIA (l’Institut national de recherche en sciences et technologies du numérique).
Site web : https://www.softwareheritage.org/
Source Code Search
En entrant une URL, cet outil permet de rechercher des motifs dans le code source de la page.
Site web : https://tools.digitalmethods.net/beta/sourceCodeSearch/
SPARQL
SPARQL est un langage informatique de programmation. Plus précisément, il s’agit d’un langage de requête et d’un protocole.
Il permet de récupérer, de rechercher, ajouter, modifier et supprimer des données de type RDF disponibles sur Internet. Il est équivalent au langage SQL mais il respecte les standards du W3C et permet la transmission des données à travers le réseau.
SPARQL peut récupérer les données stockées sur des serveurs SPARQL, autrement appelés Triple Store. Souvent, SPARQL est utilisé conjointement à un autre langage de programmation.
SpartiaLite
Bibliothèque open source qui étend la bibliothèque SQLite (base de données relationnelle accessible par le langage SQL) en lui donnant des capacités spatiales.
SPPAS
SPAAS est un logiciel d’annotations phonétiques automatisé avec alignement son-texte qui prend en charge plusieurs langues européennes et asiatiques.
Site web : http://www.sppas.org
SQL
Le SQL (Structured Query Language) est un langage informatique de définition et de manipulation des données ainsi qu’un langage de protection d’accès. Autrement dit, il permet de créer, modifier ou supprimer des tables dans une base de données relationnelle.
Il permet également de sélectionner, modifier, insérer ou supprimer des données au sein d’une table d’une base de données relationnelles.
Avec SQL, il est enfin possible de définir différentes permissions d’accès en fonction des utilisateurs de la base de données, on parle alors de DCL (Data Control Language).
Star
Star est une application professionnelle nationale mise à disposition des établissements habilités à délivrer le diplôme de doctorat.
Cette application sert au signalement et à l’archivage des thèses au format électronique.
Site web : https://abes.fr/reseau-theses/outils-et-services-theses/signalement-theses/
Stylo
Stylo est un éditeur de textes scientifiques qui simplifie la rédaction et l’édition d’articles scientifiques en SHS.
Stylo comprend plusieurs modules : un éditeur de métadonnées, un gestionnaire de versions, un gestionnaire de bibliographie, un outil d’annotation, différents formats d’export, le partage des documents dans le cas d’une édition collaborative.
Site web : https://documentation.huma-num.fr/stylo/
Stylométrie
En linguistique, la stylométrie est une méthode de fouille de texte qui utilise les statistiques pour définir le style d’un texte.
Voir Textométrie
SVG
SVG (Scalable Vector Graphics) est un format de données basé sur le langage XML qui permet notamment de décrire des images vectorielles.
Il s’agit d’un format utilisé, entre autres, dans le domaine de la cartographie.
Système d’information
Système constitué des ressources humaines (le personnel), des ressources matérielles (l’équipement) et des procédures permettant d’acquérir, de stocker, de traiter et de diffuser les éléments d’information pertinents pour le fonctionnement d’une entreprise ou d’une organisation.
Dans une institution ou une entreprise, le sigle DSI correspond souvent à : "Département du Système d'Informations"
Table 2 Net
Table 2 Net est un outil qui permet de créer un graphique de réseau à partir d’un fichier CSV.
Site web : https://medialab.github.io/table2net/
TACT
TACT est une plateforme collaborative de transcription et d’annotation de corpus textuels.
Site web : https://tact.demarre-shs.fr
Tag
Terme anglais qu’on traduit par « étiquette » ou « mot-clé », le tag est une caractéristique attribuée à l’objet décrit. Il permet des regroupements des objets selon les mots-clés associés (lesquels se rapportent souvent à des thématiques). C’est une métadonnée complexe à spécifier : pour que l'indexation soit pertinente, il convient de choisir un nombre limité de mots-clés ou thématiques, et d'éviter les redondances.
Une visualisation par nuage de tags est une représentation visuelle des tags les plus utilisés sur un site web : généralement, les tags s'affichent dans des tailles et des polices de caractères d'autant plus visibles qu'ils sont utilisés ou populaires.
Tag Cloud Combinator
En entrant deux ou plusieurs nuages de mots-clés dans cet outil, il fait la somme de la valeur de chacun des mots-clés en double et les combine.
Voir Tag
Site web : https://tools.digitalmethods.net/beta/tagCloudCombinator/
Tag Cloud Generator
Cet outil permet de produire des nuages de mots-clés en entrant des tags et leur valeurs. Le résultat se traduit sous forme de fichier SVG.
Tag Cloud HTML Generator
Cet outil permet de produire des nuages ou des listes de mots-clés au format HTML en utilisant des tags et des valeurs au format wordle.
Site web : https://wiki.digitalmethods.net/Dmi/ToolTagCloudHTMLGenerator
Tag Cloud to Wordle
Cet outil permet de transformer un nuages de mots-clés en un nuage de mots-clés wordle.
Voir Tag
Site web : https://tools.digitalmethods.net/beta/tagcloudToWordle/
TAL
Le traitement automatique des langues (TAL) est un domaine de recherche pluridisciplinaire au carrefour de la linguistique, de l’informatique et de l’intelligence artificielle (en particulier l’apprentissage artificiel). Il entretient aussi des liens privilégiés avec d’autres domaines, comme la didactique ou les sciences cognitives.
Le TAL vise à modéliser le langage humain à des fins d’automatisation au moyen de méthodes symboliques et statistiques ; récemment, les approches neuronales (apprentissage profond) ont permis des avancées importantes. Le TAL utilise et produit des outils logiciels et des ressources linguistiques.
Le TAL peut permettre de repérer les entités nommées dans un texte, identifier des concepts, des acteurs et leurs relations ou encore regrouper les documents similaires dans un corpus (clusterisation). La traduction automatique ou la recherche d’informations multilingues (par exemple dans des bases de brevets) sont des applications phares du TAL. À un niveau plus théorique, le TAL a aussi permis des avancées importantes dans des domaines comme l’acquisition du langage ou la modélisation de l’évolution des langues (diachronie).
Talend
Talend est un logiciel qui permet de répondre à toutes les problématiques liées au traitement des données. Le logiciel permet de nettoyer des bases de données au format csv par exemple.
Site web : https://www.talend.com/fr/
Tutoriel : https://www.youtube.com/watch?v=HlAXBcEKZ0s&list=PL1YiNEARI38JZPPenoA2ueRHzT3wWGXv6
TEI
La TEI (Text Encoding Initiative) est un consortium fondé pour normaliser l'usage du langage XML pour l'encodage sémantique de textes historiques et littéraires. Par extension, on appelle TEI l'ensemble des balises et leurs règles d'application telles que définies et régulièrement mises à jour par le consortium.
Site web : https://tei-c.org/
Telemeta
Telemata est un logiciel qui permet l’archivage sécurisé, la sauvegarde, le transcodage, l’analyse et la publication de fichiers audios et vidéos auxquels sont liées des métadonnées approfondies.
Site web : http://telemeta.org
Tesselle
Tesselle est une application web qui permet l’exploitation de ressources iconographiques. Elle permet notamment d’annoter des images de grand format et en haute définition.
Site web : https://medialab.github.io/tesselle/#/
Tesseract
Logiciel libre et open source de reconnaissance optique de caractère (OCR).
Site web : https://github.com/tesseract-ocr/tesseract
Text and Data Mining
Le Text and Data Mining (TDM) est un ensemble de traitements automatisés extrayant et analysant des informations (textes, images, données, sons, etc) stockées dans des corpus numériques conséquents dans le but d’en tirer de nouvelles connaissances.
Il s’appuie notamment sur les méthodes d’analyse linguistique. Ces traitements répondent à la croissance importante des données numériques qui rend difficile le travail « manuel » de veille, d’analyse et d’exploitation, des chercheurs.
Voir Fouille de texte
Text Ripper
Cet outil permet d’extraire tout le texte d’une page web spécifique.
Site web : https://tools.digitalmethods.net/beta/textRipper/
TextObserver
TextObserver est un logiciel d’observation et d’analyse statistique de données textuelles.
Site web : http://textopol.u-pec.fr/textobserver/
Textométrie
La textométrie est l’application de calculs sur des données textuelles : statistique lexicale, analyses factorielles, classifications.
DtmVic, Hyperbase, IRaMuTeQ, Lexico 5, Le Trameur, TXM sont des outils dédiés à l'analyse textométrique.
Voir Stylométrie
The Old Reader
The Old Reader est un outil de veille qui permet d'agréger des flux RSS et des pages web sur une interface utilisateur personnelle. Il est gratuit en dessous de 100 flux.
Site web : https://theoldreader.com/home
Thème/Template
Un template (ou « thème », « layout », etc.) désigne l’enveloppe graphique d’un site internet, indépendamment de son contenu. Il s’agit par exemple de la disposition des colonnes, du choix des caractères ou des couleurs, de la structure des différents éléments, etc. Un template propose plusieurs pages web de base et des feuilles de style. Cela permet de séparer le contenu (les données) et le contenant (le thème), celui-ci pouvant être changé facilement sur les différents CMS.
Thésaurus
Répertoire structuré de termes (mots clés) pour l’analyse de contenu et le classement de documents.
Voir : Opentheso
En savoir plus : https://www.cnrtl.fr/definition/thésaurus
TIFF
TIFF (Tag Image File Format) : format image propriétaire mais pleinement documenté, il est maintenant maintenu par Adobe. Ce format se caractérise par un en-tête riche comportant des métadonnées de format EXIF, IPTC et XMP. Doté d’une version sans compression, c’est un format image largement utilisé pour la conservation pérenne de numérisation haute qualité et pour l’impression en couleurs.
Voir Image.
Timeline JS
Développé par le Northwestern University Knight Lab, Timeline JS est un service en ligne et gratuit de création de frise chronologique, codé en JavaScript. Cet outil de visualisation utilise des données d’un document Google Sheet pour créer la frise. Cette frise peut ensuite être intégrée dans une page web.
Site web : http://timeline.knightlab.com/
Timestamp Ripper
Cet outil permet d’extraire et de présenter la dernière date de modification d’une page web.
TLD Counts
En entrant des URLs cet outil permet de compter les domaines de premier niveau (top level domains).
TMX
TMX (Translation Memory eXchange) est un format de fichier basé sur le standard XML. Il est utilisé pour aligner les traductions de phrases dans différentes langues.
Toolbox
Toolbox est un outil de gestion et d’analyse de données linguistiques écrites. Il permet l’annotation multi-linéaire, la création de lexique, le tri.
Site web : https://software.sil.org/toolbox/
Tracker Tracker
Cet outil permet de détecter, dans une liste d’URLs, les empreintes prédéfinies des technologies de traquage web.
Voir aussi : App Tracker Explorer
Site web : https://tools.digitalmethods.net/beta/trackerTracker/
Traduction
Traduire s’est transposer dans une langue cible un texte donné dans une langue source. La traduction doit rendre compte le plus fidèlement possible du texte d’origine tout en étant parfaitement intelligible et correct dans la langue cible. Elle ouvre une multitude de questions de nature linguistique, psychologique, voire philosophique, afin de s’interroger sur les caractéristiques d’une « bonne traduction ».
Traduction automatique
Aussi appelée, Machine Traduction (MT) ou TAO (traduction automatique outillée), la traduction automatique est la traduction d'un texte effectuée par ordinateur, sans intervention humaine. Ses débuts remontent aux années 50. D’abord basée sur des dictionnaires et règles de transfert, puis sur l’analyse statistique de très grands corpus, elle s’appuie désormais sur l’apprentissage profond.
La qualité des traductions réalisées automatiquement est une question largement débattue. Les mémoires de traduction (bases de données où les traducteurs peuvent trouver des exemples de traductions passées) et la post-édition par un correcteur humain permettent d’améliorer les qualités de la traduction automatique.
Voir : Intelligence artificielle, DeepL, TAL.
TraduXio
TraduXio est une plateforme participative de traduction de textes culturels. Il permet d’analyser et de comparer les traductions d’une même oeuvre, de conserver toutes les contributions d’un utilisateur, de rechercher la traduction d’un ou plusieurs termes au sein d’une bibliothèque d’oeuvres, de travailler à plusieurs sur la même traduction, de sélectionner une licence en suivant le modèle Creative Commons.
Site web : https://traduxio.org
Train & Align
Train & Align est un outil en ligne qui permet d’aligner automatiquement du son avec sa transcription.
Site web : http://cental.fltr.ucl.ac.be/train_and_align/publi.php
Transana
Transana est un logiciel d’analyse qualitative de données audios et vidéos. Elle permet l’importation, l’organisation, la transcription, le codage, l’interprétation et la présentation des données.
Site web : https://www.transana.com
Transcriber
Transcriber est un outil d’analyse de données orales. Il permet la segmentation, l’étiquetage, la transcription et l’annotation de fichiers audios.
Transcription
En paléographie, la transcription consiste à reproduire un texte manuscrit, en notant les particularités du texte et rétablissant (ou non) les erreurs ou les abréviations qu'il peut contenir ; on parle de transcription diplomatique quand tous les phénomènes visibles du texte sont reproduits (comme la reproduction des retours à la ligne).
En édition numérique, il s’agit de reproduire sous forme textuelle un texte qui a été numérisé en mode image. La transcription en contexte numérique obéit aux mêmes principes et méthodologies que la transcription « classique », les problèmes étant les mêmes. Tout travail de transcription est basé sur des principes d’annotation.
En linguistique de l'oral, la transcription d'enregistrements audio (par exemple au format MP3) consiste à reproduire le texte de ce qui est verbalisé - en général en attribuant chaque prise de parole à un locuteur -, et éventuellement à encoder différents événements non verbaux significatifs de l'interaction (intonation, silences, bruits, gestes, regards...). Le texte peut être transcrit en orthographe standard (proche de l'écrit) ou oralisé (proche des caractéristiques auditives : troncatures, répétitions, particularités de prononciation...).
Ces transcriptions peuvent être synchronisées avec l'enregistrement au niveau des prises de paroles voire au niveau des mots. Dans ce dernier cas, la synchronisation est calculée automatiquement par des logiciels. La synchronisation permet d'écouter l'enregistrement au moment de la prononciation d'une certaine prise de parole ou d'un mot particulier de la transcription, ou bien d'afficher la transcription au fil de l'écoute de l'enregistrement.
Voir OCR, Transcriber, Transkribus, eScriptorium, READ, HTR
Transkribus
Transkribus est un outil qui permet la reconnaissance de caractères dans des documents transcrits (manuscrits ou imprimés). Il peut être utilisé en local ou via sa plateforme.
Il est porté par l’université d’Insbruck.
Voir : HTR
Site web : https://transkribus.eu/Transkribus
Triangulate
Triangulate permet d’extraire et de visualiser les points communs entre plusieurs URLs. Les visualisations possibles incluent un diagramme de Venn.
Site web : https://tools.digitalmethods.net/beta/triangulate/
Triple store
Entrepôt de données conçu pour le stockage et la récupération de données structurées en RDF. Le langage de requêtage est SPARQL.
Troncature
La troncature est un opérateur qui permet de remplacer des caractères au sein d’un mot. Elle permet par exemple d’élargir une recherche par mot-clé à tous les termes ayant une racine commune. Elle se matérialise le plus souvent par une astérix (*) à la fin d’un mot.
Ainsi, une recherche « jardin* » donne des résultats pour les termes « jardins », « jardiner », « jardinier », « jardinière », « jardinage », « jardinerie ».
Voir Opérateurs booléens
Tropy
Tropy est un logiciel libre et open source de gestion de photothèque développé en 2017 par le Center for History and New Media de l'Université George Mason, qui a également développé le logiciel Zotero. Conçu pour organiser des corpus d'images d'archives, il permet d'annoter des images, de leurs ajouter des tags, et de gérer leurs métadonnées. Le logiciel est téléchargeable pour une utilisation local.
Site web : https://tropy.org/
Tumblr
Cet outil permet de récupérer, d’analyser et de visualiser les posts et co-hashtags dans Tumblr.
Site web : http://labs.polsys.net/tools/tumblr/
TXM
TXM est une plateforme et un logiciel de textométrie open source. Il permet l'analyse de texte, la fouille de texte. Il peut analyser des corpus de transcriptions d'enregistrements au format transcriber, des corpus parallèles au format TMX, des corpus en tableau au format Excel ou Ods et des corpus de textes écrits de niveau d'encodage variable au format TXT, XML ou TEI. Les mots de ces corpus peuvent être automatiquement lemmatisés et annotés grammaticalement à l'import par des outils externes comme TreeTagger. Les textes peuvent être structurés à n'importe quel niveau de profondeur. Les observables textuels utilisables dans les modèles statistiques (AFC...) ou les outils d'exploration (Concordances...) sont extractibles par des requêtes du moteur de recherche CQP équivalentes à des grammaires Unitex/Gramlab. Les modèles statistiques sont implémentés dans un R embarqué. TXM permet d'annoter les textes, notamment en embarquant le moteur du logiciel Analec.
Site web : http://textometrie.ens-lyon.fr/
UAM Corpus Tool
UAM Corpus Tool est un logiciel d’annotation de corpus textuels.
Site web : http://www.corpustool.com/index.html
UI Design
L’UI Design (User Interface Design) constitue l’environnement graphique dans lequel un utilisateur évolue sur un site web, un logiciel ou encore une application.
Il doit être agréable et faciliter l’utilisation du site, du logiciel ou de l’application. Il prend en compte des éléments tels que la typographie, les couleurs, les visuels, l’intuitivité, la charte éditoriale.
uMap
uMap est un outil en ligne qui permet de créer des cartes avec des calques OpenStreetMap et de les intégrer à un site web.
Il complète l’outil Khartis en permettant de projeter les données sur une carte interactive navigable (plutôt que sur une carte statique).
Site web : https://umap.openstreetmap.fr/en/
Unicode/UTF-8
L’Unicode est un standard informatique international qui permet de décrire toutes les lettres des différentes langues. Il vise au codage du texte écrit en donnant à tout caractère de n’importe quel système d’écriture un identifiant numérique, et ce de manière unifiée, quelle que soit la plateforme informatique ou le logiciel utilisé (à la différence d’ANSI).
Il est plus complet que le code ASCII qui ne possède pas de signe diacritique. Le code informatique d’Unicode est standardisé par l’UTF (Universal Character Set Transformation Format) ; nous sommes maintenant en UTF-8. Le fait que le caractère soit codé en UTF ne veut pas dire qu’il va s’afficher correctement : il faut ensuite disposer de la police de caractère adéquate mais le caractère sera bien interprété informatiquement.
Unitex/GramLab
Unitex/GramLab est une suite logicielle libre, multiplateforme, multilingue (22 langues) qui est fondée sur des grammaires et des dictionnaires et qui permet l’analyse de corpus textuels.
Site web : https://unitexgramlab.org/fr
Ural
Ural est une librairie python fournissant des fonctions utiles au traitement et à la manipulation des URLs.
Site web : https://github.com/medialab/ural
URI
URI (Uniform Resource Identifier – Identifiant Uniforme de Resource) : chaîne de caractères qui identifie de façon unique une ressource sur un réseau. L’adresse URI doit permettre d'identifier une ressource de manière permanente, même si la ressource est déplacée ou supprimée. Une norme gérée par le W3C gère la syntaxe des adresses URI.
L’URL (Uniform Resource Locators) qui permet d’identifier la localisation d’une ressource et l’URN (Uniform Resource Names) qui permet d’identifier une ressource, mais pas de la localiser, sont des spécialisations d’URI.
Voir Web sémantique.
URL
L’URL (Uniform Resource Locators) est une adresse qui précise la localisation d’une ressource Internet en indiquant le protocole à adopter, le nom de la machine, le chemin d’accès et le nom du fichier.
Par exemple, http://www.larousse.net
est une URL.
UX Design
L'UX Design (User eXperience Design) consiste à étudier et prendre en compte les attentes et les besoins des utilisateurs lors de la conception d’un site web.
Le but de l’UX Design est de rendre l’expérience de l’utilisateur sur le site plus instinctive, plus ergonomique afin qu’il se sente en confiance, qu’il trouve les informations dont il a besoin et qu’il ait envie d’interagir avec le site.
Valeur
La valeur est ce qui est donné dans un champ à un enregistrement (ex. « 1912 » est la valeur pour le champ Date pour tel document).
Vega
Vega est un langage informatique permettant de créer des visualisation de données.
Site web : https://vega.github.io
Veille informationnelle
La veille informationnelle désigne l’ensemble des stratégies qui permettent de rester informé grâce à l’utilisation d’outils de signalement automatisés tels que le flux RSS ou encore l’abonnement à des newsletters et des lettres de diffusion.
La veille permet de sélectionner les informations et d’optimiser le temps de recherche en faisant venir l’information plutôt qu’en allant la chercher.
VIAF
VIAF (Fichier d’Autorité International Virtuel), est un fichier d’autorité international de référence (noms de personne, collectivités, noms géographiques, œuvres et expressions).
Voir Référentiel.
Site web : http://viaf.org
Visualisation de données
La visualisation de données désigne la représentation graphique d'informations et de données. À l'aide d'éléments visuels comme les graphiques et les cartes, une visualisation de données permet de voir et de comprendre des tendances ou des valeurs inhabituelles dans les données, de manière très accessible.
Dans le monde du Big Data, les outils et technologies de visualisation de données sont indispensables pour analyser d'énormes volumes d'informations et prendre des décisions en s'appuyant sur les données.
Ressource web : https://www.tableau.com/fr-fr/learn/articles/data-visualization
Visualisation par graphe
Un graphe est une représentation graphique avec un ensemble de points, dont certaines paires sont directement reliées par un ou plusieurs liens.
Cette technique permet de visualiser de façon différente et précise à la fois les « processus » ou les relations établies entre des données : elle permet de créer un dispositif de représentation de celles-ci dans un ensemble beaucoup plus fin et visuel qu’une simple liste à puces. Mais ce type de visualisation est basé sur des relations ou des rapports entre les données.
Ressource web : http://innovatives.cnrs.fr/IMG/pdf/s6-auber.pdf
Voie classique
Le scientifique publie dans une revue, dont le contenu est accessible via un abonnement. L’accès au texte intégral est donc limité aux institutions qui ont souscrit l’abonnement.
L’article ne peut être déposé en diffusion publique dans une archive ouverte. Ainsi la voie classique se distingue et s’oppose au mouvement de la science ouverte (ou Open Access) qui promeut la publication scientifique en libre accès par le biais de la voie dorée et de la voie verte.
Voie dorée
La voie dorée ou gold open access concerne des revues ou ouvrages nativement en Open Access, dès leur publication.
En savoir plus : https://openaccess.couperin.org/la-voie-doree-2/
Voie verte
La voie verte ou green open access est la voie de l’auto-archivage ou dépôt par l’auteur dans une archive ouverte.
En savoir plus : https://openaccess.couperin.org/la-voie-verte-2/
Voyager 2
Voyager 2 est un outil d’analyse visuelle qui mêle des méthodes automatiques et manuelles de spécification de graphiques.
Sites web : https://vega.github.io/voyager2/ - https://medialab.sciencespo.fr/outils/voyager-2/
Voyant Tools
Voyant Tools est un environnement en ligne de lecture et d’analyse de textes numériques.
Il s’agit d’un projet canadien développé en open source qui fournit un ensemble d’outils d’analyse de texte et de visualisation des données textuelles.
Voir Text and Data Mining, Fouille de texte
Sites web : http://voyant.tools.huma-num.fr/docs/#!/guide/start - https://voyant-tools.org
W3C
Le W3C ou World Wide Web Consortium est une communauté internationale d’acteurs qui travaille au développement des standards du Web. Il est dirigé par l’inventeur du Web Tim Berners-Lee et par Jeffrey Jaffe.
Voir : Référentiel
Site web : https://www.w3.org/
WaveSurfer
WaveSurfer est un logiciel multiplateforme d’analyse et d’annotation de données audios.
Site web : https://www.speech.kth.se/wavesurfer/
Wayback Machine
Wayback Machine est un outil en ligne qui permet la consultation des versions archivées d’un site web.
Site web : http://web.archive.org
Web 2.0
Le web 2.0 ou « web participatif » désigne les évolutions techniques et les nouveaux usages du web qui permettent aux utilisateurs d’interagir entre eux mais également participer à la création ou à la modification du contenu des sites web.
Les wikis, les blogs, les flux RSS, les réseaux sociaux sont des outils du Web 2.0.
Voir Crowdsourcing, folksonomie
Web scraping
Le web scraping est une technique d’extraction de contenu de site web. Il repose sur la technique du crawler qui parcourt les sites web et du scraper qui extrait des informations depuis la structure HTML grâce à des sélecteurs (tels que X-path, CSS ou RegEx). Il existe des logiciels spécifiquement conçus pour extraire des données : Octoparse, Google Play Store Scraper, Image scraper, News Agencies Scraper, Search Engine Scraper, iTunes App Store Scraper, … De plus des bibliothèques de programmation ont aussi été créées pour aider les utilisateurs à développer leur propre programme de web scraping (par exemple Artoos.js ou Sandcrawler en Java).
Web sémantique
Le Web sémantique, appelé aussi Web de données, est le Web permettant d’échanger et d’utiliser des données, de publier et de lier des bases de données sur le Web.
Succédant au Web documentaire, il s’appuie sur un standard du Web, l’URI (Uniform Resource Identifier), qui identifie une ressource. Le modèle de données RDF, également standard du Web sémantique, permet quant à lui de décrire, représenter et relier des données.
Voir DBpedia.
Cours en ligne sur Fun MOOC : https://www.fun-mooc.fr/courses/inria/41002S02/session02/about
WebAnno
WebAnno est un logiciel d’annotations manuelles et de gestion d’annotations de données textuelles.
Site web : https://webanno.github.io/webanno/
WebMAUS
WebMAUS est un outil en ligne d’alignement automatique d’un fichier son et de sa transcription textuelle.
Il existe deux versions de cet outil, le WebMAUS Basic et le WebMAUS General.
Sites web :
WFS
WFS (Web Feature Service) : protocole défini par l'Open Geospatial Consortium qui permet d'interroger des objets géographiques vectoriels hébergés sur un serveur au moyen d'une URL formatée.
Wikipedia (outils)
-
Wikipedia Categories Scraper. A partir de l’URL d’un article wikipédia, cet outil récupère les catégories d’articles et les catégories des articles liés dans toutes les langues.
-
Wikipedia Cross-Lingual Image Analysis. Cet outil permet de récupérer et de comparer toutes les images des différentes versions linguistiques d’un article Wikipédia.
-
Wikipedia Edits Scraper and IP Localizer. Cet outil récupère et analyse tout l’historique d’une page Wikipédia et quand il trouve une adresse IP au lieu d’un nom d’utilisateur (dans l’historique des modifications), il la géolocalise.
-
Wikipedia Entry Check. Cet outil permet de vérifier si des termes existent sous la forme d’articles Wikipédia.
-
Wikipedia History Flow Companion. Cet outil permet de spécifier un intervalle de révisions wikipédia et est à utiliser avec l’outil de visualisation History Flow.
-
Wikipedia TOC Scraper. Cet outil permet de récupérer les révisions d’une page wikipédia à travers la récupération des sommaires.
WinPitch
WinPitch est un logiciel développé pour la recherche prosodique qui permet notamment la visualisation en temps-réel, l’analyse de la courbe mélodique, l’alignement de texte assisté, la segmentation automatique ou encore la création de lexique.
Site web : http://www.winpitch.com
Wordle
Wordle est un outil qui permet de générer des nuages de mots-clés (tags) à partir de textes ou de liens. Wordle offre également des fonctionnalités de design personnalisable.
Site web : http://ww7.wordle.com
Wysiwyg
Wysiwyg est un acronyme anglais qui signifie « what you see is what you get » : « ce que vous voyez est ce que vous obtenez ». Cela désigne une interface graphique (le plus souvent par formulaire ou bouton) qui permet de composer visuellement le résultat attendu sans passer par l’écriture et donc l’apprentissage de codes informatiques.
L’exemple classique est Word, logiciel de traitement de texte qui permet d’éditer un texte sans passer par XML.
WYSIWYM
WYSIWYM est un acronyme anglais qui signifie « what you see is what you mean » : « ce que vous voyez est ce que vous voulez dire ». Cela désigne une interface d’édition de texte qui se concentre sur le contenu par rapport à la forme. Dans les logiciels ayant une interface Wysiwym, l’écriture du contenu se fait en ligne de code, et spécifie la valeur des éléments (tels mots sont un titre, tels autres sont un paragraphe, tels autres sont une citation, …). L’interface WYSIWYM est donc différente de l’interface WYSIWYG.
X-Path
X-Path est un langage de requête pour les données structurées en XML, développé par le W3C. Il permet d’adresser des éléments d’un document XML de façon ciblée. Il est utilisé conjointement avec le langage X-Query afin que ce dernier interroge les données dans les champs désigné par X-Path.
X-Query
X-Query est un langage de requête pour les données codées en XML. Il a été développé par le W3C. Il sert à la fois à récupérer des données mais aussi à les modifier. Dans le cadre des bases de données en XML, il a le même rôle que le langage de requête SQL.
Voir aussi : SQL
Site web : https://www.w3.org/TR/xquery-31/
XMind
XMind est un logiciel open source de création de "concept map", d'organigrammes, cartes, plans et autres schémas. Très simple d'utilisation, l'application vous permet d'éditer toutes les parties de votre organigramme (liaison, encarts principaux et secondaires, etc.), d'ajouter des images et des liens, d'insérer du texte, d'intégrer des marqueurs (ressemblant à des emoticons) pour indiquer la priorité par exemple, d'annoter votre case, etc. Vous pourrez également attacher un document externe, imprimer, et exporter votre projet aux formats HTML, image, texte, etc.
Site web : https://www.xmind.net/desktop/
XML
Pour pouvoir être lue et archivée, une ressource numérique demande un encodage qui respecte les exigences de son auteur mais qui soit aussi compréhensible par d’autres. De nombreux standards d’encodage existent. Mais pour la représentation et l’échange des informations contenues dans la ressource, le XML (eXtensible Markup Language, « langage de balisage extensible ») est devenu le langage de référence.
Il est utilisé dans de nombreuses situations et a développé des initiatives dérivées qui permettent de répondre à de nombreux besoins (dont XML-TEI). Le HTML est un langage avec une liste fermée de balises qui ne s’occupent que de la mise en forme. Le XML propose une couche supplémentaire avec une liste non limitée de balises qui permettent de structurer son propre langage : elles concernent généralement la structure ou l’interprétation du contenu. Le XML a donc une structure ouverte, les balises ne sont pas limitées mais il y a des règles d’utilisation à respecter. En tête d’un document XML, il y a généralement les métadonnées Dublin Core.
XML-MEI
XML-MEI (XML music encoding initiative) désigne à la fois un ensemble de règles pour les documents de notation musical et la communauté les définissant.
Site web : https://music-encoding.org/
Voir aussi : TEI
XSD
Le schéma de définition XML (XSD pour XML Schema Definition), est un langage de description de la structure d’un document en XML. Il permet de définir chaque éléments (nom et type), leurs attributs et leurs restrictions.
Pour en savoir plus : https://florian-lepretre.herokuapp.com/teaching/webservices/xsd
XSL
XSL (eXtensible Stylesheet Language) est le langage de description de feuilles de style associé à XML.
Ainsi, une feuille de style écrite en XSL constitue un fichier permettant la mise en forme mais aussi la transformation d’un document XML en un autre document XML.
Plus précisément, XSL forme en réalité une famille de langages à trois composantes : XSLT ou le langage de transformation d’un document XML, XPath ou le langage de navigation au sein d’un document XML, XSL-FO ou le langage de mise en forme d’un document XML.
Youtube Data Tools
Il s’agit d’une collection d’outils variés permettant l’extraction de données de la plateforme Youtube.
Site web : https://tools.digitalmethods.net/netvizz/youtube/
Zenodo
Zenodo est un répertoire créé dans le cadre du projet européen OpenAIRE par le CERN (Conseil Européen pour la Recherche Nucléaire).
Il s’agit d’un entrepôt où les chercheurs, de toutes les disciplines et de tous pays, peuvent déposer leurs données ou d’autres types de document.
Zenodo fournit un DOI aux ressources qui en sont dépourvues. Les archives peuvent être déposées en accès ouvert, restreint ou fermé. En revanche leurs métadonnées sont sous licence CC0 et peuvent être moissonnées selon le protocole OAI-PMH.
Site web : https://zenodo.org
Zotero
C’est un logiciel de gestion de références bibliographiques gratuit et open source. Il permet de gérer des données bibliographiques et des documents de recherche (fichiers PDF, images, etc.). Il s’intègre au navigateur web et permet de synchroniser des données depuis plusieurs ordinateurs, ainsi que de faire de la génération de citations (notes et bibliographies).
Le développement du logiciel est à l'initiative du Roy Rosenzweig Center for History and New Media (CHNM) de l'université George Mason, le même centre qui développe Omeka.
Site web : https://www.zotero.org
Aide
Cliquez ici pour accéder à la documentation de Cosma
Raccourcis
Espace | Réactiver l'algorithme de dessin du graphe |
S | Déplacer le curseur dans le champ Recherche |
Alt + clic | (sur un type de fiche) Désélectionner les autres types |
R | Réinitialiser le zoom |
Alt + R | Réinitialiser l'affichage |
C | Zoomer et centrer sur le nœud sélectionné |
F | Passer en mode Focus |
Echap | Fermer la fiche sélectionnée |
Glossaire humanités numériques
Version 2.4.0 • Licence GPL-3.0-or-later
- Arthur Perret
- Guillaume Brioudes
- Clément Borel
- Olivier Le Deuff
- Programme ANR HyperOtlet
- D3 v4.13.0
- Mike Bostock (BSD 3-Clause)
- Nunjucks v3.2.3
- James Long (BSD 2-Clause)
- Js-yaml v4.1.0
- Vitaly Puzrin (MIT License)
- Markdown-it v12.3.0
- Vitaly Puzrin, Alex Kocharin (MIT License)
- Citeproc v2.4.62
- Frank Bennett (CPAL, AGPL)
- Fuse-js v6.4.6
- Kiro Risk (Apache License 2.0)