Cliquez sur un nœud du graphe ou dans un élément de l'index pour ouvrir une fiche.

4CAT - Capture and Analysis Toolkit

id : 4cat - capture and analysis toolkit
types : Outils logiciels
mots-clés :
filename : 4cat

4CAT est un outil permettant de créer et d’analyser des fichiers de données à partir d’une variété de forums et de plateformes web.

Site web (connexion nécessaire) : https://4cat.oilab.nl/login/?next=%2F

Présentation de l'outil : https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3914892

ABES

id : abes
types : Groupements institutionnels, Ressources
mots-clés :
filename : abes

L’ABES, Agence Bibliographique de l’Enseignement Supérieur, est un établissement public à caractère administratif créé en 1994 et sous tutelle du Ministère de l’Enseignement supérieur et de la Recherche pour la mise en œuvre du SUDOC (Système Universitaire de Documentation).

Depuis, ses missions se sont développées. Elle fournit ainsi un ensemble d’outils de signalement et d’administration de leurs ressources documentaires aux établissements de l’enseignement supérieur et de la recherche. On compte ainsi le moteur de recherche thèses.fr, le catalogue Calames, le référentiel IdRef, la gestion de l’attribution des numéros ISIL pour les bibliothèques.

Site web : https://abes.fr/

Accessibilité des données

id : accessibilité des données
types : Pratiques et méthodes
mots-clés :
filename : accessibilite_des_donnees

Il s’agit de garantir l’accès et la pérennité des données. Cette accessibilité est généralement assurée par des développements informatiques réalisés à partir de logiciels open source, et à partir de librairies sans dépendances, ou que l’on peut facilement remplacer. Elle est aussi assurée par un choix de format d’encodage des données, format qui doit être ouvert, documenté et utilisé par une communauté.

ADT

id : adt
types : Pratiques et méthodes
mots-clés :
filename : adt

L'Analyse de Données Textuelles (ADT) est l'exploration d'un ensemble de textes établi comme données organisées, structurées. L'ADT est une appproche utilisée en SHS. Ses méthodes sont diverses et variées : statistique exploratoire, visualisations, approches quantitatives ou qualitatives.

Agora Project

id : agora project
types : Outils logiciels
mots-clés :
filename : agora_project

Outil de travail collaboratif permettant de créer un espace en ligne pour une équipe et partager des fichiers, un fil d’actualité, un agenda, des notes, etc., pour communiquer facilement autour d’un projet commun.

Site web : https://www.agora-project.net.

Alignement

id : alignement
types : Pratiques et méthodes
mots-clés :
filename : alignement

Fait de positionner un élément d’une certaine façon par rapport aux autres.

En linguistique, on parle d’aligner des éléments textuels de versions ou de langues différentes, pour repérer automatiquement les transformations. Par extension, on parle d’alignement pour la correspondance entre du texte dans une image et sa version textuelle transcrite. En informatique, l’alignement désigne la mise en correspondance et le lissage par rapport à un standard et en bibliothèque l’alignement peut aussi désigner le fait de faire correspondre les entrées de deux référentiels ou thésaurus.

Altmetrics

id : altmetrics
types : Pratiques et méthodes
mots-clés :
filename : altmetrics

Les altmetrics sont des mesures alternatives quantitatives d’impact de la production scientifique sur Internet qui complètent les mesures bibliométriques traditionnelles telles que le facteur d’impact.

Elles s’appuient sur les médias et les plateformes sociales comme Twitter, Facebook, Research Gate, HAL pour calculer le nombre de partage d’une publication scientifique dans les réseaux sociaux, le nombre de téléchargement ou de vues, le nombre de sauvegardes ou encore le nombre de conversations mentionnant un article ou un auteur.

ALTO

id : alto
types : Pratiques et méthodes
mots-clés :
filename : alto

Standard XML documentaire permettant de décrire la mise en page physique et la structure logique d'une page de document analysée par reconnaissance optique de caractères (OCR).

Analec

id : analec
types : Outils logiciels
mots-clés :
filename : analec

Analec est un logiciel d’annotation et d’analyse de corpus écrits.

Site web : https://www.lattice.cnrs.fr/ressources/logiciels/analec/

AnaText

id : anatext
types : Outils logiciels
mots-clés :
filename : anatext

AnaText est un outil en ligne permettant d’analyser des textes par simple copier-coller. Il est notamment utilisé pour l’initiation à l’exploration de corpus. Il peut traiter des textes de langues variées (une dizaine) et contrairement à AntConc, il affiche la catégorie et le lemme du mot analysé.

Site web : http://phraseotext.univ-grenoble-alpes.fr/anaText/

Ancre

id : ancre
types : Pratiques et méthodes
mots-clés :
filename : ancre

Une ancre est l’endroit de destination d’un lien au sein d’une page web ; cela permet de se rendre directement à un emplacement précis de la page.

ANNIS

id : annis
types : Outils logiciels
mots-clés :
filename : annis

ANNIS est un outil de recherche et de visualisation destiné aux corpus complexes caractérisés par plusieurs niveaux linguistiques. Il permet également d’annoter les données.

Site web : https://corpus-tools.org/annis/

Annotation

id : annotation
types : Pratiques et méthodes
mots-clés :
filename : annotation

L’annotation est ce qui se rajoute au texte. Cet ajout est localisé, à savoir qu’il s’agit de l’adjonction in situ, sur une représentation particulière du texte.

L'annotation peut être de nature explicative ou critique. Elle commente et ne décrit pas. L’annotation est dans l’encodage une strate supplémentaire à la documentation.

ANTA

id : anta
types : Outils logiciels
mots-clés :
filename : anta

ANTA (Actor Network Text Analyzer) est un logiciel d’analyse de corpus textuel de taille moyenne. Il permet d’extraire les occurrences d’expressions dans les textes d’un corpus et de créer des réseaux de cooccurrences de textes et d’expressions.

Site web : https://medialab.sciencespo.fr/outils/anta-actor-network-text-analyzer/

AntConc

id : antconc
types : Outils logiciels
mots-clés :
filename : antconc

AntConc est un logiciel d’analyse textuelle spécialisé dans les concordances.

Voir aussi : AnaText

Site web : http://www.laurenceanthony.net/software/antconc/

Anvil

id : anvil
types : Outils logiciels
mots-clés :
filename : anvil

Anvil est un outil d’annotations à plusieurs niveaux de vidéos. Il peut être utilisé dans plusieurs disciplines comme la linguistique, l’anthropologie ou encore la psychothérapie.

Site web : http://www.anvil-software.org

Anystyle.io

id : anystyle.io
types : Outils logiciels
mots-clés :
filename : anystyle.io

AnyStyle permet de séquencer semi-automatiquement une bibliographie rédigée au format électronique et la verser dans les champs structurés de Zotero ou de Endnote.

Site web : https://anystyle.io/

Tutoriel : https://youtu.be/Jqhtsib5yGY

API

id : api
types : Technologies et familles d’outils
mots-clés :
filename : api

Le rôle d’une API (Application Programming Interface) ou interface de programmation est de fournir une bibliothèque d’outils (fonctions, objets, programmes) permettant l’interaction entre d’autres entités informatiques (serveurs, programmes, services).

App Tracker Explorer

id : app tracker explorer
types : Outils logiciels
mots-clés :
filename : app_tracker_explorer

Il s’agit d’un outil permettant de détecter les empreintes de technologies de traçages ou d’autres bibliothèques de code au sein de fichiers APK (Android Package Kit ou format de fichier conçu pour le système d’exploitation android).

Voir aussi : Tracker tracker

Site web : https://tools.digitalmethods.net/beta/appTrackers/

Application

id : application
types : Technologies et familles d’outils
mots-clés :
filename : application

En informatique, une application est un programme utilisé pour réaliser une tâche ou un ensemble de tâches. Le terme est synonyme de logiciel. Un éditeur de texte, un jeu vidéo, un navigateur web sont des applications ; elles ont besoin des services d’un système d’exploitation pour fonctionner.

Arbil

id : arbil
types : Outils logiciels
mots-clés :
filename : arbil

Arbil est un outil permettant d’organiser et d’éditer les données de la recherche ainsi que leurs métadonnées dans un format approprié pour l’archivage. Il peut être utilisé à distance et hors ligne et les données peuvent être entrées à n’importe quel moment, en partie ou en bloc.

Site web : https://archive.mpi.nl/forums/t/arbil-information-manuals-download/1045

ArcGIS

id : arcgis
types : Outils logiciels
mots-clés :
filename : arcgis

Logiciel de Système d'Information Géographique bureautique lancé en 1999 par ESRI, ArcGIS est la solution commerciale leader sur le marché (pour OS Windows). Il propose une solution complète pour collecter, organiser, gérer, analyser, communiquer et diffuser des informations géographiques. De plus, il offre de nombreuses extensions, ainsi que la possibilité d'écrire des scripts en langage Python. ArcGIS Pro en est le dernier développement, conçu pour remplacer progressivement les versions précédentes.

Site web : https://www.esrifrance.fr/about-arcgis.aspx

Archivage

id : archivage
types : Pratiques et méthodes
mots-clés :
filename : archivage

L'archivage est la gestion, le classement et la conservation d'objets, par exemple les corpus.

Archivage numérique

id : archivage numérique
types : Pratiques et méthodes
mots-clés :
filename : archivage_numerique

L’archivage de contenus électroniques est l’ensemble des actions, outils et méthodes mis en œuvre pour réunir, identifier, sélectionner, classer, détruire et conserver des contenus électroniques, sur un support sécurisé, dans le but de les exploiter et de les rendre accessibles dans le temps, que ce soit à titre de preuve (en cas d’obligations légales notamment ou de litiges) ou à titre informatif.

Le contenu archivé est considéré comme figé et ne peut donc être modifié. Ceci est notamment possible en garantissant l'authenticité via l’empreinte électronique, la signature électronique, la traçabilité des accès et bien d'autres moyens. La durée de l’archivage est fonction de la valeur du contenu et porte le plus souvent sur du moyen ou long terme.

Voir aussi : Archivage, Archivage pérenne

Archivage pérenne

id : archivage pérenne
types : Pratiques et méthodes
mots-clés :
filename : archivage_perenne

L’archivage pérenne a pour but de conserver le document, de le rendre accessible et d’en préserver l’intelligibilité. Ce type d’archivage fait face à quatre risques principaux : l’obsolescence du matériel, celle des logiciels, celle du format de fichier ainsi que la perte de la signification du contenu.

Voir aussi : Archivage, Archivage numérique

Site web du CINES, proposant des solutions d'archivage pérenne de données électroniques : https://www.cines.fr

Archive ouverte

id : archive ouverte
types : Technologies et familles d’outils
mots-clés :
filename : archive_ouverte

Une archive ouverte est un réservoir web où sont déposées des publications issues de la recherche scientifique et de l’enseignement dont l’accès est libre et gratuit.

Elle peut être institutionnelle (ex. OATAO de l’ Université de Toulouse), régionale (ex. OpenAIRE pour l’Europe), nationale (HAL pour la France) ou disciplinaire (ex. arXiv en Physique, RePEC en Economie).

Voir OpenAIRE, HAL, Science ouverte

Argos

id : argos
types : Outils logiciels
mots-clés :
filename : argos

Argos est un outil en ligne développé par OpenAIRE qui permet de créer et de publier des plans de gestion des données (ou PGD).

Site web : https://argos.openaire.eu/splash/

ARIES

id : aries
types : Outils logiciels
mots-clés :
filename : aries

ARIES (Art and images exploration space) est une plateforme web d’exploration et d’organisation d’images pour les chercheurs en histoire de l’art. Il permet de créer un projet où regrouper des images afin de les comparer. Ces comparaisons peuvent se faire sur l’iconographie en superposant les images grâce à un système de transparence, sur les dimensions des tableaux en mettant à l’échelle les représentations les unes par rapport aux autres d’après les métadonnées, ou encore sur l’évolution d’une représentation en créant des frises chronologiques également depuis les métadonnées.

Site web : https://artimageexplorationspace.com/

ARK

id : ark
types : Pratiques et méthodes
mots-clés :
filename : ark

ARK (Archival Resource Key) est un système d’identifiants pérennes créé par la California Digital Library. Il permet d’identifier des objets de tous types : physiques (livres, tables), numériques (livres numériques) ou immatériels (concepts).

Voir DOI

Artoos.js

id : artoos.js
types : Outils logiciels
mots-clés :
filename : artoos.js

Artoos.js est un bookmarklet (programme en javascript qui s'exécute dans un navigateur) qui injecte dans n’importe quelle page de navigateur des utilitaires JavaScript aidant à scraper (= extraire du contenu de sites web de manière automatique).

Voir aussi : Web scraping

Site web : https://medialab.github.io/artoo/

ASCII American Standard Code for Information Interchange

id : ascii american standard code for information interchange
types : Pratiques et méthodes, Technologies et familles d’outils
mots-clés :
filename : ascii

L'American Standard Code for Information Interchange (ASCII) est un système d'encodage des caractères reposant sur un code de 7 bits et définissant 128 caractères. L’encodage se compose de 33 caractères non imprimables et 95 caractères imprimables et comprend des lettres, des signes de ponctuation, des chiffres ainsi que des caractères de contrôle Unicode.

Il est utilisé pour les mails ou les noms de domaines informatiques, mais il a également servi à créer des images à partir de ces caractères dans le cadre de l'ASCII art.

Site web : https://www.ionos.fr/digitalguide/serveur/know-how/ascii-american-standard-code-for-information-interchange/

Ayant droit

id : ayant droit
types : Pratiques et méthodes
mots-clés :
filename : ayant_droit

L'ayant droit est une personne bénéficiant d'un droit sur un document en raison de sa situation juridique, fiscale, financière, ou d'un lien familial avec le bénéficiaire direct de ce droit.

Ainsi un fonds peut être la propriété matérielle d’une bibliothèque (ex. le fonds Foucault conservé au département des Manuscrits de la BnF) mais la propriété intellectuelle reste aux ayants droit d’un auteur. Dans le cadre de projets d’édition numérique, il faut donc demander l’autorisation de diffuser le fonds sous forme de reproduction numérique aux ayants droits et au lieu de conservation.

Voir Droit d’auteur.

Bacon

id : bacon
types : Ressources
mots-clés :
filename : bacon

Base de connaissances nationale, BACON constitue un entrepôt de métadonnées de référence sous licence CC0. Elle collecte, corrige, enrichit et diffuse les métadonnées des ressources électroniques disponibles.

Son but est ainsi d’optimiser le signalement des ressources électroniques pour en faciliter l’accès et de favoriser le partage des métadonnées entre les acteurs de la communication scientifique tels que les éditeurs et les bibliothèques.

Site web : https://bacon.abes.fr/index.html

Balise

id : balise
types : Pratiques et méthodes
mots-clés :
filename : balise

La balise est une marque que l’on utilise dans les langages informatiques afin de signaler une spécificité descriptive (exemple : italique, gras…) ou pour commander une action à un logiciel. Le langage HTML utilise des balises pour mettre en forme le texte, le XML fait de même mais avec une couche interprétative de ce contenu.

La balise se matérialise par des chevrons ouvrants et fermants, elle est souvent double avec une balise ouvrante et une balise fermante (exemple : <p>texte</p>) ou se compose d’une balise unique qui souvent se termine par un / (exemple : <br/> pour le retour à la ligne qui est par définition unique). Les balises ne sont pas visibles à l’écran mais elles sont consultables en demandant au navigateur l’affichage du code source de la page.

BaObab

id : baobab
types : Ressources
mots-clés :
filename : baobab

BaObab constitue la boîte à outils de Biblissima. Il s’agit d’un répertoire de ressources, d’outils, de tutoriels et de manuels qui fournissent un appui à la collecte et à la production de données dans les domaines couverts par Biblissima (circulation des textes, transmission des savoirs en Europe du VIIIè au XVIIIè siècle, l’environnement et l’avenir des bibliothèques).

Site web : https://baobab.biblissima.fr

BAP D

id : bap d
types : Groupements institutionnels
mots-clés :
filename : bap_d

Les métiers des ingénieurs et personnels techniques de recherche et de formation (ITRF) et des ingénieurs et personnels techniques de la recherche (ITA) sont décrits dans le répertoire des branches d’activités professionnelles (BAP) et des emplois-types, dénommé RéFérens (REFérentiel des Emplois-types de la recherche et de l’Enseignement Supérieur). La BAP D Sciences humaines et sociales comprend quatre familles d'activités professionnelles : production, traitement et analyse de données ; sciences de l'information géographique ; analyse des sources historiques et culturelles ; recueil et analyse des sources archéologiques. Ces familles d'activités sont découpées en emplois-types suivant quatre grades : ingénieur de recherche, ingénieur d'étude, assistant ingénieur et technicien. À chacun de ces grades correspondent des possibilités d'accompagnement des équipes de recherche en SHS.

Source : https://data.enseignementsup-recherche.gouv.fr/pages/la_bap/?refine.referens_bap_id=D

La liste nationale officielle des experts ITRF de la BAP D est disponible ici : https://www.enseignementsup-recherche.gouv.fr/fr/recrutements/itrf/experts.

BASE

id : base
types : Ressources
mots-clés :
filename : base

BASE (Bielefeld Academic Search Engine) est un moteur de recherche scientifique, spécialisé dans le moissonnage des bases de données académiques en libre accès. Il est géré par la bibliothèque de l’Université de Bielefeld en Allemagne. Il collecte, met aux normes et indexe les données respectant le protocole OAI-PMH.

Les sources académiques moissonnées ne sont pas choisies par un algorithme mais sélectionnées par des professionnels.

Site web : https://www.base-search.net

Base de données

id : base de données
types : Technologies et familles d’outils
mots-clés :
filename : base_de_donnees

Une base de données est une collection d'informations destinée à stocker des données de façon structurée. Le logiciel de gestion de bases de données (ou SGBD) permet de gérer les données qu'elle contient (insertion, suppression, modification, interrogation ou extraction).

L'architecture traditionnelle qui s'est imposée dans les années 1970 est celle des bases de données relationnelles : les données y sont organisées en tableaux interreliés (correspondant à des entités distinctes), avec les colonnes représentant des types de données (champs) et les lignes des ensembles cohérents de données (enregistrements). Ce modèle reste encore aujourd'hui dominant, même si d'autres approches, plus souples et plus modulaires, émergent depuis 2010 (NoSQL notamment).

Voir aussi l'outil Heurist.

BaseX

id : basex
types : Ressources
mots-clés :
filename : basex

BaseX est un logiciel open source de gestion de base de données XML. Il utilise le langage de requête X-Query. BaseX contient une interface utilisateur graphique (GUI – graphical user interface), permettant de réaliser des visualisations de données. Son code source est hébergé sur GitHub.

Site web : https://basex.org/

Voir aussi : eXist

Bibliothèque numérique

id : bibliothèque numérique
types : Technologies et familles d’outils
mots-clés :
filename : bibliotheque_numerique

Une bibliothèque numérique (virtuelle ou en ligne ou électronique) est une collection de ressources (textes, images, sons) numériques (c'est-à-dire numérisées ou nées numériques) accessibles à distance (en particulier via Internet), proposant différentes modalités d'accès et de consultation à l'information à des publics différents. La bibliothèque virtuelle regroupe donc un ensemble de ressources et de services dématérialisés.

Parmi les bibliothèques numériques, voir OMEKA.

Biblissima

id : biblissima
types : Groupements institutionnels
mots-clés :
filename : biblissima

Équipement d’excellence, Biblissima fédère et structure un ensemble de corpus numériques de données scientifiques sur l’histoire de la circulation des textes en Occident du Moyen Âge à la fin de l’Ancien Régime. Il propose des outils (portail, bibliothèque numérique, etc.) et des contenus.

Site web : https://projet.biblissima.fr

BMP

id : bmp
types : Pratiques et méthodes
mots-clés :
filename : bmp_ou_bitmap

Le BMP ou bitmap est un format d’image matricielle, simple à utiliser et à développer et lisible par presque tous les éditeurs d’images et les visualiseurs. Un fichier bitmap (nom.bmp) est un fichier d’image graphique qui stocke les pixels sous la forme d’un tableau de points et qui gère les couleurs. Ce fichier bitmap se compose de l’en-tête du fichier, de la palette de couleurs et des données relatives à l’image.

Le format BMP ne dégrade pas l’image et s’avère par conséquent très lourd. Il est peu compressé même si cela est possible grâce au système de compression RLE.

BnF pour les professionnels

id : bnf pour les professionnels
types : Ressources
mots-clés :
filename : bnf_pour_les_professionnels

La bibliothèque nationale de France met à disposition des professionnels de la documentation (normes, formats, données d’autorité, guides de bonnes pratiques, etc.).

Sites web : https://www.bnf.fr/fr/Signaler - https://www.bnf.fr/fr/outils-de-la-numerisation

BrightBeam

id : brightbeam
types : Outils logiciels
mots-clés :
filename : brightbeam

Outil numérique permettant la capture et l’inspection interactive les trackers “third-party” rencontrés pendant la navigation.

Site web : https://github.com/digitalmethodsinitiative/brightbeam

Bubble Lines

id : bubble lines
types : Outils logiciels
mots-clés :
filename : bubble_lines

Bubbles Lines est un outil permettant d’entrer des tags et des valeurs pour produire des bulles proportionnées en fonction des données, sous la forme d’un fichier SVG.

Voir aussi : Visualisation de données

Site web : https://tools.digitalmethods.net/beta/bubbleline/

BVH

id : bvh
types : Ressources
mots-clés :
filename : bvh

Le programme « Bibliothèques Virtuelles Humanistes », porté par l’université de Tours, diffuse des documents patrimoniaux (bibliothèque numérique) et poursuit des recherches associant des compétences en sciences humaines et en informatique.

Site web : <http://www.bvh.univ-tours.fr >

Calames

id : calames
types : Ressources
mots-clés :
filename : calames

Géré par l’ABES, Calames (Catalogue en ligne des archives et des manuscrits de l’enseignement supérieur) est le catalogue des archives et des manuscrits présents dans les bibliothèques universitaires, de grands établissements nationaux comme l’Institut de France et des établissements de recherche.

Site web : http://www.calames.abes.fr/pub/

Calenda

id : calenda
types : Ressources
mots-clés :
filename : calenda

plateforme communautaire académique en ligne dédiée à l’actualité de la recherche en lettres et sciences humaines et sociales. Elle publie des annonces de colloques, les programmes de séminaires, les cycles de conférences, les propositions d’emploi et les appels à contribution.

Site web : https://calenda.org

Canvas

id : canvas
types : Outils logiciels
mots-clés :
filename : canvas

Canvas est une plateforme en ligne qui permet aux utilisateurs de concevoir des flyers, des vidéos, des documents, des présentations ou des sites web.

Le site propose des modèles à utiliser et il permet à des personnes n'étant pas "designer" de concevoir des présentations dynamiques et personnalisées.

Site web : https://www.canva.com/

Tutoriel : https://www.youtube.com/watch?v=_XOWhA1dK7Y

CAQDAS

id : caqdas
types : Technologies et familles d’outils
mots-clés :
filename : caqdas

Un CAQDAS (Computer Aided Qualitative Data Analysis Systems) est un outil permettant l'analyse de données qualitatives. Il existe toute une série de logiciels de ce type, payants (comme par exemple NVivo) ou gratuits (comme par exemple WeftQDA, TamsAnalyser).

En savoir plus : http://triangle.ens-lyon.fr/spip.php?article5120

Présentation des logiciels gratuits CAQDAS : https://guides.library.illinois.edu/c.php?g=348074&p=2346107

Carte

id : carte
types : Pratiques et méthodes
mots-clés :
filename : carte

« La carte est une représentation géométrique conventionnelle, généralement plane, en positions relatives, de phénomènes concrets ou abstraits, localisables dans l’espace ; c’est aussi un document portant cette représentation ou une partie de cette représentation sous forme d’une figure manuscrite, imprimée ou réalisée par tout autre moyen. »

Comité français de Cartographie (CFC), 1990.

Voir Cartographie.

Cartographie

id : cartographie
types : Pratiques et méthodes
mots-clés :
filename : cartographie

Ensemble des études et opérations scientifiques, artistiques et techniques, intervenant dans l’élaboration d’une carte, d’un plan ou autre mode d’expression, à partir des résultats d’observations directes ou de l’exploitation d’une documentation, ainsi que dans leur utilisation.

Voir Carte.

Cartomundi

id : cartomundi
types : Outils logiciels
mots-clés :
filename : cartomundi

Cartomundi est une cartothèque numérique proposant en ligne des numérisations de cartes historiques appartenant à différentes institutions européennes (France, Allemagne, Italie, Autriche, et République Tchèque).

Site web : http://www.cartomundi.fr/site/

Voir aussi : OldMapsOnline

Catwalk

id : catwalk
types : Outils logiciels
mots-clés :
filename : catwalk

Catwalk est un outil d’exploration et de sélection de tweets pour les SHS.

Site web : https://medialab.sciencespo.fr/outils/catwalk/

CCSD

id : ccsd
types : Groupements institutionnels
mots-clés :
filename : ccsd

Le CCSD (Centre pour la Communication Scientifique Directe) a été créé par le CNRS en 2000 pour mettre au point à destination de la communauté des chercheurs des outils pour l’archivage, la diffusion et la valorisation des publications et des données scientifiques. C’est lui qui a créé et qui développe et administre toujours l’archive ouverte HAL, la plateforme de gestion de colloques SciencesConf ainsi que la plateforme de gestion d’épi-revues Episciences.

Site web : https://www.ccsd.cnrs.fr

CD-ROM

id : cd-rom
types : Pratiques et méthodes
mots-clés :
filename : cd-rom

Un CD-ROM ou Cédérom (Compact Disk Read Only Memory) est un disque compact où sont stockées des données telles que des texte, des images et des sons et qui se lit au moyen d’un ordinateur.

Censorship Explorer

id : censorship explorer
types : Outils logiciels
mots-clés :
filename : censorship_explorer

Censorship Explorer est un outil qui permet de savoir si une URL est censurée dans un pays donné.

Site web : https://tools.digitalmethods.net/beta/proxies/

Champ

id : champ
types : Pratiques et méthodes
mots-clés :
filename : champ

Un champ est l’information élémentaire d’une base de données, il équivaut à la colonne d’un tableau. En programmation, on peut également le définir comme la propriété d’un objet.

Chronocarto

id : chronocarto
types : Outils logiciels, Ressources
mots-clés :
filename : chronocarto

Chronocarto est un web-SIG développé depuis 2006 par le laboratoire AOROC pour la représentation de données cartographiques en archéologie. Il a été conçu pour permettre un travail de réflexion en réseau entre chercheurs, non spécialistes de SIG, depuis la phase d’acquisition jusqu’à celle de l’enrichissement de documents existants en ligne.

Autour de l'outil de Web-SIG s'est constitué un portail dont le but est de favoriser le moissonnage des données par le développement d’une gestion multimédia, par des moteurs de recherche et par la cartographie spatiale de ces données. Il vise à rendre les données facilement interrogeables et à mettre au point une vision simple de toute la documentation quelle que soit sa localisation sur le net.

Site web : https://www.chronocarto.eu

Présentation détaillée : https://www.openscience.fr/Chronocarto-un-Web-SIG-libre-pour-les-archeologues-pas-seulement

CIDOC-CRM

id : cidoc-crm
types : Pratiques et méthodes, Ressources
mots-clés :
filename : cidoc-crm

Le Modèle Conceptuel de Référence du CIDOC (le Comité International pour la DOCumentation du conseil international des musées), est une ontologie informatique qui définit un modèle de structuration des données patrimoniales et leurs relations. Les institutions patrimoniales utilisant cette ontologie permettent ainsi à leurs systèmes d’être interopérables et de partager des données entre-elles. Le CIDOC-CMR est aujourd’hui une norme ISO 21127:2014.

Site web : https://www.cidoc-crm.org/

CINES

id : cines
types : Groupements institutionnels
mots-clés :
filename : cines

Le CINES (Centre Informatique National de l’Enseignement Supérieur) est un établissement public national à caractère administratif. Il est chargé d’assurer un service informatique à destination des établissements publics d’enseignement supérieur et des organismes de recherche.

Il intervient plus précisément dans trois domaines : le calcul numérique intensif, l’archivage pérenne de données électroniques et l’hébergement de matériels informatiques à vocation nationale comme les serveurs de l’ABES par exemple.

Site web : https://www.cines.fr

CIRIS

id : ciris
types : Ressources
mots-clés :
filename : ciris

CIRIS est une base de données bibliographiques collaborative qui recense et décrit les éditions anciennes et récentes des textes non documentaires de l’Antiquité gréco-latine.

Site web : https://ciris.huma-num.fr

CitEc

id : citec
types : Outils logiciels
mots-clés :
filename : citec

CitEc est un outil qui fournit une analyse des citations pour tout document diffusé sur la bibliothèque numérique RePec, spécialisée en économie. La liste des références présentes dans chaque document est automatiquement extraite ce qui permet de savoir quels documents ont été cités, combien de fois et par qui.

Site web :< http://citec.repec.org>

CLARIN

id : clarin
types : Groupements institutionnels, Ressources
mots-clés :
filename : clarin_eric

CLARIN (Common Language Resources and Technology Infrastructure) : infrastructure de recherche européenne pour les ressources linguistiques et la technologie, dont l’objectif est de fédérer les efforts européens faits autour des données de langage, pour toutes les langues, à destination de toutes les disciplines.

CLARIN met les ressources linguistiques numériques à la disposition des universitaires, des chercheurs, des étudiants et des citoyens-chercheurs de toutes les disciplines, en particulier dans les sciences humaines et sociales, grâce à un accès par connexion unique. CLARIN offre des solutions et des services technologiques à long terme pour le déploiement, la connexion, l'analyse et la maintenance des données et des outils linguistiques numériques.

CLARIN soutient les chercheurs qui veulent s'engager dans une recherche de pointe axée sur les données, contribuant ainsi à un véritable espace européen de la recherche multilingue.

Site web : https://www.clarin.eu/

Services proposés par CLARIN : https://www.clarin.eu/content/services

Classification

id : classification
types : Pratiques et méthodes
mots-clés :
filename : classification

Une classification est un système de répartition en classes, en catégories, d’êtres, d’objets, de notions ayant un ou plusieurs caractères communs dans le but, notamment, d’en faciliter l’étude.

Dans le domaine des bibliothèques, une classification est un système de répartition des connaissances selon un ordre déterminé. Il existe plusieurs classifications (Dewey, CDU, etc.) ; elles peuvent concerner l’ensemble des connaissances et des activités humaines ou une partie plus restreinte.

CMS

id : cms
types : Technologies et familles d’outils
mots-clés :
filename : cms

Il s'agit d'une technologie sous-jacente à de nombreux sites. Le CMS (Content Management System) est un système d’interfaces qui permet de gérer la conception et la gestion d’un site sans avoir besoin de trop de connaissances en informatique. Par contre, la mise en forme du site, appelée souvent thème, demande des compétences en HTML et en d’autres langages internet.

Le CMS sert essentiellement à diffuser du contenu rédactionnel sous forme de billets ou d’actualités mais ce n’est ni une base de données permettant l’exploitation des données ni un éditeur numérique permettant de faire de l’édition scientifique poussée.

Drupal, Wordpress, Omeka et Joomla peuvent être cités parmi les CMS open source les plus connus.

CNIL

id : cnil
types : Ressources
mots-clés :
filename : cnil

Commission Nationale de l’Informatique et des Libertés, autorité administrative indépendante. Elle vise à protéger les données personnes, à accompagner l’innovation et à préserver les libertés individuelles.

Voir : RGPD

Site web : Site de la CNIL

CoCoON

id : cocoon
types : Outils logiciels, Ressources
mots-clés :
filename : cocoon

CoCoON est une plateforme de "COllections de COrpus Oraux Numériques". Elle aide à la création, la structuration et l'archivage de corpus oraux.

Un corpus se compose d'enregistrements (données audio) et d'annotations.

Site web : https://cocoon.huma-num.fr/exist/crdo/

CodiMD

id : codimd
types : Outils logiciels
mots-clés :
filename : codimd

CodiMD est une plateforme collaborative d’édition de texte en Markdown. Elle sert à partager des notes avec des collaborateurs. Cette plateforme permet à la fois d’écrire du texte, mais aussi de réaliser des schémas, diagrammes, graphiques, tableaux etc. et d’insérer des vidéos ou des pdf, et même des formules mathématiques codées en LaTeX.

Site web : https://codimd.math.cnrs.fr/

Collaboratif

id : collaboratif
types : Pratiques et méthodes
mots-clés :
filename : collaboratif

Dispositif qui vise à faciliter la collaboration de différents participants ou publics grâce à des outils informatiques adaptés au partage et à l’échange d’information. On parle aussi de système contributif ou participatif et de Crowdsourcing. Une problématique majeure de ce type de dispositif est la modération des contenus proposés.

Collatinus

id : collatinus
types : Outils logiciels
mots-clés :
filename : collatinus_collatinus-web

Collatinus est un logiciel libre, gratuit et multi-plateforme. Il s’agit d’un lemmatiseur et d’un analyseur morphologique de textes latins. A partir d’un texte latin, l’application propose quatre onglets d’analyse : lexiques, dictionnaires, scansions, flexions. Collatinus-web constitue quant à lui la version web du logiciel Collatinus.

Voir Eulexis pour les textes grecs.

Sites web : https://outils.biblissima.fr/fr/collatinus/ ; https://outils.biblissima.fr/fr/collatinus-web/

CollEc

id : collec
types : Outils logiciels
mots-clés :
filename : collec

CollEc est un service fourni par RePec qui évalue et analyse les réseaux de co-auteurs de la littérature économique.

Site web : https://collec.repec.org/app/collec_app

Collective Access

id : collective access
types : Outils logiciels
mots-clés :
filename : collective_acess

CollectiveAccess est un logiciel open source pour le catalogage et la publication en ligne de collections muséales ou archivistiques. Ce logiciel est full-web, ce que le rend accessible à distance via un navigateur web. Il repose sur le modèle de la base de données relationnelle Access développé par Microsoft.

Site web : https://www.collectiveaccess.org/

Collex-Persée

id : collex-persée
types : Groupements institutionnels
mots-clés :
filename : collex-persee

Collex-Persée est un groupement d’intérêt scientifique (GIS) co-piloté par la bibliothèque nationale universitaire de Strasbourg et le ministère de l’enseignement supérieur et de la recherche. Il regroupe vingt-et-un établissements (universités, Bnf, ABES, Persée, etc.) et une centaine de structures dont les collections documentaires ont été labellisées « collection d’excellence ».

Ce GIS s’organise comme une infrastructure de recherche en informations scientifiques et techniques dont le but est de favoriser la fréquentation des collections des bibliothèques tout en développant de nouveaux services aux chercheurs.

Il se donne plusieurs autres missions : porter une politique nationale de numérisation des documents, rendre visibles les collections par le référencement, enrichir l’offre documentaire par la négociation de ressources sous licences, labelliser les collections d’excellence pour la recherche.

Site web : https://www.collexpersee.eu

Colors for Data Scientists

id : colors for data scientists
types : Outils logiciels
mots-clés :
filename : colors_for_data_scientists

Il s’agit d’un outil qui génère et affine des palettes de couleurs pour la visualisation de données scientifiques.

Site web : https://medialab.github.io/iwanthue/

Commentaire

id : commentaire
types : Pratiques et méthodes
mots-clés :
filename : commentaire

Dans le domaine documentaire, il s'agit d'une explication, interprétation ou analyse d’un texte ; notes et éclaircissements destinés à faciliter l’intelligence d’un texte.

Dans le cadre des outils collaboratifs ou des blogs, le commentaire est une réaction à une contribution.

Voir Annotation et Collaboratif

Community Manager

id : community manager
types : Pratiques et méthodes
mots-clés :
filename : community_manager

Le Community Manager est un professionnel des communautés en ligne qu’il est chargé de fédérer et d’animer pour le compte d’une entreprise, d’une institution ou encore d’une association.

Une de ses missions principales consiste à développer et gérer la présence de son employeur sur les médias sociaux.

Compare Lists

id : compare lists
types : Outils logiciels
mots-clés :
filename : compare_lists

Compare Lists est un outil permettant de comparer deux listes d’URLs pour découvrir leurs points communs et leurs différences.

Site web : https://tools.digitalmethods.net/beta/analyse/

Compare Networks Over Time

id : compare networks over time
types : Outils logiciels
mots-clés :
filename : compare_networks_over_time

Il s’agit d’un outil qui compare dans le temps les réseaux établis par l’outil IssueCrawler et qui expose une liste hiérarchisée d’acteurs. Il est conseillé d’utiliser parallèlement Compare Networks Over Time et IssueCrawler.

Site web : https://tools.digitalmethods.net/beta/ic/comparenetworksovertime/

ConcQuest

id : concquest
types : Outils logiciels
mots-clés :
filename : concquest

ConcQuest est un logiciel, plus précisément un concordancier, consacré à la recherche d’expressions complexes à travers des corpus monolingues et multilingues alignés. Cette recherche peut s’effectuer selon divers critères comme les formes, les lemmes, les catégories, les traits morphosyntaxiques.

Ce logiciel permet également la recherche d’expressions discontinues, l’extraction de statistiques d'occurrences. Il comporte d’autres fonctionnalités décrites à l’adresse du site web.

Site web : http://turing3.univ-grenoble-alpes.fr/olivier.kraif/index.php?option=com_content&task=view&id=42&Itemid=61

Consortium

id : consortium
types : Pratiques et méthodes
mots-clés :
filename : consortium

Association d’institutions, de structures ou de partenaires individuels, constituée dans le but de réaliser un projet commun.

Consortium CAHIER

id : consortium cahier
types : Groupements institutionnels
mots-clés :
filename : consortium_cahier

Le consortium « CAHIER » (Corpus d’auteurs pour les Humanités. Informatisation, édition, recherche) est un consortium interdisciplinaire de projets numériques, en accès libre, menés principalement dans les domaines des « corpus d’auteurs », qu’ils relèvent de la littérature, de la philosophie ou d’une thématique liée à une école ou à une pratique.

Site web : http://cahier.hypotheses.org

Coordonnées géographiques

id : coordonnées géographiques
types : Pratiques et méthodes
mots-clés :
filename : coordonnees_geographiques

Couple de valeurs exprimées en degrés sexagésimaux ou décimaux, ou en grades, appelées longitude et latitude, exprimant la position d’un point situé à la surface de la Terre.

CoReA

id : corea
types : Ressources
mots-clés :
filename : corea

CoReA (Corpus et Ressources Archéologiques) est une bibliothèque numérique qui présente et rend accessible les ressources documentaires rassemblées par le Centre Camille Jullian au cours des 40 années de recherches archéologiques en Méditerranée.

Site web : https://ccj-corea.cnrs.fr

Corpus

id : corpus
types : Pratiques et méthodes
mots-clés :
filename : corpus

Recueil de documents relatifs à une discipline ou une thématique, réunis en vue de leur conservation, leur édition ou leur exploitation.

Cortext

id : cortext
types : Outils logiciels
mots-clés :
filename : cortext

Cortext est une plateforme d'analyse de texte qui permet la constitution et la visualisation de réseaux.

Elle maintenue par le laboratoire LISIS.

Site web : https://www.cortext.net/

Cosma

id : cosma
types : Outils logiciels
mots-clés :
filename : cosma

Cosma est un logiciel de visualisation de graphe documentaire. Il permet de représenter des fiches interreliées sous la forme d’un réseau interactif dans une page web.

Cosma est pensé pour les travailleurs de la connaissance. Sa fonction première est de fournir une meilleure vision globale sur un ensemble de documents interreliés, tout en proposant une modalité de partage inédite, puisque l'export (HTML) donne accès aux mêmes fonctionnalités que l'application.

Site web : https://cosma.graphlab.fr

L'exemple du glossaire de Digit_Hum : https://www.arthurperret.fr/digithum-glossaire-hn.html

CoSo

id : coso
types : Groupements institutionnels
mots-clés :
filename : coso

Créé en 2018, le CoSo (ou Comité pour la Science ouverte) est chargé de définir et de mettre en œuvre une politique de soutien à l’ouverture des publications et des données de la recherche à l’échelle nationale et internationale et d’en assurer la coordination entre les établissements et les communautés de chercheurs.

Outre plusieurs groupes de travail, le CoSo comprend quatre collèges - le collège des publications, celui des données de la recherche, le collège compétences et formation ainsi que le collège Europe et international.

Site web : https://www.ccsd.cnrs.fr/project/coso/

Couperin

id : couperin
types : Groupements institutionnels
mots-clés :
filename : couperin

Couperin est un consortium unifié des établissements universitaires et de recherche pour l’accès aux publications numériques qui regroupe des universités, des centres de recherches, des grandes écoles. Il se charge notamment d’évaluer, de négocier et d’organiser l’achat de ressources numériques pour ses membres tout en contribuant à redéfinir et à faire évoluer les relations contractuelles avec les éditeurs.

Couperin assure également une veille et mène une réflexion sur les enjeux de la science ouverte qu’il soutient. Il œuvre au développement de la coopération nationale, européenne et internationale en matière de documentation et de ressources électroniques.

Site web : https://www.couperin.org/

CRAN

id : cran
types : Ressources
mots-clés :
filename : cran

Le Comprehensive R Archive Network (CRAN) est un site web où se trouvent les bibliothèques à télécharger pour R.

Site web : https://cran.r-project.org

Creative Commons

id : creative commons
types : Pratiques et méthodes
mots-clés :
filename : creative_commons

Publiées dès 2002, les licences Creative Commons (CC) proposent une solution légale aux personnes souhaitant offrir une autorisation non exclusive de reproduire, distribuer et communiquer une œuvre au public à titre gratuit. Elles permettent de faire apparaître clairement au public les conditions de la licence de distribution et de réutilisation de cette création.

Site web : https://creativecommons.org/share-your-work/

Crowdsourcing

id : crowdsourcing
types : Pratiques et méthodes
mots-clés :
filename : crowdsourcing

Le crowdsourcing, littéralement “approvisionnement par la foule”, est une pratique de production participative visant à externaliser une activité auprès d’un large réseau d’acteurs le plus souvent anonymes ; activité ordinairement effectuée en interne par une entreprise (ou une institution) ou en externe par un prestataire désigné. Il suppose un appel ouvert à tous, sans restriction de participation et sans discrimination.

Voir Web 2.0, folksonomie, Collaboratif

CSS

id : css
types : Pratiques et méthodes
mots-clés :
filename : css

Les feuilles de style en cascade (Cascading Style Sheets) ou CSS constituent un langage informatique servant à la description de la présentation des documents HTML et XML en dehors de ces mêmes documents. Ainsi, il est possible de décrire la structure d’un document en HTML et de décrire à part toute sa présentation dans une feuille de style CSS.

De cette façon, les styles ou la mise en page ne sont appliqués qu’au moment de la consultation de la page web dans un navigateur web.

Cette séparation entre structure et présentation permet de modifier plus aisément la présentation d’un document, d’en améliorer l’accessibilité, et d’en diminuer la complexité architecturale.

CSV

id : csv
types : Pratiques et méthodes
mots-clés :
filename : csv

Le CSV (Comma-separated values) est un format de stockage des données en texte brut d’une feuille de calcul. Ce format vise la facilité du partage. Il est lisible par la plupart des logiciels de tableur. En revanche il ne permet pas l’enrichissement typographique (gras, italique, etc.) : il conserve du texte brut.

CSV Rinse Repeat

id : csv rinse repeat
types : Outils logiciels
mots-clés :
filename : csv_rinse_repeat

CSV Rinse Repeat est un outil en ligne permettant d’améliorer, d’explorer et de visualiser des fichiers CSV en utilisant du code javascript.

Site web : https://medialab.sciencespo.fr/outils/csv-rinse-repeat/

Curvenote

id : curvenote
types : Outils logiciels
mots-clés :
filename : curvenote

Curvenote permet d’utiliser les fichiers du Jupyter Book pour créer un site web et faire son hébergement. Cet outil possède aussi une interface sans code qui permet de publier des articles dans un site internet (comme dans un blog) au format texte à partir de templates et de les exporter en format PDF ou en LaTeX.

Site Web : https://curvenote.com/

Tutoriel : https://www.youtube.com/watch?v=ZQTiAc2UXnk&t=2253s&ab_channel=curvenote

D3.js

id : d3.js
types : Outils logiciels
mots-clés :
filename : d3.js

D3.js est une bibliothèque Javascript permettant de publier des visualisations de données interactives dans des documents et pages web. Cet outil s'appuie sur les langages HTML et CSS ainsi que le format SVG. De plus, c'est un outil libre.

Site web (comprenant des exemples) : https://d3js.org/

Tutoriels : https://riptutorial.com/fr/d3-js

DARIAH

id : dariah
types : Groupements institutionnels
mots-clés :
filename : dariah_eric

DARIAH (Digital Research Infrastructure for the Arts and Humanities) est une infrastructure paneuropéenne pour les chercheurs en arts et en sciences humaines qui travaillent avec des méthodes de calcul.

Elle soutient la recherche numérique ainsi que l'enseignement des méthodes de recherche numérique.

Site web : https://www.dariah.eu/

Services proposés par DARIAH : https://www.dariah.eu/tools-services/tools-and-services/

Lien vers la bibliothèque zotero du réseau DARIAH ERIC :https://www.zotero.org/groups/113737/doing_digital_humanities_-_a_dariah_bibliography

DART-Europe

id : dart-europe
types : Ressources
mots-clés :
filename : dart-europe

Créé en 2005, DART-Europe est un partenariat entre bibliothèques nationales et universitaires et établissements européens d’enseignement supérieur qui fournit un portail d’accès aux thèses électroniques de 29 pays européens.

Site web : https://www.dart-europe.org/basic-search.php

Data Bnf

id : data bnf
types : Ressources
mots-clés :
filename : data_bnf

La bibliothèque de France nous guide dans ses ressources en regroupant sur une même page toutes les informations issues de ses différents catalogues, ainsi que de sa bibliothèque numérique Gallica.

Le projet Data BnF vise ainsi à accroître la visibilité des données de la BnF par une meilleure exposition sur le Web, à faciliter la réutilisation des métadonnées par des tiers, à fédérer les données de la BnF au sein et au-delà des catalogues, contribuer à la coopération et à l’échange de métadonnées par la création de liens entre des ressources structurées et de confiance.

Voir Web sémantique

Site web : https://data.bnf.fr/

Data Documentation Initiative

id : data documentation initiative
types : Groupements institutionnels
mots-clés :
filename : data_documentation_initiative

La Data Documentation Initiative (DDI) est une norme internationale permettant de décrire les données produites par les enquêtes et autres méthodes d'observation dans le domaine des sciences sociales, comportementales, économiques et de la santé. La DDI est une norme gratuite qui permet de documenter et de gérer les différentes étapes du cycle de vie des données de recherche, telles que la conceptualisation, la collecte, le traitement, la distribution, la découverte et l'archivage.

La documentation des données avec DDI facilite la compréhension, l'interprétation et l'utilisation des données par les personnes, les systèmes logiciels et les réseaux informatiques. La norme propose des outils de description des données (DDI Codebook) et du cycle de vie des données (DDI Lifecycle), des vocabulaires contrôlés (Controlled vocabularies) ainsi que des outils de représentation des classifications statistiques (XKOS) ou encore des opérations de transformation des données (SDTL).

Source : https://groupes.renater.fr/sympa/info/dh

Data paper

id : data paper
types : Pratiques et méthodes
mots-clés :
filename : data_paper

Un papier de données ou articles de données est un article scientifique visant à présenter un jeu de données : la méthode d’acquisition de ces données, leur structuration, et leur potentiel de réutilisation. Ce type d’article peut être publié dans des revues classiques, ou dans des data journals qui sont spécialisés dans la publication de data paper.

Voir aussi : Plan de gestion des données, Accessibilité des données

DBpedia

id : dbpedia
types : Ressources
mots-clés :
filename : dbpedia

DBpedia est un projet universitaire et communautaire d'exploration et d’extraction automatiques de données dérivées de Wikipédia. Son principe est de proposer une version structurée et sous forme de données normalisées au format du web sémantique des contenus de chaque fiche encyclopédique.

DBpedia vise aussi à relier à Wikipédia (et inversement) des ensembles d'autres données ouvertes provenant du Web de données.

Voir Web sémantique, Open Data.

Site web : http://fr.dbpedia.org

DeepL

id : deepl
types : Outils logiciels
mots-clés :
filename : deepl

Plateforme de traduction automatique multilingue (voir Intelligence artificielle).

Site web : https://www.deepl.com/fr/translator

Déploiement d’outil

id : déploiement d’outil
types : Pratiques et méthodes
mots-clés :
filename : deploiement_d_outil

Le déploiement consiste à faire passer un prototype à une version pérenne accessible en ligne et une fois cette version stabilisée, à y intégrer les données traitées ou à venir.

Dépouillement

id : dépouillement
types : Pratiques et méthodes
mots-clés :
filename : depouillement

Première étape d'une analyse documentaire : repérage et sélection d'informations contenues dans un document en fonction de critères prédéterminés.

Le dépouillement commence par la sélection des parties composantes (articles, chapitres, images, séquences, etc.) qui seront décrites et analysées en fonction de la politique documentaire.

Désambiguïser

id : désambiguïser
types : Pratiques et méthodes
mots-clés :
filename : desambiguiser

Faire disparaître l’ambiguïté d’un mot, d’une phrase en ne retenant qu’un seul sens et/ou en donnant des formes ou des annotations spécifiques aux différents sens.

Description de document

id : description de document
types : Pratiques et méthodes
mots-clés :
filename : description_de_document

La description est formelle et ne concerne pas l’analyse ou toute interprétation du contenu. Le premier niveau de description d'un document est constitué par l’ensemble des métadonnées qui permettent aux utilisateurs et aux moteurs de recherche de retrouver le document. Le deuxième niveau de description d'un document est le plan structurel (structuration logique de son contenu).

Voir EAD, ISBD, Indexation

DH

id : dh
types : Groupements institutionnels
mots-clés :
filename : dh

Liste de discussion francophone concernant les Digital Humanities (DH), ouverte à toutes les disciplines de sciences humaines et sociales. Elle fait partie des services offerts par Humanistica, l'association francophone des humanités numériques (www.humanisti.ca) mais il n'est pas nécessaire d'être membre de l'association pour s'abonner à la liste.

Site web : https://groupes.renater.fr/sympa/info/dh

Dicto

id : dicto
types : Outils logiciels
mots-clés :
filename : dicto

Dicto est un outil permettant de délimiter, transcrire, traduire et commenter des extraits de médias audio et vidéo. Les annotations créées peuvent éventuellement être publiées sous la forme de sites web ou de code HTML.

Site web : https://dictoapp.github.io/dicto/

Digital Methods Initiative

id : digital methods initiative
types : Groupements institutionnels, Outils logiciels
mots-clés :
filename : digital_methods_initiative

La Digital Methods Initiative est un groupement européen de chercheurs et de doctorants dont les recherches portent sur l’étude de l’Internet.

Pour ce faire, elle développe des outils et des méthodes qui permettent de réutiliser les dispositifs et les plateformes en ligne (youtube, twitter, facebook, google) dans une optique de recherche sur des problématiques sociales et politiques. Un grand nombre d’outils est disponible sur le site web.

Site web : https://wiki.digitalmethods.net/Dmi/DmiAbout

Diigo

id : diigo
types : Outils logiciels
mots-clés :
filename : diigo

Diigo est une plateforme en ligne permettant de sauvegarder des pages et des contenus web depuis un navigateur et d’y ajouter des tags et des annotations.

Diigo permet un usage personnel ou collaboratif et le contenu d’un compte diigo peut être privé ou public.

Site web : https://www.diigo.com/

Dissemin

id : dissemin
types : Ressources
mots-clés :
filename : dissemin

Dissemin est une plateforme web qui récolte des métadonnées depuis différentes sources et qui détermine la disponibilité (ou non) du texte intégral des publications des chercheurs. Cet outil aide leurs auteurs à les télécharger en un clic vers un dépôt ouvert. Grâce à lui, les chercheurs peuvent donc s’assurer que leurs publications sont librement accessibles.

Il a été conçu pour encourager l’usage des dépôts (plutôt que des pages personnelles) mais n’est pas un dépôt lui-même car il ne stocke pas le texte intégral des publications. Il fournit en revanche les liens vers les articles disponibles en texte intégral.

Voir Zenodo, HAL, Science ouverte, Open Access

Site web : https://dissem.in

Dive

id : dive
types : Outils logiciels
mots-clés :
filename : dive

Dive est un logiciel d’exploration, d’analyse et de visualisation de données.

Site web : https://medialab.sciencespo.fr/outils/dive/

Django

id : django
types : Outils logiciels
mots-clés :
filename : django

Django est un framework web open source en Python. Il a pour but de rendre le développement d’applications web simple et basé sur la réutilisation de code.

Site web : https://www.djangoproject.com/

Tutoriel : https://www.youtube.com/watch?v=rHux0gMZ3Eg&ab_channel=ProgrammingwithMosh

DMI-TCAT

id : dmi-tcat
types : Outils logiciels
mots-clés :
filename : dmi-tcat

Twitter Capture and Analysis Toolset (DMI-TCAT) capture et analyse de différentes façons les données de la plateforme twitter.

Site web : https://wiki.digitalmethods.net/Dmi/ToolDmiTcat

DOAB

id : doab
types : Ressources
mots-clés :
filename : doab

DOAB (Directory of Open Access Books) est une plateforme en ligne créée en 2012 qui indexe des livres scientifiques en libre accès, autrement dit, des livres dont le contenu a été révisé et validé par les pairs.

L’objectif principal de DOAB est ainsi d’accroître la visibilité de ces publications en libre accès. Il invite en effet les éditeurs scientifiques à fournir les métadonnées de leurs ouvrages en libre accès de façon à rendre ces métadonnées moissonnables par les catalogues de bibliothèques ou les agrégateurs de contenu.

Site web : https://directory.doabooks.org

DOAJ

id : doaj
types : Ressources
mots-clés :
filename : doaj

Créé en 2003, DOAJ (Directory of Open Access Journals) est un annuaire en ligne qui recense les revues scientifiques en libre accès. Il recense toutes les revues quel que soit leur champ disciplinaire, leur langue ou leur origine géographique.

Il entend ainsi augmenter la visibilité, l’accessibilité, la réputation et l’utilisation des revues scientifiques en libre accès.

Voir Open Access

Site web : https://doaj.org

Document

id : document
types : Pratiques et méthodes
mots-clés :
filename : document

Un document renvoie à un ensemble formé par un support et une information, celle-ci enregistrée de manière persistante. Il a une valeur explicative, descriptive ou de preuve.

DOI

id : doi
types : Pratiques et méthodes
mots-clés :
filename : doi

Le DOI (Digital Object Identifier / identifiant d’objet numérique) est le cœur d’un mécanisme d'identification de ressources numériques, comme les revues, articles scientifiques, rapports, vidéos, etc. Il est parfois comparé aux ISSN ou ISBN pour le web, mais c'est aussi une alternative à l’instabilité des URL par l’association de la localisation du document et des métadonnées qui lui sont liées.

Un DOI unique est attribué à chaque ressource et ne sera pas réutilisé. Ex. pour la Revue Cybergeo : DOI : 10.4000/cybergeo.2373.

Voir Référencement, Interopérabilité, ARK

Définition du DOI sur La Maison des revues et des livres

Données de la recherche

id : données de la recherche
types : Pratiques et méthodes
mots-clés :
filename : donnee_de_la_recherche

Selon l’OCDE « Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. ».

Les données de la recherche forment également l’ensemble des informations et des matériaux produits par les chercheurs et s’apparentent ainsi à une partie des archives de la recherche. Les données sont donc à la fois des informations collectées et produites lors d’un processus de recherche.

Voir Enrichissement des données, FAIR Data, Plan de gestion des données, Open Data.

Données structurées

id : données structurées
types : Pratiques et méthodes
mots-clés :
filename : donnees_structurees

Dans les langages de formatage de type XML ou HTML, les données structurées sont des informations encadrées par des balises spécifiques dans les sources des pages et qui permettent à des outils d’édition ou d’exploitation, comme les moteurs de recherche, de les interpréter d'une certaine manière. Les données structurées répondent à un schéma d’utilisation (une norme) avec des règles de balisage.

DoRANum

id : doranum
types : Ressources
mots-clés :
filename : doranum

DoRANum est un dispositif de formation à distance fournissant des ressources d’auto-formation (fiches synthétiques, infographies, webinaires, etc.) sur la thématique de la gestion et du partage des données de la recherche.

Site web : https://doranum.fr

DROID

id : droid
types : Outils logiciels
mots-clés :
filename : droid

DROID est un logiciel d’identification automatique massive de formats de fichiers, utilisé pour l’archivage numérique. Ce logiciel est développé et maintenu par les archives nationales du Royaume-Uni.

Site web : https://www.nationalarchives.gov.uk/information-management/manage-information/preserving-digital-records/droid/

Droit d’auteur

id : droit d’auteur
types : Pratiques et méthodes
mots-clés :
filename : droit_d_auteur

Le droit d’auteur se décompose en deux ensembles :

a) Les droits moraux, inaliénables, qui concernent l’intégrité de l’œuvre, le droit de retrait et de repentance. Ils ne peuvent pas être cédés.

b) Les droits patrimoniaux qui concernent l’exploitation de l’œuvre (reproduction, représentation). Ils peuvent être cédés par l’ayant droit, à l’image d’un écrivain qui cède les droits de reproduction à son éditeur. Ces droits sont possédés par l’auteur de l’œuvre protégée. Il les transmet à ses héritiers – ou ayants droit – à sa mort.

Si, en France, la durée de protection des droits patrimoniaux est de soixante-dix ans après la mort de l’auteur (sauf dérogation : les auteurs morts pour la France pendant les Guerres mondiales bénéficient de trente ans de protection supplémentaire), les droits moraux sont eux inaliénables et perdurent dans le temps.

Voir le code du patrimoine sur le droit d'auteur

DTD

id : dtd
types : Pratiques et méthodes
mots-clés :
filename : dtd

En XML, le DTD (Document Type Definition ou Définition de Type de Document) est un fichier ou une partie de fichier qui permet de définir le modèle ou la structure d’un document.

DtmVic

id : dtmvic
types : Outils logiciels
mots-clés :
filename : dtmvic

DtmVic, pour Data and Text Mining : Visualisation, Inférence, Classification, est un logiciel d'analyse textométrique.

Site web : https://corli.huma-num.fr/dtmvic/

Dublin Core

id : dublin core
types : Pratiques et méthodes
mots-clés :
filename : dublin_core

Le Dublin Core est un modèle de description de tout type de ressource numérique (audio, vidéo, livre, objet) qui propose un socle de quinze éléments. Ces quinze champs sont les suivants : Titre, Créateur, Sujet, Description, Source, Éditeur, Date, Couverture, Relation, Format, Langue, Type, Identifiant, Contributeur, Droit. Devenu standard international, il permet donc l’échange de données entre différents projets ou outils et facilite l’interopérabilité des données.

Pour plus de précisions sur l’application du Dublin Core, voir la présentation très précise sur le site de la BnF.

Le Dublin Core n’impose pas de compléter tous les champs mais pour une meilleure diffusion et pérennité des données, il est important d’en remplir le plus possible. Ces champs sont tous répétables, sans aucune limite.

Voir Interopérabilité

Site web : https://dublincore.org/

Duplicate

id : duplicate
types : Outils logiciels
mots-clés :
filename : duplicate

Duplicate est un outil de la Digital Methods Initiative qui sert à répliquer les tags d’un nuage de tags en fonction de leur valeur. Il peut être utilisé pour insérer un nuage de tags préformaté dans des services de type wordle.

Site web : https://tools.digitalmethods.net/beta/deduplicate/

E-book

id : e-book
types : Pratiques et méthodes
mots-clés :
filename : e-book

Livre disponible en version numérique. Il se présente sous la forme d’un fichier qui peut être téléchargé, stocké et/ou lu sur les appareils électroniques qui en permettent l’affichage et la lecture sur écran.

Les e-books utilisent souvent le format epub (electronic publication).

E-Stampage

id : e-stampage
types : Ressources
mots-clés :
filename : e-stampage

E-Stampage est une ectypothèque numérique qui permet la consultation en ligne des collections d’estampages (empreintes moulées des inscriptions épigraphiques) produites depuis la fin du XIXè siècle lors des fouilles et études archéologiques par les épigraphistes de l'École française d’Athènes.

Site web : https://www.e-stampages.eu/s/e-stampages/page/accueil

EAC

id : eac
types : Pratiques et méthodes
mots-clés :
filename : eac_encoded_archival_context

L’EAC (Encoded Archival Context) est un type de DTD qui permet la production en XML de notices d’autorité de personnes physiques, de familles ou de collectivités.

EAD

id : ead
types : Pratiques et méthodes
mots-clés :
filename : ead

Encoded Archival Description : standard de description archivistique qui permet d’encoder en XML un inventaire d’archives.

Site web : https://www.loc.gov/ead/

Plus d'informations : https://www.bnf.fr/fr/ead-encoded-archival-description

EasyAlign

id : easyalign
types : Outils logiciels
mots-clés :
filename : easyalign

EasyAlign est un logiciel permettant de générer et d’aligner semi-automatiquement des annotations phonétiques à partir d’une transcription.

Site web : http://latlntic.unige.ch/phonetique/easyalign.php

EconAcademics.org

id : econacademics.org
types : Outils logiciels
mots-clés :
filename : econacademics.org

EconAcademics.org est un agrégateur de blogs spécialisés dans la recherche en économie. Il s’agit d’un des services développés par RePec.

Site web : https://econacademics.org

EconPapers

id : econpapers
types : Ressources
mots-clés :
filename : econpapers

EconPapers est un moteur de recherche développé par RePec qui fournit un accès à divers types de publications relatives à la discipline économique.

Site web : https://econpapers.repec.org

ECW

id : ecw
types : Pratiques et méthodes
mots-clés :
filename : ecw

ECW (Enhanced Compression Wavelet) est un format de compression d’images numériques élaboré pour l’imagerie aérienne et satellitaire. Il permet de compresser de très lourdes images à haute résolution. Cela implique des pertes.

EDIRC

id : edirc
types : Ressources
mots-clés :
filename : edirc

EDIRC est un répertoire en ligne qui recense et indexe par pays et par champs les institutions économiques du monde entier.

Voir RePec

Site web : https://edirc.repec.org

ELAN

id : elan
types : Outils logiciels
mots-clés :
filename : elan

ELAN est un logiciel de création d’annotations complexes sur des ressources audio et vidéo.

Site web : https://archive.mpi.nl/tla/elan

ELite-HTS

id : elite-hts
types : Outils logiciels
mots-clés :
filename : elite-hts

ELite-HTS est un logiciel de création d’annotations complexes sur des ressources audio et vidéo.

Site web : http://cental.uclouvain.be/elitehts/v1/#_all_resources

EMAN

id : eman
types : Outils logiciels, Ressources
mots-clés :
filename : eman

Plateforme d'édition de manuscrits et de fonds d'archives modernes numérisées.

Site web : http://www.eman-archives.org

Empreinte numérique

id : empreinte numérique
types : Pratiques et méthodes
mots-clés :
filename : empreinte_numerique

En informatique, l’empreinte numérique désigne un ensemble de contrôles lié à un fichier ou à un message. Elle sert à vérifier que l’intégrité du fichier a été préservée. Elle peut également désigner l’empreinte digitale d’un appareil électronique.

Dans le domaine de la sécurité informatique, l’empreinte numérique équivaut aux données récoltées sur un système informatique distant ou encore au procédé (« prise d’empreinte de la pile TCP/IP ») permettant de connaître l’identité du système d’exploitation utilisé sur une machine distante.

EMU-SDMS

id : emu-sdms
types : Outils logiciels
mots-clés :
filename : emu-sdms

EMU Speech Database Management System (ou EMU-SDMS) est une collection d’outils dédiés à la création, la manipulation, la gestion et l’analyse de bases de données orales.

Site web : https://ips-lmu.github.io/EMU.html

Encodage

id : encodage
types : Pratiques et méthodes
mots-clés :
filename : encodage

Le terme d'encodage recouvre plusieurs acceptions.

De façon générale, il s'agit de l'action de transcrire des données selon un code ou un protocole.

L'encodage est une représentation normalisée de données textuelles : c'est l’action de structurer un texte avec des balises de différents formats (HTML, TEI, EAD, etc., chaque format possédant son propre langage mais également ses propres finalités). L’encodage peut concerner aussi bien des spécifications de mise en forme que des indications de structure ou des interprétations sémantiques.

En informatique, l'encodage désigne également la représentation des caractères par un nombre hexadécimal selon une norme. UTF-8 et ISO 8859-1 sont deux correspondances fréquemment utilisées entre des caractères et leur représentation hexadécimale.

Enregistrement

id : enregistrement
types : Pratiques et méthodes
mots-clés :
filename : enregistrement

Terme consacré dans les bases de données, c’est l’ensemble des valeurs d’une ligne d’un tableau contenant lui-même un certain nombre de colonnes (que sont les champs). C’est équivalent à une notice ou à une fiche.

Enrichissement des données

id : enrichissement des données
types : Pratiques et méthodes
mots-clés :
filename : enrichissement_des_donnees

Ajout d’informations complémentaires pour aider la lecture, comme la normalisation des noms propres, les annotations, etc. Différents types d’enrichissements :

Enrichissement par complétion : ajout de formes normalisées de noms propres et ajout de références bibliographiques (identifiants de notices d’autorités de catalogues en ligne).

Enrichissement par annotation : ajout de commentaires sur le sens du texte rédigé, ajout de rapprochements avec d’autres documents ou avec des œuvres dites et écrites, ajout de références complémentaires, etc.

ENT

id : ent
types : Pratiques et méthodes, Technologies et familles d’outils
mots-clés :
filename : ent

ENT (Espace Numérique de Travail ou Environnement Numérique de Travail) est un ensemble d’outils permettant à un individu d’accéder à distance aux informations relatives à son travail (dossiers, boîte mail, fichiers, etc.) et de communiquer et collaborer avec ses collègues.

Souvent, l’ENT comprend un système de gestion documentaire, un moteur de recherche et un réseau social d’entreprise. Il rend plus flexible le lieu et le temps de travail.

Entité nommée

id : entité nommée
types : Pratiques et méthodes, Technologies et familles d’outils
mots-clés :
filename : entite_nommee

Une entité nommée est une expression linguistique référentielle, souvent associée aux noms propres et aux descriptions définies, qui a émergé avec le besoin d’applications de recherche d’information. Les entités nommées peuvent être objet de traitements à divers degrés de finesse (détection, extraction, reconnaissance, liaison). Elles sont l’objet d’une tâche du traitement automatique du langage naturel appelée reconnaissance d’entités nommées.

Entrepôt OAI-PMH

id : entrepôt oai-pmh
types : Pratiques et méthodes, Technologies et familles d’outils
mots-clés :
filename : entrepot_oai-pmh

C’est un répertoire de serveur web sur lequel les fournisseurs de données peuvent déposer leurs métadonnées en attendant qu’un robot vienne les « moissonner » afin de les intégrer à son propre catalogue. Pour cela il faut utiliser le protocole OAI-PMH.

Environnement de développement intégré (IDE)

id : environnement de développement intégré (ide)
types : Technologies et familles d’outils
mots-clés :
filename : environnement_de_developpement_integre

Un environnement de développement intégré, ou IDE, est un logiciel de création d'applications, qui rassemble des outils de développement fréquemment utilisés dans une seule interface utilisateur graphique (GUI).

Un IDE se compose habituellement des éléments suivants :

Éditeur de code source : un éditeur de texte qui aide à la rédaction du code logiciel, avec des fonctions telles que la coloration syntaxique avec repères visuels, la saisie automatique en fonction du langage et la vérification de bogues dans le code pendant la rédaction.

Utilitaires d'automatisation de version locale : des utilitaires qui permettent d'automatiser des tâches simples et reproductibles lors de la création d'une version locale du logiciel à destination du développeur lui-même, par exemple la compilation du code source en code binaire, la mise en paquet du code binaire et l'exécution de tests automatisés

Débogueur : un programme qui permet de tester d'autres programmes en affichant l'emplacement des bogues dans le code d'origine

Site web : https://www.redhat.com/fr/topics/middleware/what-is-ide

Épi-revue

id : épi-revue
types : Pratiques et méthodes
mots-clés :
filename : epi-revue

Une épi-revue est une revue électronique en libre accès, composée d’articles évalués par les pairs et soumis via un dépôt dans une archive ouverte telle que HAL.

Voir aussi Science ouverte

Site web d'Episciences : https://www.ccsd.cnrs.fr/epi-revues

Episciences

id : episciences
types : Ressources
mots-clés :
filename : episciences

Episciences est une plateforme qui héberge et donne accès aux épi-revues. La soumission des articles se fait par un processus de dépôt dans une archive ouverte.

Cette plateforme est développée et administrée par le CCSD.

Site web : https://episciences.org

ERMS

id : erms
types : Technologies et familles d’outils
mots-clés :
filename : erms

ERMS (Electronic Resource Management System) est un type de logiciels conçu pour favoriser la gestion globale des ressources numériques, notamment des bouquets de périodiques électroniques et des bases de données en ligne.

Il fournit de nombreuses fonctionnalités telles que le bulletinage des périodiques, la gestion des abonnements, la gestion des droits d’utilisation, la gestion des licences et des statistiques ou encore le suivi des collections.

Il existe des ERMS libres comme CORAL ou propriétaires comme Verde.

eScriptorium

id : escriptorium
types : Outils logiciels
mots-clés :
filename : escriptorium

eScriptorium est une plateforme web ayant pour but de fournir un ensemble d'outils pour transcrire, annoter, et éditer numériquement des documents historiques.

eScriptorium permet :

de transcrire automatiquement des documents manuscrits ou imprimés à l'aide de techniques d'apprentissage automatique (kraken) ;

l’emploi une interface utilisateur ergonomique pour segmenter ou annoter les documents textes sous forme d’image  et réaliser des transcriptions manuelles ;

la manipulation, l’échange et la conversion de documents et images de différents formats:  importation et exportation des transcriptions ou annotations avec ALTO-XML ou Page XML, importation d’images au format zip , IIIF, documents PDF vers les applications eScriptorium ;

de faciliter le travail collaboratif sur les corpus de documents (annotation collaborative, partage de modèles d’IA, versioning).

Site web et ressources : https://escriptorium.fr/

Présentation : https://ephenum.hypotheses.org/1412

Eulexis

id : eulexis
types : Outils logiciels
mots-clés :
filename : eulexis

Eulexis est un logiciel libre et gratuit de lemmatisation de textes en grec ancien. Il existe également une version web de ce logiciel appelée Eulexis-web.

Il s’apparente au logiciel Collatinus qui existe pour les textes latins.

Sites web : https://outils.biblissima.fr/fr/eulexis/ ; https://outils.biblissima.fr/fr/eulexis-web/

European Association for Digital Humanities

id : european association for digital humanities
types : Pratiques et méthodes
mots-clés :
filename : eadh

L'Association européenne pour les humanités numériques (European Association for Digital Humanities), anciennement connue sous le nom d'Association pour l'informatique littéraire et linguistique, est une organisation dédiée aux humanités numériques fondée à Londres en 1973. L'EADH rassemble et représente les Digital Humanities en Europe à travers l'ensemble des disciplines qui recherchent, développent et appliquent les méthodes et technologies des Digital Humanities. Ces disciplines comprennent, entre autres, l'histoire de l'art, les études culturelles, l'histoire, le traitement de l'image, les études linguistiques et littéraires, les études sur les manuscrits et la musicologie. L'EADH soutient également la formation de groupes d'intérêt DH en Europe, qui sont définis par région, langue, orientation méthodologique ou autres critères.

Site web : https://eadh.org/

European Strategy Forum on Research Infrastructures

id : european strategy forum on research infrastructures
types : Groupements institutionnels
mots-clés :
filename : esfri

L'ESFRI, le Forum stratégique européen des infrastructures de recherche (European Strategy Forum on Research Infrastructures), est un instrument stratégique visant à développer l'intégration scientifique de l'Europe et à renforcer son rayonnement international. L'accès compétitif et ouvert à des infrastructures de recherche de haute qualité soutient la qualité des activités des scientifiques européens, et attire les meilleurs chercheurs du monde entier.

L'ESFRI est à l'avant-garde de la politique scientifique européenne et mondiale et contribue à son développement en traduisant les objectifs politiques en conseils concrets pour les infrastructures de recherche européennes. La feuille de route sur les infrastructures de recherche de l'ESFRI offre un panorama des infrastructures de recherche européennes des SHS, qu'elles soient à l'état de projet ou bien arrivées à maturité en termes d'activité. DARIAH ou CLARIN figurent par exemple sur cette feuille de route.

Site web : https://www.esfri.eu/

Evernote

id : evernote
types : Outils logiciels
mots-clés :
filename : evernote

Comme Pocket, Evernote est un outil de veille qui sauvegarde et agrège les pages web sélectionnées mais c’est également un outil de gestion de projet.

Chaque page enregistrée dans Evernote peut être classée grâce à l’application de tag. Evernote permet également de prendre des notes, d’y joindre des documents, de créer des carnets de notes en fonction d’un projet, d’organiser des tâches.

Site web : https://evernote.com/intl/fr/

eXist

id : exist
types : Outils logiciels, Technologies et familles d’outils
mots-clés :
filename : exist

eXist est un système de gestion de base de données open source écrit avec le langage Java. Il sert à gérer des données en XML, et permet leur stockage de manière intelligente grâce à une organisation des données en différentes collections. La fonctionnalité de requête d'eXist repose sur le langage X-Query.

Site web : http://exist-db.org/exist/apps/homepage/index.html

Voir aussi : BaseX

EXMARaLDA

id : exmaralda
types : Outils logiciels
mots-clés :
filename : exmaralda

EXMARaLDA est un ensemble d’outils numériques permettant la transcription, l’annotation, la gestion, la recherche et l’analyse de corpus oraux.

Site web : https://exmaralda.org/en/

Expand Tiny URLs

id : expand tiny urls
types : Outils logiciels
mots-clés :
filename : expand_tiny_urls

Il s’agit d’un outil de la Digital Methods Initiative qui permet de déplier des URLs qui ont été raccourcies par des outils tels que tinyurl.com ou bit.ly, particulièrement utilisés sur les réseaux sociaux comme twitter ou facebook.

Site web : https://tools.digitalmethods.net/beta/expandTinyUrls/

Exposition virtuelle

id : exposition virtuelle
types : Pratiques et méthodes
mots-clés :
filename : exposition_virtuelle

L’exposition virtuelle est un moyen de plus en plus utilisé par les musées, les détenteurs de fonds culturels, ainsi que les artistes pour diffuser leurs œuvres sur le web. Elle permet de créer des parcours thématiques à partir des données publiées.

Expression régulière

id : expression régulière
types : Pratiques et méthodes
mots-clés :
filename : expression_reguliere

Les expressions régulières sont aussi appelées expressions rationnelles, regex (mis pour Regular Expression) ou expressions normales. Les expressions régulières servent à tester la présence ou l'absence d'un motif dans une chaîne de caractère. Elles sont simples à utiliser, concises et puissantes. Elles sont présentes dans de nombreux logiciels (Word, Oxygen, etc.) et langages informatiques (Python, R, etc.).

Extract URLs

id : extract urls
types : Outils logiciels
mots-clés :
filename : extract_urls

Il s’agit d’un outil qui extrait les URLs issues d’un fichier IssueCrawler. Il est utile pour récupérer une liste propre et les points de départ des acteurs dans le réseau.

Site web : https://tools.digitalmethods.net/beta/ic/getXmlUrls/

FACILE

id : facile
types : Outils logiciels, Ressources
mots-clés :
filename : facile

FACILE (Format d’Archivage du Cines par analyse et expertise) est un outil en ligne mis au point par le CINES servant à vérifier que le format d’un fichier est valide pour son archivage pérenne sur la plateforme PAC du CINES.

Site web : https://facile.cines.fr/

FAIR data

id : fair data
types : Pratiques et méthodes
mots-clés :
filename : fair_data

L’objectif des principes FAIR (Faciles à trouver, Accessibles, Interopérables, Réutilisables) est de favoriser la découverte, l’accès, l’interopérabilité et la réutilisation des données partagées.

Chaque principe FAIR se décline en un ensemble de caractéristiques que doivent présenter les données et les métadonnées pour faciliter leur découverte et leur utilisation par les hommes mais aussi par les machines.

Voir : https://www6.inrae.fr/datapartage/Produire-des-donnees-FAIR - https://www6.inrae.fr/datapartage/Produire-des-donnees-FAIR/Comment-FAIR-en-pratique

Feedly

id : feedly
types : Outils logiciels
mots-clés :
filename : feedly

Feedly est une application web d’organisation de veille informationnelle qui permet de gérer les flux RSS de l’internaute en les agrégeant sur sa plateforme.

Voir aussi : InoReader, Netvibes

Site web : https://feedly.com

Feuille de style

id : feuille de style
types : Pratiques et méthodes
mots-clés :
filename : feuille_de_style

Une feuille de style est un document qui permet de gérer la présentation, la mise en forme d’un autre document, notamment d’une page web.

Elle vise à séparer la présentation et le contenu d’une page et permet d’automatiser et d’uniformiser la présentation puisqu’une même feuille de style peut s’appliquer à plusieurs documents comme les pages HTML d’un site web.

Voir CSS

Fiche

id : fiche
types : Pratiques et méthodes
mots-clés :
filename : fiche

Une fiche rassemble tous les champs saisis dans un formulaire.

Fichier (bibliothèque)

id : fichier (bibliothèque)
types : Pratiques et méthodes
mots-clés :
filename : fichier_bibliotheque

Répertoire de fiches (unité organique et ordre thématique). Avant l’informatisation des catalogues des bibliothèques, ces derniers se présentaient sous forme d’ensemble de fiches, généralement appelé catalogue ou fichier papier.

Depuis les années 1990, la majorité des catalogues ont été rétroconvertis pour être consultables de manière informatique. Il est toutefois fréquent que les bibliothèques conservent leurs fichiers papier.

Voir Rétroconversion.

Fichier informatique

id : fichier informatique
types : Pratiques et méthodes
mots-clés :
filename : fichier_informatique

Un fichier informatique est un ensemble de données numériques réunies sous un même nom, enregistrées en un seul contenant sur un support de stockage permanent. Un fichier informatique a un format numérique symbolisé par une extension finale généralement en trois ou quatre lettres.

Figma

id : figma
types : Outils logiciels
mots-clés :
filename : figma

Figma est un outil utilisé par les programmeurs pour concevoir des interfaces. L'application permet aux programmeurs de visualiser leur site internet ou leur application web avant leur création.

Figma permet aussi à plusieurs personnes de collaborer en temps réel sur le design d'une même interface, fonctionnalité utile lorsque plusieurs personnes travaillent sur le même site web.

Site web : https://www.figma.com/files/recent?fuid=1174750841094760407

Tutoriel : https://www.youtube.com/watch?v=FTFaQWZBqQ8

FileMaker Pro

id : filemaker pro
types : Outils logiciels
mots-clés :
filename : filemaker_pro

FileMaker Pro est un logiciel de gestion de base de données développé par FileMaker Inc. Il permet de concevoir des tables de données liées, et de gérer les données.

Site web : https://www.claris.com/filemaker/pro/

Folksonomie

id : folksonomie
types : Pratiques et méthodes
mots-clés :
filename : folksonomie

Néologisme formé à partir des termes anglais « folk » et « taxonomy », la folksonomie désigne le procédé d’indexation collaborative des documents numériques sur le web par les internautes à l’aide de tags.

Voir Crowdsourcing, Web 2.0

FONIO

id : fonio
types : Outils logiciels
mots-clés :
filename : fonio

FONIO est un logiciel d’écriture scientifique collaborative. Il permet d’utiliser l’architecture des sites web pour structurer des arguments, de présenter des références bibliographiques de façon homogène, d’éditer un glossaire ou encore de soigner le design de la publication.

Site web : https://fonio.medialab.sciences-po.fr/demo

Format libre/propriétaire

id : format libre/propriétaire
types : Pratiques et méthodes
mots-clés :
filename : format_libre_proprietaire

Le format libre est un format qui n’est la propriété de personne et donc exploitable par tous (ex. : PNG, JPEG). Le format propriétaire est un format rattaché à un brevet.

L’utilisation du format propriétaire n’est pas forcément payante mais seule l’entreprise détentrice du brevet en a le monopole (ex. : PDF, TIFF). Les formats propriétaires peuvent être des formats ouverts ou fermés.

Format ouvert/fermé

id : format ouvert/fermé
types : Pratiques et méthodes
mots-clés :
filename : format_ouvert_ferme

Chaque format de fichier possède sa façon de coder l’information. Les spécifications techniques du fichier peuvent être rendue publiques ou non.

Un format ouvert est un format dont les spécifications sont publiées (ex. : TIFF, ODF, PDF, etc). À l’inverse, un format fermé est un format dont on ne connaît pas les spécifications techniques (ex. : Excel, Word, etc.). L’ouverture ou la documentation d’un format n’empêche pas que celui-ci soit un format propriétaire.

Formulaire

id : formulaire
types : Pratiques et méthodes
mots-clés :
filename : formulaire

On désigne par formulaire, une interface permettant de remplir des champs ou de spécifier des actions à réaliser. Le principe du formulaire est de saisir les données puis les sauvegarder à travers un bouton « Enregistrer / Sauvegarder ».

Fouille de texte

id : fouille de texte
types : Pratiques et méthodes
mots-clés :
filename : fouille_de_texte

Extraction de connaissances à l'aide de mesures statistiques ou de repérage d'unités textuelles dans un ou plusieurs textes. La fouille de texte (text mining) permet ainsi d’extraire les entités nommées.

Framework

id : framework
types : Technologies et familles d’outils
mots-clés :
filename : framework

Un framework propose une infrastructure de développement pour un informaticien afin qu’il puisse créer une application (des lignes de code permettant de réaliser des actions).

Frantext

id : frantext
types : Ressources
mots-clés :
filename : frantext

Frantext est une base de données de textes français. Elle contient principalement des textes littéraires et philosophiques, et quelques textes scientifiques et techniques.

La base de données a été développée à l’ATILF (laboratoire d'Analyse et Traitement Informatique de la Langue Française) dans l'optique de servir de réservoir d'exemples pour le Trésor de la Langue Française (TLF). Actuellement, elle est disponible en ligne. Elle est utilisée, par exemple, par les linguistes comme source d'exemples pour illustrer des faits de langue. Elle permet de faire des recherches simples et complexes sur des formes, des lemmes ou des catégories grammaticales.

Site web : https://www.frantext.fr/

Frantiq

id : frantiq
types : Groupements institutionnels
mots-clés :
filename : frantiq

Frantiq (Fédération et Ressources sur l’Antiquité) a été créée en 1984 et rassemble aujourd’hui une quarantaine d’unités mixtes du CNRS, des services du ministère de la Culture, des musées d’archéologie et des collectivités territoriales et autres acteurs publics.

Elle se donne pour mission de favoriser et faciliter un accès centralisé aux ressources documentaires spécialisées.

La fédération a mis au point plusieurs services à destination des archéologues : un catalogue collectif indexé, le thésaurus PACTOLS, le logiciel libre de gestion de thésaurus Opentheso et le portail Frantiq.

Site web : https://www.frantiq.fr/frantiq/missions/

FRBR

id : frbr
types : Pratiques et méthodes
mots-clés :
filename : frbr

Modèle conceptuel de description bibliographique utilisé en bibliothèque. Il décompose la notice bibliographique comme un ensemble d’informations correspondant à 4 niveaux d’analyse : Item, Manifestation, Expression, Œuvre.

Voir : http://www.bnf.fr/fr/professionnels/modelisation_ontologies/a.modele_FRBR.html

Freeplane

id : freeplane
types : Outils logiciels
mots-clés :
filename : freeplane

Freeplane est un logiciel gratuit de cartes heuristiques, développé sous licence publique générale GNU. Il repose sur le langage de programmation Java, et peut être exécuté localement ou à partir d’un dispositif portable (USB par exemple). Freeplane sert à réaliser des prises de notes, à organiser les idées en les reliant. Les nœuds peuvent contenir du texte, des images, des vidéos, des liens hypertextes, des formules mathématiques écrite en LaTeX, … Les vues sont configurables car les branches peuvent être déplier dynamiquement.

Site web : https://www.freeplane.org/wiki/index.php/Home

Gallica

id : gallica
types : Ressources
mots-clés :
filename : gallica

Bibliothèque numérique de la Bibliothèque nationale de France.

Site web : https://gallica.bnf.fr

Gargantext

id : gargantext
types : Outils logiciels
mots-clés :
filename : gargantext

Gargantext est un logiciel libre et un service web qui permet l’exploration interactive de grands corpus numériques. Il combine l’exploration de texte avancée, l’analyse de réseaux et la visualisation interactive.

Site web : https://iscpif.fr/projects/gargantext/

Gazouilloire

id : gazouilloire
types : Outils logiciels
mots-clés :
filename : gazouilloire

Gazouilloire est un logiciel serveur permettant de maintenir des collectes massives de données Twitter sur le long terme.

Site web : https://medialab.sciencespo.fr/outils/gazouilloire/

GDB GéoDataBase

id : gdb géodatabase
types : Outils logiciels
mots-clés :
filename : gdb

Géodatabase de fichiers ESRI permettant de stocker des tables d'attributs et des ensembles de données vectorielles et/ou matricielles. Elle remplace la géodatabase personnelle MDB en offrant des performances plus élevées et des avantages en termes de stockage et de manipulation.

GED

id : ged
types : Pratiques et méthodes
mots-clés :
filename : ged

La GED (Gestion Electronique des Documents) est un système informatisé permettant l’acquisition, le stockage, le classement, l’indexation, l’archivage des documents et des données dématérialisés. Ce système encourage le travail collaboratif ainsi que l’échange et la diffusion des données au sein d’un réseau, d’une institution, d’une entreprise.

Génétique

id : génétique
types : Pratiques et méthodes
mots-clés :
filename : genetique

Science qui vise à analyser et à éditer tous les états d’un texte.

GEO IP

id : geo ip
types : Outils logiciels
mots-clés :
filename : geo_ip

GEO IP est un outil développé par la Digital Methods Initiative qui permet de traduire des URLs ou des adresses IP en positions géographiques.

Site web : https://tools.digitalmethods.net/beta/geoIP/

GéOInformations

id : géoinformations
types : Ressources
mots-clés :
filename : geoinformations

Espace interministériel de l’information géographique (avec un glossaire de l’information géographique.

Site web : http://www.geoinformations.developpement-durable.gouv.fr/glossaire-de-l-information-geographique-a855.html

GeoJSON

id : geojson
types : Pratiques et méthodes
mots-clés :
filename : geojson

Format d'encodage ouvert conçu pour décrire des données géographiques et y ajouter attributs non spatiaux. Utilisé pour la cartographie Web et l'échange de fichiers, il stocke les données sous forme de texte en notation d'objet JavaScript (JSON).

Géolocalisation

id : géolocalisation
types : Pratiques et méthodes
mots-clés :
filename : geolocalisation

Technique de détermination de la situation géographique précise d’un lieu ou, à un instant donné, d’une personne, d’un véhicule, d’un objet, etc.

Il existe de nombreuses techniques de géolocalisation, parmi lesquelles celles par satellite, par Wi-Fi, par adresse IP, etc. Sur le plan juridique, la géolocalisation fait l’objet d’un encadrement bien spécifique. La CNIL est notamment attentive à ce que cette technologie soit utilisée en conformité avec le respect des données à caractère personnel et de la vie privée. Voir GPS.

Géomatique

id : géomatique
types : Pratiques et méthodes
mots-clés :
filename : geomatique

Le mot « géomatique » vient de la contraction des termes « géographie » et « informatique ». Il s’agit du domaine informatique ayant pour objet la gestion, de façon numérique, de l’information géographique. « Discipline ayant pour objet la gestion des données à référence spatiale [géoréférencées, c.a.d. localisables de façon géographique] et qui fait appel aux sciences et technologies reliées à leur acquisition, leur stockage, leur traitement et leur diffusion. » (Marcel Bergeron, 1992, Vocabulaire de la Géomatique).

Voir SIG.

GeoNames

id : geonames
types : Ressources
mots-clés :
filename : geonames

Référentiel de noms géographiques.

Site web : https://www.geonames.org/

GeoServer

id : geoserver
types : Outils logiciels
mots-clés :
filename : geoserver

Serveur SIG open source qui permet de partager en ligne des données géographiques en mettant en œuvre les protocoles WFS, WMS et WMTS de l'Open Geospatial Consortium.

Site web : https://geoserver.org/

Gephi

id : gephi
types : Outils logiciels
mots-clés :
filename : gephi

Logiciel libre d’analyse et de visualisation de réseaux.

Site web : https://gephi.org/

Gestion des données

id : gestion des données
types : Pratiques et méthodes
mots-clés :
filename : gestion_des_donnees

La gestion des données est l’ensemble des activités mises en œuvre pour faciliter l’exploitation et la sécurisation des données pendant un projet de recherche et leur préservation après la fin du projet.

Si elles n’impliquent pas leur partage, des bonnes pratiques de gestion sont un préalable indispensable à l’ouverture des données et à leur réutilisation (définition issue du site de l'INRAE https://datapartage.inrae.fr/Gerer).

Voir Plan de gestion des données

Git

id : git
types : Outils logiciels
mots-clés :
filename : git

Git est un logiciel de gestion de versions, c’est-à-dire qu’il stocke des fichiers ainsi que leurs versions antérieures en sauvegardant la chronologie de toutes les modifications qu’ils ont subies.

Il s’agit d’un logiciel libre qui fonctionne de façon décentralisée.

Voir GitHub

GitHub

id : github
types : Outils logiciels
mots-clés :
filename : github

GitHub est une plateforme d’hébergement, de développement et de partage de logiciels et codes informatiques.

Différents outils sont associés à GitHub :

Voir Git

Site web : https://github.com

GitLab

id : gitlab
types : Outils logiciels
mots-clés :
filename : gitlab

Le GitLab d’Huma-Num se charge de l’hébergement sécurisé et du partage maîtrisé des fichiers de codes suivant le protocole git.

Ses principales fonctionnalités sont la gestion de versions et de dépôts, l’intégration continue, la gestion de tickets, la génération de sites web.

Site web : https://documentation.huma-num.fr/gitlab/

Google Autocomplete

id : google autocomplete
types : Outils logiciels
mots-clés :
filename : google_autocomplete

Cet outil permet de récupérer les suggestions d’autocomplétion de Google.

L’autocomplétion est la fonctionnalité permettant d’accélérer la saisie des mots-clés dans la barre de recherche en proposant des suggestions de requêtes.

Site web : https://tools.digitalmethods.net/beta/scrapeGoogle/autocomplete.php

Google Bookmarklets

id : google bookmarklets
types : Outils logiciels
mots-clés :
filename : google_bookmarklets

Les Google Bookmarklets sont deux boutons à ajouter aux favoris de son navigateur. Le premier permet, à partir d’une page de résultats Google de basculer sur l’ancienne version du moteur de recherche avec 100 résultats par page. Le second permet de télécharger ces résultats au format CSV ou de les stocker dans la mémoire du navigateur.

Site web : https://medialab.sciencespo.fr/outils/google-bookmarklets/

Google Play Store Scraper

id : google play store scraper
types : Outils logiciels
mots-clés :
filename : google_play_store_scraper

Google Play Store Scraper est un outil permettant d'extraire les informations détaillées relatives à une application, de collecter les applications qui lui sont liées, de récupérer les permissions des applications ainsi que la liste des applications pour un mot-clé donné.

Voir aussi : Web scraping

Site web : https://wiki.digitalmethods.net/Dmi/ToolGooglePlayStoreScraper

GPKG GéoPackage

id : gpkg géopackage
types : Outils logiciels
mots-clés :
filename : gpkg

Format de données géographiques non-propriétaire, GeoPackage est construit comme une base de données SQLite autonome. Défini par l'Open Geospatial Consortium et publié en 2014, c'est le format de données par défaut du logiciel libre QGIS.

GPS

id : gps
types : Pratiques et méthodes
mots-clés :
filename : gps

GPS (Global Positioning System) : système permettant de déterminer les coordonnées géographiques d’un point du globe à partir de l’observation des signaux radio émis par des satellites en orbite autour de la terre.

En fonction de la méthode d’utilisation, du nombre et du type de récepteurs exploités, la précision obtenue sur les coordonnées varie de 100 mètres à quelques centimètres. Ces satellites ont été mis en orbite par les États-Unis d’Amérique.

GPX GPS eXchange format

id : gpx gps exchange format
types : Pratiques et méthodes
mots-clés :
filename : gpx

Format d'échange basé sur un schéma XML dédié aux données acquises par GPS.

Graph Recipes

id : graph recipes
types : Outils logiciels
mots-clés :
filename : graph_recipes

Graph Recipes est une application web au croisement de l’exploration visuelle et du scripting. Elle permet d’importer des données réseaux au format GEXF pour en produire des statistiques et/ou des visualisations. L’utilisateur peut également écrire en Javascript ses propres scripts de traitement de réseaux.

Site web : https://medialab.github.io/graph-recipes/#!/upload

Graphology

id : graphology
types : Outils logiciels
mots-clés :
filename : graphology

Graphology est une librairie javascript implémentant les structures de données nécessaires à la représentation de nombreux types de réseaux ainsi que des algorithmes utiles en théorie des réseaux.

Site web : https://medialab.sciencespo.fr/outils/graphology/

GrassGIS

id : grassgis
types : Outils logiciels
mots-clés :
filename : grassgis

Suite logicielle libre de Système d'Information Géographique bureautique en développement continu depuis 1982, basée sur une architecture modulaire. Ses centaines de modules permettent de traiter efficacement tous types de données, sans offrir d'interface de conception cartographique.

Site web : https://grass.osgeo.org/

Hackathon

id : hackathon
types : Pratiques et méthodes
mots-clés :
filename : hackathon

Contraction des termes « hack » (pirater) et « marathon », un hackathon désigne le regroupement de plusieurs informaticiens sur une courte période - quelques jours - dont le but est de collaborer à la création de programmes informatiques innovants.

HAL

id : hal
types : Ressources
mots-clés :
filename : hal

L’archive ouverte pluridisciplinaire HAL est destinée au dépôt et à la diffusion d'articles scientifiques de niveau recherche, publiés ou non, et de thèses, émanant des établissements d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Voir Science ouverte).

Site web : https://hal.archives-ouvertes.fr

Handle

id : handle
types : Pratiques et méthodes
mots-clés :
filename : handle

Handle est un identifiant attribué à une ressource par Isidore lors de son opération de moissonnage.

Harvester

id : harvester
types : Outils logiciels
mots-clés :
filename : harvester

Harvester extrait les URLs d’un texte, d’un code source, des résultats d’un moteur de recherche. Il fournit une liste propre d’URLs.

Site web : https://tools.digitalmethods.net/beta/harvestUrls/

HeatGraph

id : heatgraph
types : Outils logiciels
mots-clés :
filename : heatgraph

HeatGraph est un outil de visualisation permettant de créer des cartes de chaleur à partir de la densité des noeuds dans un réseau spatialisé.

Site web : https://medialab.github.io/heatgraph/

Heurist

id : heurist
types : Outils logiciels
mots-clés :
filename : heurist

Heurist est un logiciel open source de gestion de bases de données, conçu spécifiquement pour les chercheurs en Sciences Humaines.

Heurist anime des services gratuits sur le web, qui permettent aux chercheurs de créer et de gérer eux-mêmes, avec un simple navigateur web, des bases de données hétérogènes et richement connectées, sans installation ni programmation.

Une très large gamme de fonctions permet l'importation, l'analyse, la visualisation, le partage et l'archivage de données. Une fonction CMS génère des sites web intégrés directement dans la base, pouvant incorporer recherches facetées, listings, cartes, lignes de temps, diagrammes de réseau, etc. Heurist est également multi-utilisateur (accès contrôlé par groupes de travail au niveau de chaque enregistrement).

Ce logiciel est développé depuis 2005 par l'Université de Sydney (Australie).

Site web (description) : http://heuristnetwork.org/

Service : https://heurist.huma-num.fr/

History Flow

id : history flow
types : Outils logiciels
mots-clés :
filename : history_flow

History Flow est un outil de visualisation des documents dynamiques et évolutifs et de visualisation des interactions de plusieurs auteurs. Il est notamment utilisé pour visualiser l’historique d’évolution des pages wikipédia.

Site web : https://wiki.digitalmethods.net/Dmi/HistoryFlowHowTo

HTML

id : html
types : Pratiques et méthodes
mots-clés :
filename : html

Le HTML (HyperText Markup Language) est le langage dans lequel sont écrites les pages web. C’est un encodage formel, permettant d’écrire le « code source » d’une page structurée (c'est-à-dire avec une hiérarchie de titres) qui contient divers types d’éléments : texte, liens hypertexte, images, formulaires, ressources multimedia…).

La plupart des navigateurs permettent de voir la page web (c-à-d le code HTML interprété) mais aussi le code HTML sous-jacent (en général il existe une option qui permet de visualiser le « code source »).

HTR

id : htr
types : Technologies et familles d’outils
mots-clés :
filename : htr

Le HTR (Handwritten Text Recognition) est une technologie de reconnaissance automatique d’écriture manuscrite.

Voir Transkribus, eScriptorium

Hub de données

id : hub de données
types : Pratiques et méthodes
mots-clés :
filename : hub_de_donnees

Un hub de données est une plateforme de stockage virtuel regroupant les données émanant de plusieurs systèmes d’informations. En centralisant les données en un seul endroit, le hub de données en permet une utilisation plus aisée et plus sécurisée.

Grâce à cette plateforme, les données peuvent également communiquer entre elles dans plusieurs directions.

Huma-Num

id : huma-num
types : Groupements institutionnels
mots-clés :
filename : huma-num

Très grande infrastructure de recherche consacrée au développement du numérique au sein des Sciences Humaines et Sociales.

Elle propose de nombreux services et outils aux acteurs des SHS en France, tels que Nakala, Isidore, ShareDocs, Stylo, GitLab, Huma-Num Box, Kanboard, Opentheso, Voyant Tools.

Site web : https://www.huma-num.fr/

Huma-Num Box

id : huma-num box
types : Outils logiciels
mots-clés :
filename : huma-num_box

La Huma-Num Box est un dispositif de stockage sécurisé et de gestion de jeux de données volumineux. Elle est destinée aux données tièdes et froides c’est-à-dire que peu d’accès en écriture et en lecture seront faites durant la vie de ces données qui revêtent néanmoins une valeur patrimoniale. Le dispositif ne gère pas l’association entre les données et leurs métadonnées et seuls des fichiers (et non des bases de données) peuvent être stockés sur Huma-Num Box.

Site web : https://documentation.huma-num.fr/humanum-box/

Humanistica

id : humanistica
types : Groupements institutionnels
mots-clés :
filename : humanistica

Humanistica est l’association francophone des humanités numériques/digitales. Elle cherche à réunir autour d’actions communes toutes les personnes intéressées par le mouvement des digital humanities telles qu’elles peuvent s’exercer et se penser en langue française. L'association rassemble, représente et anime la communauté des acteurs de la recherche et de l’enseignement supérieur gravitant autour des humanités numériques. L'association porte également des projets et héberge des groupes de travail. La revue Humanités numériques émane de l'association.

Site web : http://www.humanisti.ca/presentation/

Hyperbase

id : hyperbase
types : Outils logiciels
mots-clés :
filename : hyperbase

Hyperbase est un logiciel et une plateforme d’analyse textométrique qui combine deux types de fonctions, documentaires et statistiques, qui permettent de décrire, caractériser, classer et interpréter les textes.

Hyperbase est notamment utilisé pour détecter les thématiques ou isotopies des discours, grâce au calcul des univers lexicaux d’un mot-pole ou le traitement généralisé des cooccurrences.

Site web : <http://hyperbase.unice.fr >

Hyphe

id : hyphe
types : Outils logiciels
mots-clés :
filename : hyphe

Hyphe est un logiciel libre de crawler web permettant de créer des corpus constitués de pages web et des liens hypertextes existant entre elles sur un sujet spécifique.

Ces pages peuvent être regroupées en « webentités » et le logiciel permet également de visualiser des réseaux de relations.

Site web : https://hyphe.medialab.sciences-po.fr

Hyphe Browser

id : hyphe browser
types : Outils logiciels
mots-clés :
filename : hyphe_browser

Hyphe Browser est une application à télécharger fournissant un navigateur web basé sur le moteur Chrome et permettant de naviguer sur le web tout en étant connecté à Hyphe. Cet outil permet de constituer un corpus web tout en visualisant les pages web des sites ce qui en facilite la sélection et la catégorisation.

Site web : https://medialab.sciencespo.fr/outils/hyphe-browser/

Hypotheses.org

id : hypotheses.org
types : Outils logiciels, Ressources
mots-clés :
filename : hypotheses.org

Hypothèses est une plateforme web faisant partie du portail OpenEdition et qui regroupe des milliers de blogs (ou carnets) dans tous les domaines des sciences humaines et sociales. Ces blogs sont librement accessibles.

Site web : https://fr.hypotheses.org

IDEAS

id : ideas
types : Ressources
mots-clés :
filename : ideas

IDEAS est une base de données bibliographiques spécialisée en économie et développée par RePec.

Site web : https://ideas.repec.org

Identifiant

id : identifiant
types : Pratiques et méthodes
mots-clés :
filename : identifiant

En informatique, il s’agit d’un ensemble de caractères ou de symboles permettant d’identifier une entité précise au sein d’un type d’entité. L’identifiant est en principe unique pour chaque objet.

Il existe différents types d’identifiants, le plus commun étant l’identifiant utilisateur qui permet, dans un système multi-utilisateurs, à une personne de se connecter à son compte personnel (pour accéder à ses e-mails par exemple).

Dans ce cadre, l’identifiant est souvent composé d’un nom d’utilisateur et d’un mot de passe. Il existe également des identifiants pour identifier des objets informatiques au sein d’un langage informatique ou d’une base de données par exemple.

Voir Login, DOI, ORCID, ARK, PIDOPIDoR dans OPIDoR

Identifiant pérenne

id : identifiant pérenne
types : Pratiques et méthodes
mots-clés :
filename : identifiant_perenne

Un identifiant pérenne est un code alphanumérique associé à un objet ou une ressource de façon permanente. Il ne changera pas si l’objet est renommé et déplacé. Il est gérable et disponible à long terme.

Un identifiant pérenne peut également être attribué à une personne, c’est le cas de l’IdRef ou encore d’ORCID.

Voir DOI, ARK, PIDOPIDoR dans OPIDoR

IdRef

id : idref
types : Outils logiciels, Ressources
mots-clés :
filename : idref

Identifiants et Référentiels pour l’Enseignement supérieure et la Recherche. Application Web développée et maintenue par l’ABES (Agence bibliographique de l’enseignement supérieur, www.abes.fr/) qui permet, à des structures ou des usagers, d’interroger, consulter, créer et enrichir des notices d’autorité (https://www.idref.fr). Les catalogues Calames, SUDOC, theses.fr ou Persée l’utilisent pour leurs notices d’autorité.

Voir http://documentation.abes.fr/aideidrefutilisateur/index.html

IIIF

id : iiif
types : Groupements institutionnels, Ressources
mots-clés :
filename : iiif

Le consortium IIIF (International Image Interoperability Framework) est né du constat que les bibliothèques numériques se sont développées sans concertation technique, notamment pour la production des images, ce qui rend aujourd’hui difficile leur partage. Si les protocoles d’échange des données (OAI-PMH par exemple) sont aujourd’hui très développés, rien n’existait pour les images.

L’objectif du consortium est de développer un cadre d’interopérabilité pour la diffusion d’images haute résolution grâce à des API développées par le consortium. Une application possible serait de consulter sur une même interface, des images numérisées de plusieurs bibliothèques numériques. Le visualiseur Mirador a été développé à cette fin.

Sites web : < https://iiif.io>, https://doc.biblissima.fr/iiif

Voir aussi : https://doc.biblissima.fr/

Image matricielle

id : image matricielle
types : Pratiques et méthodes
mots-clés :
filename : image_matricielle

Une image matricielle est une image numérique constituée d’un raster, qui est une matrice faite de cases, plus généralement appelées pixels. Chaque case contient une couleur codée par un nombre. La qualité d’une image matricielle dépend de la profondeur de la couleur par pixel (calculée en bits) ainsi que de la hauteur et la largeur de l’image (calculée en pixel).

Ce type d’image convient à la numérisation d’images complexes comme les photographies. Toutefois, ce sont des images qui pèsent lourd et prennent donc plus de place en mémoire. De plus, les images matricielles supportent mal les processus de redimensionnement (agrandissement, rétrécissement) qui se traduisent par une perte de qualité.

Voir Image vectorielle

Image numérique

id : image numérique
types : Pratiques et méthodes
mots-clés :
filename : image_numerique

Image acquise, créée, traitée et stockée sous forme binaire, c'est-à-dire acquise par des convertisseurs analogiques-numériques situés dans des dispositifs comme les scanners, les appareils photo, etc.

Les formats d’images numériques les plus fréquents sont le .JPG (compression destructrice, poids de l’image réduit), le .GIF (peut être animé, format léger), le .PNG (compression sans perte, bon compromis), le .PDF (possibilité de contenir des images en pixels et des données vectorielles, conserve la mise en page), le .TIFF (utilisé par les imprimeurs).

Les formats recommandés :

  • Images à mettre sur le web : .jpg

  • Si besoin d’une compression non destructrice : .png pour informatique et .tiff pour l’impression

  • Pour un CV, mémoire, ou autres documents : .pdf

Image Scraper

id : image scraper
types : Outils logiciels
mots-clés :
filename : image_scraper

Image Scraper récupère les images d’une page web donnée. Il suffit de saisir l’URL de la page en question dans Image Scraper pour extraire tous les fichiers images.

Voir aussi : Web scraping

Site web : https://tools.digitalmethods.net/beta/imagesDeep/

Image vectorielle

id : image vectorielle
types : Pratiques et méthodes
mots-clés :
filename : image_vectorielle

Une image vectorielle est une image numérique constituée à partir de formules mathématiques. En effet, l’image vectorielle est composée de formes (ligne, ellipse, polygone, etc.) qui possèdent des caractéristiques telles que hauteur, largeur, rayon, longueur, couleur. Ces formes sont elles-mêmes composées de vecteurs (d’où « vectorielle ») dont chacun possède une norme, une direction et un sens traduits par des formules mathématiques. Ainsi, l’intérêt de ce type d’image réside dans le poids plus léger et dans l’absence de perte de qualité en cas de redimensionnement puisque les formules mathématiques peuvent être re-calculées.

L’image vectorielle peut être générée automatiquement et certaines de ses formes animées. Du point de vue de la couleur, chaque forme contient une couleur ou son dégradé. Les images vectorielles ne peuvent pas être utilisées pour la numérisation d’images complexes. D’ailleurs, il est nécessaire d’employer des logiciels dédiés pour créer ce type d’images. Le format standard est le SVG. L’image vectorielle sert notamment à l’animation 2D ou à la cartographie quand les informations géographiques sont référencées dans un système de coordonnées géographiques connus.

Voir Image matricielle

IMPACT

id : impact
types : Outils logiciels
mots-clés :
filename : impact

IMPACT est un outil de consultation, d’annotation et de transcription de sources audio-visuelles développé par l’Université de Lausanne.

Site web : https://wp.unil.ch/impact

Indexation

id : indexation
types : Pratiques et méthodes
mots-clés :
filename : indexation

L’indexation est l’opération qui consiste à analyser une ressource documentaire de façon à décrire le contenu de cette ressource dans sa notice bibliographique, au moyen d’un indice de classification ou de mots-clés.

Cette opération permet de rendre la ressource visible au sein du catalogue et d’en faciliter la recherche et l’accès.

Voir RAMEAU

Information géographique

id : information géographique
types : Pratiques et méthodes
mots-clés :
filename : information_geographique

Information qui est reliée à une localisation sur la Terre, exprimée par rapport à un système de référence.

Une information géographique est une information que l’on peut situer sur un plan, une carte, directement par des coordonnées ou indirectement par relation à une autre information géographique. C’est en particulier, l’information sur les objets ou phénomènes naturels, les ressources culturelles, humaines ou économiques.

Infrastructure de recherche

id : infrastructure de recherche
types : Groupements institutionnels
mots-clés :
filename : infrastructure_de_recherche

Une infrastructure de recherche se caractérise par des installations, ressources ou services essentiels, uniques et d’envergure nationale voire européenne ou internationale, dont l’objet est de conduire et soutenir une activité de recherche d’excellence. Elle comprend des équipements scientifiques, des ressources telles que des collections, archives et données scientifiques, des services et infrastructures numériques, et tout autre outil essentiel pour soutenir une recherche et des innovations au meilleur niveau.

Source : https://www.enseignementsup-recherche.gouv.fr/fr/la-feuille-de-route-nationale-des-infrastructures-de-recherche-2021-84056

InoReader

id : inoreader
types : Outils logiciels
mots-clés :
filename : inoreader

InoReader est une plateforme en ligne d’agrégation de contenus qui permet notamment la gestion des abonnements aux flux RSS.

Voir aussi Feedly, Netvibes

Site web : https://www.inoreader.com/language/french

Inrae

id : inrae
types : Ressources
mots-clés :
filename : inrae

Site de gestion et de partage des données scientifiques.

Site web : https://data.inrae.fr

Instapaper

id : instapaper
types : Outils logiciels
mots-clés :
filename : instapaper

Instapaper est un outil de veille permettant d’agréger, sauvegarder, annoter des pages web sur une interface personnelle.

Voir Pocket, Evernote

Site web : https://www.instapaper.com

Intelligence artificielle

id : intelligence artificielle
types : Pratiques et méthodes
mots-clés :
filename : intelligence_artificielle

L’intelligence artificielle (IA, ou « AI » en anglais, pour Artificial Intelligence) est définie par l’un de ses créateurs comme « la construction de programmes informatiques qui s’adonnent à des tâches qui sont, pour l’instant, accomplies de façon plus satisfaisante par des êtres humains car elles demandent des processus mentaux de haut niveau tels que : l’apprentissage perceptuel, l’organisation de la mémoire et le raisonnement critique » (M. Lee Minsky).

Il s’agit en quelque sorte de l’utilisation des ordinateurs ou de processus électroniques dans le but d’imiter le comportement humain, dans les domaines du raisonnement (jeux ou pratique des mathématiques), de la compréhension des langues naturelles, dans la commande d’un robot, etc.

Interface

id : interface
types : Pratiques et méthodes
mots-clés :
filename : interface

Jonction entre deux matériels ou logiciels leur permettant d’échanger des informations par l’adoption de règles communes ; module matériel ou logiciel permettant la communication d’un système avec l’extérieur.

Internet Archive Wayback Machine Network per Year

id : internet archive wayback machine network per year
types : Outils logiciels
mots-clés :
filename : internet_archive_wayback_machine_network_per_year

Cet outil permet de récupérer les versions archivées d’un ensemble d’URLs et il produit un fichier de réseau à partir de ces liens.

Site web : https://tools.digitalmethods.net/beta/waybackNetworkPerYear/

Interopérabilité

id : interopérabilité
types : Pratiques et méthodes
mots-clés :
filename : interoperabilite

Possibilité de communication entre deux ou plusieurs systèmes, appareils ou éléments informatiques.

Voir Dublin Core ; HTML ; IIIF, OAI-PMH

Iramuteq

id : iramuteq
types : Outils logiciels
mots-clés :
filename : iramuteq

Iramuteq est un logiciel libre développé en R. Il offre une interface permettant de créer des Analyses Multidimensionnelles de Textes et de Questionnaires.

Site web : http://www.iramuteq.org/

IrcamCorpusTools

id : ircamcorpustools
types : Outils logiciels
mots-clés :
filename : ircamcorpustools

IrcamCorpusTools est une plateforme permettant la création, l’analyse et l’exploitation de corpus oraux. Elle permet également la gestion de divers formats.

Site web : http://articles.ircam.fr/textes/Beller09b/index.pdf

IRCOM

id : ircom
types : Groupements institutionnels, Ressources
mots-clés :
filename : ircom

Le Consortium Corpus Oraux et Multimodaux a été labellisé en août 2011 par Huma-Num, jusqu'en décembre 2015. Il a pour missions principales :

  • d’organiser et d’accompagner le développement de corpus (ensemble cohérent de ressources - sans nécessairement impliquer un "gros" volume) oraux et multimodaux en linguistique en aidant les chercheurs à s’approprier les outils nécessaires et à développer des standards communs de référence ;
  • d’aider à développer la valorisation, la visibilité et l'accessibilité des fonds existants ;
  • d’aider à améliorer leur mise à disposition et leur interopérabilité afin d’intégrer les réseaux internationaux (notamment CLARIN) ;
  • d’intégrer la communauté des producteurs et utilisateurs de corpus oraux et multimodaux dans ces pratiques et réflexions.

Ceci passe notamment par l’organisation d’une concertation large sur les standards et formats de l’archivage et du traitement numérique, de sessions de formations et de définition de bonnes pratiques. Des groupes de travail ont été mis en place.

Site web : IRCOM

ISBD

id : isbd
types : Pratiques et méthodes
mots-clés :
filename : isbd

L’ISBD (International Standard Bibliographic Description) est un ensemble de règles validées au niveau international qui déterminent la façon dont doit s’effectuer la description de tous de types de ressources documentaires publiées. Il est élaboré par l’IFLA (International Federation of Library Associations and Institutions).

L’ISBD définit tous les éléments de description bibliographique d’une notice (titre, auteur, éditeur, date, etc.) ce qui en garantit la rigueur, la fiabilité et en facilite la communicabilité entre bibliothèques.

ISBN

id : isbn
types : Pratiques et méthodes
mots-clés :
filename : isbn

L’ISBN (International Standard Book Number) est un numéro international normalisé permettant l’identification d’un livre dans une édition donnée. Ce numéro doit figurer sur tous les exemplaires d’une même œuvre dans une même édition.

L’ISBN a été conçu pour simplifier le traitement informatisé des livres : les libraires peuvent passer des commandes standardisées, les distributeurs ont le même code pour traiter les commandes et les retours, les différentes opérations de gestion dans les bibliothèques et centres de documentation sont également facilitées. Par ailleurs, le caractère international de cette numérotation constitue, à l’étranger également, une référence unique pour tous les professionnels du livre.

En France, c’est l’Agence francophone pour la numérotation internationale du livre (AFNIL) qui attribue les ISBN. Ex. ISBN 978-2-07-078677-0.

Voir : Définition sur le site de l'AFNIL

Isidore

id : isidore
types : Ressources
mots-clés :
filename : isidore

Isidore est un moteur de recherche permettant l’accès aux données numériques des sciences humaines et sociales. Il collecte, enrichit et fournit un signalement et un accès unifiés aux documents et aux données numériques en libre accès des SHS.

Site web : https://www.rechercheisidore.fr

Isilex

id : isilex
types : Outils logiciels
mots-clés :
filename : isilex

Isilex est à la fois un serveur web, un CMS et un gestionnaire de base de données XML ainsi qu’un gestionnaire privé de réseau social. Il permet de publier et de modifier des données, d’intégrer des contenus multimédias et des fiches liées.

Plus précisément, Isilex permet de créer un corpus seul ou en groupe et de le publier sur le web, de créer des groupes de rédacteurs par tâches de projets, d’exporter en .odt ou en .PDF des données (par fiche ou par lot), de marquer en un clic toutes les occurrences d’un mot dans une fiche, de modifier les pages web du site en un clic, de modifier les données de la base XML en un clic, de demander la validation des données par le modérateur du projet, de modifier la configuration du site, de gérer un site bilingue, de créer un forum, de gérer un réseau social interne

Site web : https://isilex.github.io/easy-xml-fr/

ISO

id : iso
types : Groupements institutionnels, Pratiques et méthodes
mots-clés :
filename : iso

L’ISO (International Organisation for Standardization) est une organisation non gouvernementale créée en 1947 constituée de 164 pays. L’ISO forme ainsi la fédération mondiale des organismes nationaux de normalisation. La France est ainsi représentée par l’AFNOR au sein de l’ISO.

Les travaux de cette organisation se traduisent par des accords internationaux qui sont publiés sous la forme de normes internationales. Elle a donc pour missions d’encourager le développement de la normalisation dans le but de favoriser entre les nations, les échanges de biens et de services ainsi que la coopération dans les domaines intellectuels, économiques, scientifiques et techniques.

ISSN

id : issn
types : Pratiques et méthodes
mots-clés :
filename : issn

ISSN (International Standard Serial Number) : identifiant bibliographique unique et standardisé qui s’applique aux publications en série (revues, magazines, journaux, bulletins, etc.), en cours de parution ou ayant cessé de paraître, quel qu’en soit le support, gratuites ou non, en accès libre ou non.

Issue Dramaturg

id : issue dramaturg
types : Outils logiciels
mots-clés :
filename : issue_dramaturg

Pour utiliser cet outil, il faut entrer jusqu’à trois URLs et un mot-clé. Issue Dramaturg va alors interroger Google avec ce mot-clé et récupérer le classement (Pagerank) des URLs à travers le temps. Le résultat apparaît sous forme de graphique.

Site web : http://www.issuescraper.net/index.php?pageid=3

Issue Geographer

id : issue geographer
types : Outils logiciels
mots-clés :
filename : issue_geographer

Issue Geographer géolocalise les organisations d’une carte IssueCrawler et fournit une visualisation de l’implantation de ces organisations sur une carte géographique.

Site web : https://tools.digitalmethods.net/zkm/index.php

IssueCrawler

id : issuecrawler
types : Outils logiciels
mots-clés :
filename : issuecrawler

IssueCrawler permet à partir de plusieurs URLs de départ et de plusieurs mots-clés ou thématiques de construire une représentation graphique des acteurs de la controverse ou de la thématique.

Voir Compare Networks Over Time

Site web : https://www.issuecrawler.net

Documentation en français : http://www.govcom.org/GuideIssueCrawler2005-2006.pdf

ISTEX

id : istex
types : Ressources
mots-clés :
filename : istex

ISTEX est une plateforme qui offre à l’ensemble des membres de la communauté de l’enseignement supérieur et de la recherche française un accès en ligne aux collections rétrospectives de la littérature scientifique dans toutes les disciplines. Istex met en oeuvre une politique d’achat centralisés d’archives scientifiques et de collections sous la forme de licences nationales.

Un budget de 54 millions d’euros a été consacré à des acquisitions définitives et pérennes de documents électroniques en texte intégral : livres électroniques, revues, corpus de textes, etc. Istex fournit également des services aux chercheurs leur permettant d’optimiser l’exploitation de ces corpus grâce à des outils de fouille de corpus (TDM) et de valorisation interactive.

Voir Fouille de corpus

Site web : https://www.istex.fr

ITunes App Store Scraper

id : itunes app store scraper
types : Outils logiciels
mots-clés :
filename : itunes_app_store_scraper

Cet outil permet d’extraire les détails relatifs à une application, de collecter les applications liées et de récupérer une liste d’applications pour un mot-clé donné.

Voir aussi : Web scraping

Site web : https://wiki.digitalmethods.net/Dmi/TooliTunesAppStoreScraper

Java

id : java
types : Pratiques et méthodes
mots-clés :
filename : java

Java est un langage de programmation informatique orienté objet créé en 1995. Il permet d’écrire des logiciels qui sont facilement portés par différents systèmes d’exploitation (Windows, MacOS, GNU/Linux, UNIX) sans qu’il soit nécessaire d’apporter beaucoup de modifications selon les systèmes.

Java est donc un langage informatique mais aussi la plateforme qui garantit la portabilité des logiciels développés en langage Java.

JournalTOCs

id : journaltocs
types : Outils logiciels
mots-clés :
filename : journaltocs

JournalTOCs est un outil de veille sur les sommaires de revues scientifiques. Il permet d’importer les flux RSS des sommaires de plus de 20 000 revues, de suivre les sommaires de plusieurs revues en créant un compte, d’exporter plusieurs sommaires via un fichier OPML à importer dans Netvibes.

Site web : https://www.journaltocs.ac.uk/index.php

JPG/JPEG

id : jpg/jpeg
types : Pratiques et méthodes
mots-clés :
filename : jpg_jpeg

JPEG (Joint Photographic Experts Group) : format standardisé d’images numériques qui permet une visualisation dans la plupart des logiciels d’images ainsi que sur les navigateurs internet. C’est le format image par excellence pour internet.

Ce format ouvert et libre est associé à une méthode de compression avec pertes qui permet de diffuser des images au moindre coût taille/qualité. Mais la perte d’informations due à la compression est irréversible. Si la compression est trop forte, l’image s’affichera dans une qualité médiocre, voire de façon pixellisée. On parle aussi d’« image brûlée ».

Les préconisations sont de numériser dans des formats non compressés et de haute qualité (TIFF généralement) puis de faire une copie JPEG pour la visualisation. Il existe désormais un nouveau format JPEG : le JPEG 2000 dont la méthode de compression est nettement moins destructive. À ratio équivalent, la compression JPEG 2000 est de meilleure qualité. Le JPEG 2000 peut également être utilisé sans compression, ce qui le rend très intéressant en termes de taille/qualité, notamment pour des fichiers de haute qualité. La BnF l’a adopté comme format de numérisation haute résolution et d’archivage pérenne.

JSON

id : json
types : Pratiques et méthodes
mots-clés :
filename : json

JSON (JavaScript Object Notation) est un format d'échange de données structurées inspiré du langage objet.

L'échange se fait par transmission de chaînes de caractères (donc faciles à écrire et à lire par des humains).

JSON-LD JavaScript Object Notation for Linked Data

id : json-ld javascript object notation for linked data
types : Technologies et familles d’outils
mots-clés :
filename : json-ld

Le JSON-LD (JavaScript Object Notation for Linked Data) est une méthode d’intégration de données structurées sur le web, basée sur le format JSON. Il fait partie des recommandations du W3C.

Site web : https://json-ld.org/

Jupyter

id : jupyter
types : Groupements institutionnels
mots-clés :
filename : jupyter

Jupyter est un projet et une communauté dont l'objectif est de développer des logiciels open source, des standards ouverts et des services pour l'informatique interactive à travers des dizaines de langages de programmation.

Le nom du projet Jupyter fait référence aux trois principaux langages de programmation pris en charge par Jupyter, à savoir Julia, Python et R, et est également un hommage aux carnets de Galilée qui enregistraient la découverte des lunes de Jupiter.

Le projet Jupyter a développé et soutenu les produits informatiques interactifs Jupyter Notebook, JupyterHub et JupyterLab. Jupyter est un projet sponsorisé fiscalement par NumFOCUS.

Site web : https://jupyter.org/

Conférences ou tutoriels :

https://www.youtube.com/watch?v=NzlAUmj5fkg

https://github.com/quinnanya/dh-jupyter

https://digitalhumanitiesnow.org/2019/12/introduction-to-jupyter-notebooks/

https://www.cdh.cam.ac.uk/events/first-steps-coding-jupyter-notebooks

https://curriculum.dhinstitutes.org/workshops/text-analysis/

Jupyter Book

id : jupyter book
types : Outils logiciels
mots-clés :
filename : jupyter_book

Jupyter Book est un outil open source permettant de créer des documents PDF, des documents LaTeX ou de publier un site web à partir d’une combinaison de différents types de fichiers tels que les Jupyter Notebooks et les fichiers Markdown.

Cet outil permet de faciliter la publication d’articles scientifiques ou la publication de sites internet.

Site web : https://jupyterbook.org/en/stable/intro.html

Tutoriel : https://www.youtube.com/watch?v=wuP54pQpK00

Kanboard

id : kanboard
types : Outils logiciels
mots-clés :
filename : kanboard

Kanboard est un logiciel de gestion de projet collaboratif qui peut également être employé comme mur collaboratif. Il utilise la méthode Kanban. Il permet la mise à jour en temps réel entre plusieurs utilisateurs, l’administration et la personnalisation des projets (couleurs, tableaux), la gestion des tâches et des sous-tâches, la classification des éléments par couleur et catégorie, l’attribution des tâches, la définition des échéances, l’importation de pièces-jointes, l’exportation des projets, la définition des autorisations d’accès, la recherche et le filtrage.

Site web : https://kanboard.org

Khartis

id : khartis
types : Outils logiciels
mots-clés :
filename : khartis

Outil de cartographie en ligne, développé par Sciences Po, pour créer simplement des cartes thématiques.

Site web : https://www.sciencespo.fr/cartographie/khartis/

KML/KMZ Keyhole Markup Language

id : kml/kmz keyhole markup language
types : Pratiques et méthodes
mots-clés :
filename : kml_kmz

Langage basé sur un schéma XML pour l'affichage des données géographiques. Principalement utilisé par Google Earth, il est devenu une norme internationale de l'Open Geospatial Consortium en 2008.

Langage de balisage

id : langage de balisage
types : Pratiques et méthodes
mots-clés :
filename : langage_de_balisage

En informatique, les langages de balisage représentent une classe de langages spécialisés dans l'enrichissement d'information textuelle. Ils utilisent des balises, unités syntaxiques délimitant une séquence de caractères ou marquant une position précise à l'intérieur d'un flux de caractères (par exemple un fichier texte).

L'inclusion de balises permet de transférer à la fois la structure du document et son contenu. Cette structure est compréhensible par un programme informatique, ce qui permet un traitement automatisé du contenu.

Language Detection

id : language detection
types : Outils logiciels
mots-clés :
filename : language_detection

Language Detection permet de détecter les langues d’une série d’URLs. Les mille premiers caractères de la page web sont extraits ce qui permet de détecter la langue dans laquelle la page est écrite.

Site web : https://tools.digitalmethods.net/beta/text_cat/

LaTeX

id : latex
types : Outils logiciels
mots-clés :
filename : latex

LaTeX est un langage et un système de composition de documents de haute qualité. Il s’agit d’une collection de macro-commandes destinés à faciliter l’utilisation du « processeur de texte » TeX de Donald Knuth. Il comprend des fonctionnalités conçues pour la production de documents techniques et scientifiques. LaTeX est le standard de facto pour la communication et la publication de documents scientifiques. LaTeX est disponible en tant que logiciel libre.

Site web : <https://www.latex-project.org/ https://www.latex-project.org/help/documentation/>

Le Trameur

id : le trameur
types : Outils logiciels
mots-clés :
filename : le_trameur

Le Trameur est un logiciel d'analyse textométrique. Il dispose d'une version en ligne iTrameur qui reprend en partie les fonctionnalités du Trameur.

Site web : http://www.tal.univ-paris3.fr/trameur

Leaflet

id : leaflet
types : Outils logiciels
mots-clés :
filename : leaflet

Bibliothèque javascript open source de cartographie développée à partir de 2011. Elle est plus légère et plus simple qu'OpenLayers, mais avec moins de possibilités. Elle dispose d'une importante communauté de développeurs et de nombreux plugins existent pour la compléter.

Documentation en anglais : https://leafletjs.com/.

Exemples de tutoriels en français :

Lexico 5

id : lexico 5
types : Outils logiciels
mots-clés :
filename : lexico_5

Lexico 5 est un logiciel d'analyse textométrique.

Site web : http://www.lexi-co.com

Lexicoscope

id : lexicoscope
types : Outils logiciels
mots-clés :
filename : lexicoscope

Lexicoscope est une interface web d’exploration de corpus textuels. Il permet d’explorer l’environnement lexicosyntaxique des mots du corpus. Il s’agit d’un outil spécialement dédié à l’analyse des contextes et des cooccurrences.

Il est possible pour l’utilisateur de créer des corpus personnels à partir des corpus préexistants ou de télécharger et traiter leurs propres corpus.

Site web : http://phraseotext.univ-grenoble-alpes.fr/lexicoscope_2.0/

Librairie

id : librairie
types : Pratiques et méthodes
mots-clés :
filename : librairie

Librairie (Library) / bibliothèque logicielle ou de programmes : ensemble de fonctions utilitaires, regroupées et mises à disposition sous forme de routines ou modules préprogrammés afin de pouvoir être utilisées sans avoir à les réécrire.

Licence libre

id : licence libre
types : Pratiques et méthodes
mots-clés :
filename : licence_libre

Un auteur peut décider de placer son œuvre sous licence libre, c’est-à-dire qu’il donne l’autorisation gratuite, à tous et par avance, d’utiliser son œuvre dans les conditions fixées dans la licence. Il existe plusieurs standards de licences libres (par exemple, pour les logiciels, les licences CeCILL, GNU GPL).

Pour les créations, il existe les licences en Creative Commons (CC) ou encore Art Libre. Par exemple, les licences CC permettent à l’auteur, par le biais de variantes, d’indiquer aux utilisateurs de quelles libertés ils disposent sur l’œuvre et quelles sont leurs obligations. Les 6 licences CC type autorisent toujours la libre diffusion de l’œuvre, mais peuvent interdire l’utilisation commerciale (NC) et les modifications (ND) ou encore imposer le maintien de la licence pour les œuvres dérivées (SA). Elles imposent toutes la mention du nom de l’auteur (BY). Par conséquent, lorsqu’une œuvre est placée sous ce type de licence, à condition d’en respecter les termes, toute personne peut utiliser l’œuvre sans avoir à solliciter une autorisation spéciale auprès de l'auteur.

Voir aussi : Creative Commons ; Open Source

Lien utile : Les contenus sous licences libres sur le site economie.gouv.fr.

Licence nationale

id : licence nationale
types : Pratiques et méthodes
mots-clés :
filename : licence_nationale

Il s’agit d’un format d’acquisition pérenne de documentation numérique qui complète les abonnements à la documentation électronique auxquels souscrivent les bibliothèques de l’enseignement supérieur et de la recherche.

Le dispositif des licences nationales garantit l’accès aux ressources à partir des plateformes des éditeurs et/ou de la plateforme ISTEX ainsi que, le plus souvent, l’exploitation des données, notamment la fouille de textes et de données, la réutilisation et la reproduction d’extraits dans le cadre de travaux de recherche et d’enseignement.

Ce dispositif implique plusieurs acteurs au niveau national : l’ABES, le consortium Couperin, l’Inist-CNRS, le GIS (Groupement d’Intérêt Scientifique) Collex-Persée et l’Université de Lorraine.

Site web : https://www.licencesnationales.fr/presentation/

Lien hypertexte

id : lien hypertexte
types : Pratiques et méthodes
mots-clés :
filename : lien_hypertexte

Lien opéré par un code HTML qui relie deux pages ou deux endroits accessibles par le protocole HTTP (web), il permet de passer automatiquement d’un document à un autre.

Quand on clique sur un lien hypertexte, le navigateur nous envoie à une autre page internet (du même site ou d’un autre site) ou à un autre endroit dans la même page (lien interne avec une ancre), soit dans la même fenêtre, soit dans un nouvel onglet.

Linked Data

id : linked data
types : Pratiques et méthodes
mots-clés :
filename : linked_data

Notion introduite en 2006, par Tim Berners-Lee. Il s’agit d’une méthode de publication de données structurées, de manière à ce qu’on puisse établir efficacement des relations (liens) entre les données. Cela permet la création d’un réseau global d’informations et le décloisonnement des données.

Voir Web sémantique.

Lippmannian Device

id : lippmannian device
types : Outils logiciels
mots-clés :
filename : lippmannian_device

L’outil Lippmannian Device permet de détecter la partisanerie ou les partis pris d’un acteur sur le web. Un des principaux usages de cet outil consiste à rechercher la présence et le classement de sources spécifiques au sein des résultats d’un moteur de recherche. L’outil est également utilisé dans les recherches sur la censure.

L'outil Lippmannian Device to Gephi permet par ailleurs de visualiser les résultats obtenus sous forme d’un réseau Gephi.

Sites web : https://tools.digitalmethods.net/beta/lippmannianDevice/, https://tools.digitalmethods.net/beta/lippmannianDeviceToGephi/

Lodex

id : lodex
types : Outils logiciels
mots-clés :
filename : lodex

Lodex est un logiciel open source permettant de publier selon les normes du web sémantique des tableaux comportant des données brutes, d’en faciliter la transformation en données structurées, d’explorer le jeu de données publié selon différents angles de vues, de référencer et valoriser chaque ressource, d’aider à aligner les données à publier avec des données similaires ou connexes.

Site web : https://lodex.inist.fr

LogEc

id : logec
types : Ressources
mots-clés :
filename : logec

LogEc est un outil qui collecte les statistiques d’accès aux ressources de RePec. Il permet ainsi de connaître les sujets les plus traités par les économistes ainsi que l’impact de sa propre recherche.

Site web : https://logec.repec.org

Logiciel

id : logiciel
types : Technologies et familles d’outils
mots-clés :
filename : logiciel

En informatique, un logiciel est un ensemble de séquences d’instructions interprétables par une machine (ou programmes informatiques) et d’un jeu de données nécessaires à ces opérations.

Le logiciel détermine donc les tâches qui peuvent être effectuées par la machine, ordonne son fonctionnement et lui procure ainsi son utilité fonctionnelle.

Login

id : login
types : Pratiques et méthodes
mots-clés :
filename : login

Le login est un code d’accès unique permettant à un utilisateur de se connecter à un ordinateur, à un système informatique ou un site internet. Le login est une mesure de sécurité qui se compose le plus souvent d’un identifiant et d’une authentification.

Voir Identifiant

Loi pour une République numérique

id : loi pour une république numérique
types : Pratiques et méthodes
mots-clés :
filename : loi_pour_une_republique_numerique

Il s’agit d’une loi française promulguée le 7 octobre 2016 suite à la proposition de la secrétaire d’Etat au numérique Axelle Lemaire.

Elle se construit autour de trois axes principaux : rendre le numérique accessible à tous, favoriser la protection des individus dans la société du numérique et favoriser la circulation des données et du savoir. Elle prévoit notamment le libre accès aux publications scientifiques de la recherche publique ainsi qu’aux données publiques comme celles de l’INSEE.

Voir Science ouverte, CoSo

Looping

id : looping
types : Outils logiciels
mots-clés :
filename : looping

Looping est un logiciel gratuit et libre d’utilisation développé par l’université de Toulouse III. Il sert à modéliser la structuration d’une base de données (diagramme UML), et génère automatiquement les scripts de requête en SQL.

Site web : https://www.looping-mcd.fr/

Voir aussi : Modèle conceptuel de données

Magrit

id : magrit
types : Outils logiciels
mots-clés :
filename : magrit

Il s'agit d'une solution pour créer des cartes thématiques.

Site web : http://magrit.cnrs.fr/

Mallet

id : mallet
types : Outils logiciels
mots-clés :
filename : mallet

Mallet est une librairie Java de textométrie et d’analyse textuelle. Cette librairie est utilisée pour le traitement statistique du langage naturel, la classification de documents, le regroupement, la modélisation de sujets, l'extraction d'informations et d'autres applications d'apprentissage automatique au texte.

Site web : https://mimno.github.io/Mallet/index

Manylines

id : manylines
types : Outils logiciels
mots-clés :
filename : manylines

Manylines est une application web, aujourd’hui archivée, permettant d’afficher, de spatialiser, de catégoriser un réseau. Avant son archivage, elle permettait également d’écrire et publier un récit composé de vues spécifiques du réseau.

Site web : https://medialab.sciencespo.fr/outils/manylines/

Mapbox

id : mapbox
types : Outils logiciels
mots-clés :
filename : mapbox

Fournisseur de cartes en ligne personnalisables (gratuit jusqu'à une certaine limite), mapbox est aussi un contributeur important à certaines bibliothèques open source et à la spécification MBTiles (format stockant des tuiles cartographiques dans un seul fichier)

Site web : https://www.mapbox.com/

MARC

id : marc
types : Pratiques et méthodes
mots-clés :
filename : marc

MARC (Machine Readable Cataloging) est un ensemble de formats informatiques de structuration des données bibliographiques qui respectent l’application de la norme ISO 2709 qui, elle-même, définit le format d’échange informatique des notices bibliographiques.

Le premier format MARC a été créé en 1965 notamment parce que le catalogage en ISBD n’était pas lisible par ordinateur. Il existe aujourd’hui deux grands types de format MARC : le format MARC21 géré par la Bibliothèque du Congrès à Washington et la Bibliothèque et archives nationales du Canada ; le format à vocation internationale UNIMARC géré par l’IFLA. Les formats MARC déterminent la manière dont les informations qui décrivent un document sont sélectionnées, organisées et présentées dans les catalogues de bibliothèques.

Markdown

id : markdown
types : Pratiques et méthodes
mots-clés :
filename : markdown

Markdown est un langage informatique créé en 2004 par John Gruber. Plus particulièrement, il s’agit d’un langage de balisage conçu pour être plus simple d’utilisation que le langage HTML.

Un document écrit en markdown peut être peut être lu en l’état sans donner l’impression d’avoir été balisé ou formaté par des instructions particulières. Il peut également être converti en différents formats, en HTML ou en PDF par exemple.

Site web : https://www.ionos.fr/digitalguide/sites-internet/developpement-web/markdown/

Mashup / Application composite

id : mashup / application composite
types : Technologies et familles d’outils
mots-clés :
filename : mashup

Un mashup est une application qui permet sur un site web d’agréger ou retraiter de l’information en provenances d’une ou plusieurs sources extérieures. Un mashup se caractérise par la combinaison, la visualisation et l’agrégation de données. Google Maps est ainsi un mashup car il est utilisé par d’autres sites pour faire fonctionner leur système de géolocalisation.

MATE-SHS

id : mate-shs
types : Groupements institutionnels
mots-clés :
filename : mate-shs

Le réseau Mate-shs (Méthodes, Analyses, Terrains, Enquêtes en SHS) entend réunir les professionnels de la recherche s’intéressant, de manière large, à la production, au traitement, à la visualisation et à la préservation de données et de corpus en sciences humaines et sociales. Mate-shs a pour ambition de devenir un des lieux de référence de discussion, transmission et construction des pratiques professionnelles du métier ; de découverte et de maîtrise de nouvelles méthodes / nouveaux logiciels par la communauté ; et d’être, sur tous ces sujets, un interlocuteur reconnu et légitime auprès des institutions chargées de l’organisation de la recherche.

Site web : https://mate-shs.cnrs.fr/

Formulaire d'inscription sur la liste de diffusion : https://www.enquetes.mate-shs.cnrs.fr/index.php/113498?lang=fr

MCD

id : mcd
types : Pratiques et méthodes
mots-clés :
filename : mcd

Un modèle conceptuel de données (ou MCD) est une représentation graphique des données permettant de comprendre quelles relations lient les éléments entre eux grâce à des diagrammes codifiés. Il s’agit d’une des étapes de création d’une base de données.

Plusieurs éléments composent les diagrammes notamment les entités qui correspondent à un objet, les propriétés qui sont la liste des données de l’entité, les relations qui expliquent comment les entités sont reliées entre elles et les cardinalités qui caractérisent les liens entre les entités.

Il existe différents modèles de MCD : le modèle « entité-association », le modèle binaire ou encore le modèle Z.

Des logiciels spécialisés existent pour réaliser ces modèles. Ils peuvent être propriétaires (Microsoft Visio, Maestro SQL, Oracle Designer) ou libres (MySQL Workbench, DBDesigner).

Voir SQL

Mercury

id : mercury
types : Outils logiciels
mots-clés :
filename : mercury

Mercury est un framework qui permet de créer des pages HTML interactives à partir de widgets. Cela permet de partager des widgets qui peuvent être ensuite utilisés dans un site web pour augmenter son interactivité.

Site web : https://mljar.com/mercury/

Tutoriel : https://www.youtube.com/watch?v=WcD908-a7Z8&ab_channel=MLJAR

Métadonnées

id : métadonnées
types : Pratiques et méthodes
mots-clés :
filename : metadonnees

On appelle « métadonnées » des données structurées décrivant une ressource ou une autre donnée. Une notice bibliographique, qui décrit selon un format ordonné un document en segmentant ses informations, contient des métadonnées.

Les métadonnées servent à référencer, identifier et partager correctement un document. Elles permettent la description et le traitement des ressources numériques (ou papier), elles sont généralement standardisées et à l’extérieur ou en entête du texte ou du document qu’elles décrivent.

On distingue plusieurs types de métadonnées, descriptives (EAD, Dublin Core, MODS), techniques (EXIF, MIX-NISO, etc.), de structure (ALTO, METS, TEI).

METS

id : mets
types : Pratiques et méthodes
mots-clés :
filename : mets

Standard XML de métadonnées permettant de décrire un document numérique dans toutes ses dimensions (notamment bibliographiques, techniques, juridiques), dans le but de faciliter son échange, sa gestion et sa préservation.

Minet

id : minet
types : Outils logiciels
mots-clés :
filename : minet

Minet est une librairie et un outil en ligne de commande écrit en langage python qui permet d’aider à accomplir des tâches d’analyse du web ou webmining.

Site web : https://medialab.sciencespo.fr/outils/minet/

MiniVan

id : minivan
types : Outils logiciels
mots-clés :
filename : minivan

MiniVan est une application web permettant de publier et d’analyser des réseaux.

Site web : https://medialab.github.io/minivan/#/

Mir@bel

id : mir@bel
types : Ressources
mots-clés :
filename : mir@bel

Mutualisation d’information sur les revues et leurs accès dans les bases en ligne. Site web qui facilite l’accès aux revues (principalement celles de sciences humaines et sociales) en indiquant pour chacune les liens vers le texte intégral, les sommaires, les résumés ou l’indexation des articles.

Il est alimenté par les établissements du type bibliothèque, par les éditeurs et par les ressources en ligne.

Site web : https://reseau-mirabel.info

Mirador

id : mirador
types : Outils logiciels
mots-clés :
filename : mirador

Mirador est un visualiseur web d’images numériques répondant au standard de description des images IIIF. Il permet de comparer des images provenant de différentes institutions sur un même écran, de zoomer, et d'annoter certaines parties des images.

Site web : https://projectmirador.org/

Moissonnage

id : moissonnage
types : Pratiques et méthodes
mots-clés :
filename : moissonnage

Le moissonnage est un mécanisme permettant de récolter des métadonnées sur un catalogue distant, une base de données distante ou encore sur le web puis de les stocker sur un serveur local pour y accéder plus rapidement.

Le moissonnage s’effectue automatiquement et régulièrement et nécessite les mêmes protocoles entre l’organisme qui moissonne et celui qui est moissonné.

C’est dans cette optique que sont développés les protocoles comme l’OAI-PMH qui sert notamment au moissonnage des archives ouvertes.

Voir Moteur de recherche

MOOC - Massive open online courses

id : mooc - massive open online courses
types : Ressources
mots-clés :
filename : mooc

Les MOOC sont des cours en ligne ouvert à tous. Ce type de formation peut donner droit à des crédits ECTS, et/ou à des certifications de suivi avec succès. Les MOOC sont généralement basés sur des vidéos pédagogiques, des QCM d'évaluation, et des forums de discussion avec les autres apprenants et parfois les professeurs.

Plateforme de MOOC : OpenClassRooms, FUN mooc (France Université Numérique), Coursera

Moteur de recherche

id : moteur de recherche
types : Technologies et familles d’outils
mots-clés :
filename : moteur_de_recherche

Un moteur de recherche est une machine (matérielle et logicielle) qui permet de rechercher sur le web des informations, des documents, des ressources à partir d’une requête par mots-clés. Les moteurs de recherche fonctionnent grâce à des robots appelés crawler ou spider qui parcourent le web et indexent les pages web dans leurs bases de données.

Autrement dit, à chaque page web sont attribués des mots-clés si bien que quand l’internaute donne les mots-clés de sa recherche, le moteur de recherche consulte sa base de données et renvoie comme résultats les pages web indexées avec les mêmes mots-clés que ceux de l’utilisateur. Les résultats de la requête sont classés selon leur pertinence et des critères propres à l’algorithme de chaque moteur de recherche.

Il existe différents moteurs de recherche, le plus connu est Google. Certains sont spécialisés, ainsi Startpage s’est spécialisé dans la protection des données et l’anonymat de ses utilisateurs ; Ecosia et Lilo dans l’écologie et la solidarité (à chaque recherche, un arbre est planté ou de l’argent est reversé à des associations).

Voir : Opérateurs booléens, Troncature

Munich Personal RePEc Archive

id : munich personal repec archive
types : Outils logiciels
mots-clés :
filename : munich_personal_repec_archive

Munich Personal RePEc Archive est un service qui permet au chercheur de déposer les travaux qu’il souhaite diffuser sur les autres services du réseau RePec comme IDEAS ou EconPapers.

Site web : https://mpra.ub.uni-muenchen.de

MuseScore

id : musescore
types : Outils logiciels
mots-clés :
filename : musescore

MuseScore est un logiciel open source d’édition de partition. La plateforme en ligne propose également des partitions à télécharger.

Site web : https://musescore.org/fr

myST

id : myst
types : Outils logiciels
mots-clés :
filename : myst

Les fichiers markdown du Jupyter Book peuvent être écrits grâce à myST (Markedly Structured Text), une version spéciale de Markdown qui a été conçue pour faciliter la création de documents informatiques en fournissant des fonctionnalités supplémentaires. myST permet d’améliorer la mise en page des documents markdowns qui peuvent ensuite être exportés en format pdf, LaTeX ou en format web.

Site web : https://myst-tools.org/

Tutoriel : https://www.youtube.com/watch?v=NxSNVt9XsCI&t=1490s&ab_channel=curvenote

NAKALA

id : nakala
types : Outils logiciels, Ressources
mots-clés :
filename : nakala

NAKALA est un service d’Huma-Num permettant à des chercheurs, enseignants-chercheurs ou équipes de recherche de partager, publier et valoriser tous types de données numériques documentées (fichiers textes, sons, images, vidéos, objets 3D, etc.) dans un entrepôt sécurisé afin de les publier en accord avec les principes du FAIR Data (Facile à trouver, Accessible, Interopérable et Réutilisable).

Site web : https://documentation.huma-num.fr/nakala/

Netvibes

id : netvibes
types : Outils logiciels
mots-clés :
filename : netvibes

Netvibes est un outil en ligne de veille informationnelle. Il s’agit d’un agrégateur d’abonnements à des flux RSS. Il offre la possibilité de consulter le site web agrégé à l’intérieur de l’agrégateur.

Voir aussi : InoReader, Feedly

Site web : https://www.netvibes.com/fr

Netvizz

id : netvizz
types : Outils logiciels
mots-clés :
filename : netvizz

Netvizz permet d’extraire des données à partir de différentes sections de Facebook (groupes, pages, recherches).

Site web : https://www.facebook.com/login/?next=https%3A%2F%2Fapps.facebook.com%2F107036545989762%2F

New Economic Papers

id : new economic papers
types : Ressources
mots-clés :
filename : new_economic_papers

NEP (New Economic Papers) est un service de veille du réseau RePec qui envoie à ses abonnés des notifications sur les nouvelles ressources téléchargeables sous formes d’e-mail, de RSS et de tweets.

Il est possible de s’abonner à des fils thématiques comme le Big Data, la Banque centrale ou encore la géographie économique.

Site web : http://nep.repec.org

News Agencies Scraper

id : news agencies scraper
types : Outils logiciels
mots-clés :
filename : news_agencies_scraper

Cet outil permet d’interroger différentes agences de presse avec un mot-clé et d’en extraire les titres, images, dates, et textes intégraux correspondant au mot-clé.

Voir aussi : Web scraping

Site web : https://wiki.digitalmethods.net/Dmi/ToolNewsAgencies

Nooj

id : nooj
types : Outils logiciels
mots-clés :
filename : nooj

Nooj est un logiciel de traitement de corpus conçu pour l’analyse et le traitement des langues et de la linguistique.

Il permet notamment de créer et gérer des dictionnaires et des grammaires électroniques à large couverture puisqu’il peut formaliser huit niveaux de phénomènes linguistiques (orthographe, typographie, morphologie flexionnelle et dérivationnelle, syntaxe locale et structurelle, grammaire transformationnelle et analyse sémantique).

Site web : http://nooj4nlp.org/index.html

Noota

id : noota
types : Outils logiciels
mots-clés :
filename : noota

Noota est un service propriétaire de transcription d’enregistrements audios. La plateforme web propose également des solutions d’enregistrement de réunion, d’analyse de texte et d’audios, d’annotation et de sous-titrage de vidéo.

Site web : https://noota.io/

Notebook

id : notebook
types : Technologies et familles d’outils
mots-clés :
filename : notebook

Un notebook est un environnement où on peut inscrire du code avec des données et de la prose, exécuter le code et visualiser simultanément les résultats.

Voir aussi : Jupyter, Observable, R Markdown, …

Définition issue de https://www.arthurperret.fr/blog/2021-06-11-du-notebook-au-bloc-code.html

Notice bibliographique

id : notice bibliographique
types : Pratiques et méthodes
mots-clés :
filename : notice_bibliographique

Une notice bibliographique est un fichier qui contient l’ensemble des éléments descriptifs d’un document tels que le type de document, le titre, l’auteur, la maison d’édition, la date de publication. Elle peut également comprendre des éléments permettant la localisation du document (cote, adresse URL).

Après une analyse du document, la notice peut présenter un résumé, des mots-clés ou encore un indice de classification qui donnent à voir le contenu du document. Les notices bibliographiques se rencontrent par exemple dans les bibliographies, les catalogues de bibliothèques ou encore les bases de données.

Les notices bibliographiques sont normées et respectent des règles de présentations strictes. Ces règles peuvent avoir une portée internationale comme c’est le cas de l’ISBD mis au point par l’IFLA. En France, l’AFNOR établit des normes en suivant les recommandations de l’IFLA.

Notice d’autorité

id : notice d’autorité
types : Pratiques et méthodes
mots-clés :
filename : notice_d'autorite

Une notice d’autorité est la forme normalisée et validée de noms d'œuvres, de noms d’auteurs, de noms géographiques. Elle sert à identifier et retrouver tous les documents produits par une même entité en évitant les ambiguïtés et les doublons.

Ainsi, dans les catalogues informatisés, le catalogage des points d’accès auteurs et sujets s’effectue à partir des notices d’autorités. Les notices d’autorités s’organisent en listes d’autorités, telles que le RAMEAU, qui constituent elles-mêmes un langage d’indexation.

NTIC

id : ntic
types : Pratiques et méthodes, Technologies et familles d’outils
mots-clés :
filename : ntic

NTIC (Nouvelles Technologies de l’Information et de la Communication) désigne l’ensemble des technologies permettant le traitement et la transmission des informations principalement numériques.

Les téléphones portables, les ordinateurs, les messageries instantanées, internet font partie des NTIC.

Numérisation

id : numérisation
types : Pratiques et méthodes
mots-clés :
filename : numerisation

Processus qui consiste à convertir des informations d’un support (texte, image, audio, vidéo) ou d’un signal électrique en données numériques.

Pour la numérisation des images, voir JPEG, PNG, TIFF, PDF

OAI-PMH

id : oai-pmh
types : Pratiques et méthodes
mots-clés :
filename : oai-pmh

L’OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting) est un protocole informatique développé afin d’échanger des métadonnées – uniquement celles-ci et non les ressources elles-mêmes.

L’OAI-PMH définit deux types d’acteurs : les fournisseurs de données, qui déposent leurs métadonnées sur un serveur web appelé « entrepôt », et les fournisseurs de service qui collectent (qui « moissonnent ») ces données. Le moissonnage s’effectue à partir de requêtes formalisées à l’adresse de l’entrepôt, les résultats sont alors intégrés dans l’index ou le répertoire du site moissonneur. La liste des requêtes peut être consultée par exemple sur le site de la BNF. Le standard de base d’échange du protocole OAI-PMH est le Dublin Core mais d’autres formats de métadonnées peuvent être exposés (EAD, RDF, etc.).

Ce protocole est utilisé notamment par les Archives Ouvertes et les entrepôts institutionnels, il s’est aujourd’hui largement répandu dans les institutions patrimoniales et notamment les bibliothèques. Il permet entre autres de construire des sites portails thématiques avec uniquement le résultat de requêtes sur les entrepôts repérés sur cette thématique. Europeana, la bibliothèque numérique européenne, est alimentée via le protocole OAI-PMH.

Voir Interopérabilité

Lien utile : Europeana

Océrisation

id : océrisation
types : Pratiques et méthodes
mots-clés :
filename : ocerisation

L’océrisation désigne le processus d’utilisation d’un logiciel de reconnaissance optique de caractères (Optical Character Recognition - OCR) permettant de transformer l’image numérisée d’un texte imprimé en document textuel et de le sauvegarder sous forme d’un fichier ensuite exploitable dans un logiciel de traitement de texte.

OCR

id : ocr
types : Technologies et familles d’outils
mots-clés :
filename : optical_character_recognition

La reconnaissance optique de caractère (optical character recognition, OCR, en anglais) est une technologie qui transcrit l’image d’un texte dactylographié en un fichier textuel numérique.

Contrairement à l’HTR, l’OCR se focalise uniquement sur la reconnaissance des caractères un par un, sans prendre en compte leur contexte que ce soit dans un mot, une phrase ou une ligne.

Voir aussi : HTR, Transcription

OldMapsOnline

id : oldmapsonline
types : Ressources
mots-clés :
filename : oldmapsonline

Il s’agit d’un moteur de recherche qui indexe plus de 400 000 cartes historiques grâce à la participation de bibliothèques universitaires et d’établissement de recherche.

Site web : https://www.oldmapsonline.org/about/

Omeka

id : omeka
types : Outils logiciels
mots-clés :
filename : omeka

Logiciel de gestion de bibliothèque numérique mis à disposition sous licence libre (GNU – General Public License).

De conception modulaire, l’outil permet à chaque site d’adapter les fonctionnalités proposées à l’aide de plugins et de thèmes. L’outil est développé aux États-Unis par le Roy Rosenzweig Center for History and New Media (CHNM) de l’Université George Mason qui est aussi à l’origine du logiciel de gestion bibliographique Zotero.

Site web : https://omeka.org

Onglet

id : onglet
types : Pratiques et méthodes
mots-clés :
filename : onglet

Un onglet est, dans un fichier ou autre système de rangement, une petite excroissance visuelle porteuse d'une étiquette (typiquement, alphabétique) permettant un accès direct aisé aux documents ou une partie du document.

Par analogie, sur les navigateurs internet, il permet d’avoir accès à plusieurs sites ou pages sur une seule fenêtre et de pouvoir passer rapidement d’une page à une autre. Cette interface riche sur une seule fenêtre provoque le risque d’avoir trop d’onglets ouverts…

Ontologie

id : ontologie
types : Pratiques et méthodes
mots-clés :
filename : ontologie

L’ontologie est une branche de la philosophie qui vise à élucider le sens de l’être considéré en tant qu’être général, abstrait, essentiel et en tant qu’être singulier, concret, existentiel. Il s’agit également de l’étude des être en eux-mêmes et non tels qu’ils nous apparaissent.

Par extension, le terme signifie l’ensemble des vérités fondamentales de l’être. Du point de vue de l’histoire de la médecine, l’ontologie se réfère à l’étude de l’être de la maladie ou à l’étude des êtres vivants et des phénomènes individuels.

En informatique, une ontologie est « la spécification d'une conceptualisation d'un domaine de connaissance » (Th. Gruber), autrement dit c’est un modèle structuré de concepts se rapportant à une discipline. Pour chaque concept, une ontologie définit des « classes », des « attributs » aussi nommés « propriétés », et des « relations ». Souvent une ontologie est représentée par un schéma explicitant ces différents éléments.

Site web : https://www.cnrtl.fr/lexicographie/ontologie

Site web : https://tomgruber.org/writing/ontology-in-encyclopedia-of-dbs.pdf

Ontome

id : ontome
types : Outils logiciels
mots-clés :
filename : ontome

Ontome est un environnement de gestion d’ontologie en ligne. Il permet de gérer un projet de création et de maintien d’une ontologie collaborative. Cet outil sert à aligner une ontologie avec celle du CIDOC-CRM.

Site web : https://ontome.net/

Open Access

id : open access
types : Pratiques et méthodes
mots-clés :
filename : open_access

L’Open Access (ou aussi « libre accès », ou encore « accès ouvert ») à la littérature scientifique est un mode de diffusion des articles de recherche sous forme numérique, gratuite et dans le respect du droit d’auteur. Cette notion recouvre l’accès ouvert (gratis open access), les données diffusées en ligne gratuitement et le libre accès (libre open access), données diffusées en ligne gratuitement et librement, c'est-à-dire soumises à une licence d’utilisation dite libre (ex. Creative Commons). On distingue plusieurs modèles ou voies de l’open access : la voie verte et la voie dorée.

Lien utile : Comment définir l'Open Access

Open Data

id : open data
types : Pratiques et méthodes
mots-clés :
filename : open_data

Données ouvertes, dont l’accès est public et libre de droit, tout comme leur exploitation.

Open Geospatial Consortium

id : open geospatial consortium
types : Groupements institutionnels
mots-clés :
filename : open_geospatial_consortium

L’Open Geospatial Consortium est un regroupement de professionnels, d’entreprises et d’institutions qui travaillent à la valorisation des données géographiques, notamment à travers le respect des principes FAIR Data. Le consortium met également en place des référentiels pour le partage et l’interopérabilité des données géographiques.

Site web : https://www.ogc.org/

Open Source

id : open source
types : Pratiques et méthodes
mots-clés :
filename : open_source

Cela désigne le « code source ouvert » et s'applique aux logiciels dont la licence respecte les possibilités d'accès au code source du logiciel, de libre redistribution de ce code et de possibilités de travaux dérivés à partir de celui-ci.

On peut ainsi adapter le code source d’un logiciel open source à ses propres besoins. La principale licence pour le logiciel open source est la licence GNU (General Public License). De plus en plus, on étend la définition de « l’open source » aux données et plus uniquement au code informatique, on parle alors d’Open Data.

Voir GitHub

OpenAIRE

id : openaire
types : Groupements institutionnels, Pratiques et méthodes
mots-clés :
filename : openaire

OpenAIRE (Open Access Infrastructure for Research in Europe) est un projet européen dont la mission consiste à favoriser le libre accès de l’information scientifique en créant un réseau d’experts de la science ouverte pour mettre au point des formations et une infrastructure technique ouverte pour la centralisation, la gestion et le partage des publications scientifiques et des données de la recherche.

Site web : https://www.openaire.eu

OpenArcheo

id : openarcheo
types : Ressources
mots-clés :
filename : openarcheo

OpenArcheo est une plateforme en ligne mettant à disposition des données issues de l’archéologie alignée sur le modèle du CIDOC-CRM. Les deux interfaces proposées reposent sur le langage de requête SPARQL. Les données sont issues des travaux du Consortium MASA (mémoire des archéologues et des sites archéologiques), et sont hébergées par Huma-Num.

Site web : http://openarchaeo.huma-num.fr/explorateur/home

OpenDOAR

id : opendoar
types : Ressources
mots-clés :
filename : opendoar

OpenDOAR (Directory of Open Access Repositories) est un annuaire qui recense à l’échelle mondiale les archives ouvertes et les dépôts en libre accès.

La recherche et la navigation au sein des résultats peuvent être filtrées par nom, par région du monde, par pays ou encore par logiciel.

Site web : https://v2.sherpa.ac.uk/opendoar/search.html

OpenEdition

id : openedition
types : Outils logiciels, Ressources
mots-clés :
filename : openedition

Ressources électroniques en sciences humaines et sociales.

OpenEdition est une infrastructure complète d’édition électronique au service de la communication scientifique en sciences humaines et sociales. Elle rassemble quatre plateformes complémentaires dédiées (OpenEdition Journals, OpenEdition Books, Hypothèses, Calenda).

Voir Science ouverte

Site web : https://www.openedition.org

OpenLayers

id : openlayers
types : Pratiques et méthodes
mots-clés :
filename : openlayers

Bibliothèque JavaScript open source publiée en 2006 permettant d'afficher des cartes dans un navigateur web. Elle offre des fonctionnalités équivalentes à un logiciel SIG.

Site web : https://openlayers.org/

OpenRefine

id : openrefine
types : Outils logiciels
mots-clés :
filename : openrefine

OpenRefine est une application permettant de traiter des fichiers de données comportant des incohérences internes dans les formats ou la structure des données ou encore dans la terminologie employée. Cet outil normalise et nettoie les données sans modifier les données originales.

Site web : https://openrefine.org

OpenStreetMap

id : openstreetmap
types : Outils logiciels
mots-clés :
filename : osm

OpenStreetMap est une application web de cartographie. Elle partage également des données géographiques libres d'utilisation.

Site web : https://www.openstreetmap.org/

Opentheso

id : opentheso
types : Outils logiciels
mots-clés :
filename : opentheso

Opentheso est un logiciel libre de gestion de thésaurus multilingue créé suite à la collaboration entre Frantiq et la plateforme « Tête de réseaux documentaires » de la Maison de l’Orient et de la Méditerranée.

Voir PACTOLS

Site web : <https://documentation.huma-num.fr/opentheso/ >

Logiciel : https://github.com/miledrousset/Opentheso2

Opérateurs booléens

id : opérateurs booléens
types : Pratiques et méthodes
mots-clés :
filename : operateurs_booleens

Les opérateurs booléens permettent d’affiner une recherche dans un moteur de recherche ou un ensemble de résultats en combinant des critères de recherche logiques. Les principaux opérateurs booléens sont «ET », « OU » et « SAUF ».

L’opérateur « ET » présente uniquement les résultats contenant les deux mots qui l’entourent. L’opérateur « OU » présente les résultats des deux termes qui l’entourent ou uniquement l’un des deux termes. L’opérateur « NOT » ne présente que les résultats qui contiennent le mot précédent l’opérateur tout en excluant ceux qui contiennent le second terme.

Voir Troncature

OPIDoR

id : opidor
types : Ressources
mots-clés :
filename : opidor

OPIDoR (Optimiser le Partage et l’Interopérabilité des Données de la Recherche) est un portail mis en place par l’Inist-CNRS à destination de la communauté de l’enseignement supérieur et de la recherche qui propose un ensemble d’outils et de services facilitant la mise en application des principes du FAIR Data.

OPIDoR propose trois services.

Voir ARK, ORCID

Site web : https://opidor.fr

ORCID

id : orcid
types : Pratiques et méthodes, Ressources
mots-clés :
filename : orcid

L'Open Researcher and Contributor ID (ORCID) est un code qui permet d'identifier de manière unique les auteurs de contributions académiques et scientifiques.

Site web : https://orcid.org

Ortolang

id : ortolang
types : Outils logiciels, Ressources
mots-clés :
filename : ortolang

Ortolang est une plateforme de données (corpus, lexiques, dictionnaires, etc.) et d’outils sur la langue et son traitement.

Elle propose également un service d'hébergement et d'archivage de projets en linguistiques. Elle met à disposition des outils de traitement automatique de la langue française.

Site web : https://www.ortolang.fr/

Ovide

id : ovide
types : Outils logiciels
mots-clés :
filename : ovide

Ovide est un logiciel d’écriture et d’édition. Il permet de travailler avec des images, des vidéos, des références bibliographiques et de produire diverses éditions imprimées et web à partir d’un même corpus d’écrits. Il fonctionne en tandem avec l’éditeur Fonio.

Site web : https://peritext.github.io/ovide/

OxGarage

id : oxgarage
types : Outils logiciels
mots-clés :
filename : oxgarage

OxGarage est un service web proposant et gérant la conversion de documents en plusieurs formats de fichiers.

Sites web : https://oxgarage2.tei-c.org/# ; https://github.com/TEIC/oxgarage/

PACTOLS

id : pactols
types : Ressources
mots-clés :
filename : pactols

PACTOLS est un thésaurus créé par Frantiq dans le but d’organiser les mots-clés utilisés dans l’indexation des ressources documentaires de domaine archéologique. Il couvre toutes les thématiques de l’archéologie, de la préhistoire à l’époque contemporaine. Les concepts sont classés dans sept thématiques : Peuples, Anthroponymes, Chronologie, Toponymes, Oeuvres, Lieux, Sujets (PACTOLS).

Le thésaurus est interopérable et multilingue (7 langues), chaque concept possède un identifiant ARK qui en fait un objet web unique, citable et réutilisable sur le web sémantique.

Site web : https://pactols.frantiq.fr/opentheso/

Page web

id : page web
types : Pratiques et méthodes
mots-clés :
filename : page_web

C’est l'unité de base du web. Elle est conçue pour être consultée par un navigateur web et elle est identifiée par une adresse web.

Elle est généralement constituée d’une structure en HTML, avec du texte et souvent d’images, de feuilles de style ou de scripts permettant l’affichage de données venant de bases de données. Elle est fabriquée à partir d’un éditeur HTML et localisée sur un serveur web (hébergement). Son affichage peut être paramétré pour s’adapter aux conditions locales de consultation (écran d’ordinateur fixe ou portable, écran de télévision, téléphone mobile, etc.) à travers une feuille de style.

Palladio

id : palladio
types : Outils logiciels
mots-clés :
filename : palladio

Palladio est une plateforme de visualisation développée par l'Université de Stanford (USA).

Palladio est un ensemble d'outils permettant de télécharger facilement des données et de les étudier. Il s'agit d'un ensemble de visualisations entrelacées conçues pour des données complexes et multidimensionnelles. C'est un produit du projet "Networks in History" qui trouve ses racines dans un autre projet de recherche en sciences humaines basé à Stanford : Mapping the Republic of Letters (MRofL).

Site web : https://hdlab.stanford.edu/palladio/

Parser/Parseur

id : parser/parseur
types : Technologies et familles d’outils
mots-clés :
filename : parser

Un parseur est un programme informatique d’analyse syntaxique qui peut être appliqué à du langage naturel ou à un langage informatique en fonction de sa configuration. Il sert notamment à extraire les informations essentielles d’un fichier ou d’une page web.

PDF

id : pdf
types : Pratiques et méthodes
mots-clés :
filename : pdf

Le PDF (Portable Document Format) est un format qui préserve la mise en forme d’un document – polices de caractère, images, objets graphiques, etc. – telle qu’elle a été définie par son auteur – et cela quels que soient le logiciel, le système d’exploitation et l’ordinateur utilisés pour l’imprimer ou le visualiser (au contraire des formats des traitements de texte).

Il s’est très vite imposé comme format d’échange et d’archivage. Le format PDF n’est pas figé : il peut avoir des options personnalisées (compression des images et des textes, interdiction d'impression ou de modification…). Il peut surtout être uniquement graphique (vous ne pouvez pas copier le texte que vous voyez, il s’agit généralement d’une image qu’on a transformée en PDF) ou avoir une structure textuelle (vous pouvez copier le texte que vous voyez dans le fichier PDF).

Voir Image.

Pearltrees

id : pearltrees
types : Outils logiciels
mots-clés :
filename : pearltrees

Pearltrees est un outil en ligne qui permet d’agréger, d’organiser des pages web, des fichiers, des photos, des notes en créant des collections thématiques. Les collections sont publiques et accessibles à tous sauf pour les membres premium qui ont la possibilité de rendre leurs collections privées.

Site web : https://www.pearltrees.com

Périscope

id : périscope
types : Outils logiciels
mots-clés :
filename : periscope

Application web développée par l’ABES permettant de rechercher et afficher les états de collection des périodiques signalés dans le SUDOC. Elle est librement accessible mais il est impossible de modifier les données affichées.

Site web : https://periscope.sudoc.fr/

Perl

id : perl
types : Pratiques et méthodes
mots-clés :
filename : perl

Perl est un langage de programmation créé en 1987 pour manipuler du texte. Il dérive du langage C et des scripts Shell, et intègre dans sa syntaxe les expressions régulières.

Formation : https://formation-perl.fr/guide-perl.html

Persée

id : persée
types : Ressources
mots-clés :
filename : persee

Persée est une structure de service ayant pour mission de valoriser le patrimoine documentaire au bénéfice de la recherche en assurant sa diffusion, son enrichissement et sa préservation. Il s’agit d’un portail de diffusion de publications scientifiques, principalement dans le domaine des SHS. Il assure ainsi la diffusion de collections patrimoniales et propose des services tels que la recherche plein texte, le téléchargement au format PDF ou encore l’export des références bibliographiques.

Site web : https://www.persee.fr

Phon

id : phon
types : Outils logiciels
mots-clés :
filename : phon

Phon est un logiciel de création et d’analyse de corpus textuels et de corpus de données phonologiques.

Site web : https://www.phon.ca/phon-manual/getting_started.html

Plan de gestion des données

id : plan de gestion des données
types : Pratiques et méthodes
mots-clés :
filename : plan_de_gestion_des_donnees

Le plan de gestion des données est un outil de gestion. Il se présente sous forme d’un document structuré en rubriques. Il a pour objectif de synthétiser la description et l’évolution des jeux de données de votre projet de recherche. Il prépare le partage, la réutilisation et la pérennisation des données.

Voir données de la recherche, FAIR Data, OPIDoR

Voir aussi le site de DoRANum - Cours en ligne (formation URFIST)

Plateforme

id : plateforme
types : Technologies et familles d’outils
mots-clés :
filename : plateforme

Une plateforme informatique est un espace de travail virtuel qui permet d’utiliser un ensemble de logiciels, de stocker et de diffuser des données, et enfin de travailler à plusieurs. Elle se confond souvent avec un site internet (qui n’est basé que sur une seule technologie) ou avec une bibliothèque numérique (qui rassemble des contenus ayant un lien entre eux).

Plugin

id : plugin
types : Technologies et familles d’outils
mots-clés :
filename : plugin

En informatique, un plugin ou plug-in, aussi nommé module greffon ou plugiciel (ou extension dans les CMS ou Omeka), est un paquet structuré de codes informatiques qui complète un logiciel hôte pour lui apporter de nouvelles fonctionnalités.

PNG

id : png
types : Pratiques et méthodes
mots-clés :
filename : png

PNG (Portable Network Graphics) : format d’image ouvert standardisé par le W3C. Il a été conçu pour contourner le format GIF devenu semi-propriétaire et restrictif (nombre de couleurs notamment). Il s’agit d’une alternative intéressante par rapport au format JPEG car sa compression n’est pas destructive, ce qui implique aussi que son poids sera plus important.

Malgré de nombreux avantages (gestion de la transparence notamment), il reste encore peu utilisé car souvent associé à un usage web uniquement.

Pocket

id : pocket
types : Outils logiciels
mots-clés :
filename : pocket

Pocket un est outil de veille documentaire qui permet de télécharger, sauvegarder, archiver, partager et tagger des liens hypertextes sur son ordinateur et/ou sur son smartphone.

Grâce au téléchargement, il est possible de lire les pages web sélectionnées hors connexion.

Site web : https://getpocket.com

Post-édition

id : post-édition
types : Pratiques et méthodes
mots-clés :
filename : post-edition

La post-édition désigne l’activité qui consiste à repasser derrière un texte pré-traduit automatiquement pour le rendre humainement intelligible. Le langagier chargé d’effectuer cet exercice, à savoir le post-éditeur, a donc pour tâche de compléter, modifier, corriger, remanier, réviser et relire ce texte brut.

Voir Traduction ; Traduction automatique.

En savoir plus : https://journals.openedition.org/traduire/460.

PostGIS

id : postgis
types : Pratiques et méthodes
mots-clés :
filename : postgis

Extension externe à PostgreSQL qui ajoute un support pour les objets géographiques. Elle permet d'exécuter des requêtes de localisation en SQL et peut être directement exploité dans plusieurs logiciels SIG.

PostgreSQL

id : postgresql
types : Outils logiciels
mots-clés :
filename : postgresql

PostgreSQL est un système open source de gestion de base de données relationnelles développé par l’université de Californie. Son nom a repris le nom du langage SQL qu’il utilise pour plusieurs fonctionnalités notamment les requêtes.

Site web : https://www.postgresql.org/

Praat

id : praat
types : Outils logiciels
mots-clés :
filename : praat

Praat est un package logiciel d’analyse phonétique et phonologique de corpus oraux.

Site web : https://www.fon.hum.uva.nl/praat/

Pré-publication

id : pré-publication
types : Pratiques et méthodes
mots-clés :
filename : pre-publication

La pré-publication (ou preprint) est la version d’un article scientifique antérieure à la publication dans une revue scientifique et généralement antérieure à la révision par les pairs.

La pré-publication peut être déposée en libre accès via des serveurs dédiés ou des archives ouvertes telles que HAL.

PROGEDO

id : progedo
types : Groupements institutionnels
mots-clés :
filename : progedo

L’infrastructure de recherche PROGEDO a pour but de développer la culture des données, d’impulser et structurer une politique des données d’enquêtes pour la recherche en sciences sociales.

Quetelet-Progedo-Diffusion contribue à répondre aux problématiques d’archivage, de documentation et de diffusion des données françaises pour la recherche en sciences humaines et sociales. Le Centre d'Accès Sécurisé aux Données (CASD) organise l'accès aux données confidentielles. L'infrastructure organise enfin l'accès aux enquêtes internationales européennes ainsi qu'autres catalogues de données comme l'Inter-university Consortium for Political and Social Reasearch (ICPSR) américain.

Site web : https://www.progedo.fr/

Progiciel

id : progiciel
types : Technologies et familles d’outils
mots-clés :
filename : progiciel

Un progiciel est un ensemble de programmes informatiques élaborés pour être fourni à plusieurs utilisateurs en vue d’une même application ou d’une même fonction.

Il s’agit donc d’une catégorie de logiciels qui répond aux besoins communs de plusieurs utilisateurs à la différence des logiciels développés au sein d’une entreprise pour répondre à un besoin spécifique à cette entreprise.

Le terme est également employé pour désigner les logiciels professionnels composés de plusieurs modules communiquant entre eux et dont chacun assure une fonction.

Programmation informatique

id : programmation informatique
types : Pratiques et méthodes
mots-clés :
filename : programmation_informatique

Dans le domaine de l'informatique, la programmation, appelée aussi codage, est l'ensemble des activités qui permettent l'écriture des programmes informatiques. C'est une étape importante du développement de logiciels (voire de matériel).

Site web de MOOCs pour se former en programmation : https://www.my-mooc.com/fr/categorie/programmation

Programme informatique

id : programme informatique
types : Pratiques et méthodes
mots-clés :
filename : programme_informatique

Un programme informatique est un ensemble d'opérations destinées à être exécutées par un ordinateur. Un programme source est un code écrit par un informaticien dans un langage de programmation. Il peut être compilé vers une forme binaire, ou directement interprété.

Protégé

id : protégé
types : Outils logiciels
mots-clés :
filename : protege

Protégé est un logiciel qui permet la création d'ontologies. Il peut lire, créer, et sauvegarder des fichiers d'ontologie dans la plupart des formats : RDF, RDFS, OWL.

Site web : https://protege.stanford.edu/

Tutorial: https://www.youtube.com/watch?v=LQ4iW3PO36E

Python

id : python
types : Pratiques et méthodes
mots-clés :
filename : python

Python est langage informatique de programmation majoritairement utilisé dans les domaines de Data Science, Big Data et Machine Learning. Il permet d’automatiser l’écriture de script ce qui facilite son utilisation et fonctionne sur tous les principaux systèmes d’exploitation.

Il est employé à différentes fonctions comme la création de logiciel, l’analyse de données, la gestion d’infrastructures, à l’inverse du langage HTML dédié à la programmation web.

QGIS

id : qgis
types : Outils logiciels
mots-clés :
filename : qgis

QGIS est un logiciel libre et open source de traitement des données géographiques. Il est multi-plateforme et peut être utilisé sur plusieurs systèmes d’exploitation.

Il gère à la fois les , ainsi que les bases de données.

QGIS est une alternative à ArcGIS et fédère une large communauté. Il implique de nombreuses dépendances comme SQLite, GDAL ou PostGIS.

Site web : https://www.qgis.org/fr/site/

QR Code

id : qr code
types : Pratiques et méthodes
mots-clés :
filename : qr_code

Le QR Code (Quick Response Code) est un code-barre en deux dimensions dont l’agencement des points (noirs sur fond blanc) définit l’information contenue dans le code.

Ce code permet de stocker des données facilement lues par des applications et déclenchant des actions telles que la connexion à un site web, l’envoi d’un SMS, la connexion à une borne wifi, l’affichage d’un texte.

Il est lisible par les téléphones mobiles pourvus d’une application dédiée à sa lecture.

QUANTI

id : quanti
types : Groupements institutionnels
mots-clés :
filename : quanti

La liste de discussion "Quanti", créée après la journée d'études "Enseigner le quanti" qui a eu lieu à Paris le 5 juin 2015, a pour vocation d'accueillir les contributions et les échanges de toutes celles et tous ceux qui s'intéressent aux questions d'enseignement des méthodes quantitatives dans les sciences sociales.

Le wiki de la liste de diffusion propose une liste de logiciels généralistes et de logiciels spécialisés pour la construction et l'analyse de données d'enquêtes ou encore de données textuelles et de réseaux.

Site web : https://groupes.renater.fr/sympa/info/quanti

R

id : r
types : Outils logiciels, Technologies et familles d’outils
mots-clés :
filename : r

R est un outil de programmation (comme SPSS ou SAS, par exemple) et un langage de programmation.

Il permet de manipuler des données, faire des calculs et créer des graphiques. Il est libre et ouvert au développement, chaque utilisateur peut développer ses propres packages.

RAMEAU

id : rameau
types : Ressources
mots-clés :
filename : rameau

RAMEAU, pour Répertoire d’Autorité-Matière Encyclopédique et Alphabétique Unifié, est langage documentaire d’indexation matière. Le langage RAMEAU permet l’indexation analytique de tous les types de documents. Il s’agit d’un répertoire qui contient des notices d’autorité-matière reliées entre elles et qui permet la recherche par sujet dans les catalogues.

Site web : https://www.bnf.fr/fr/indexation-sujet-les-referentiels-utilises-par-la-bnf#bnf-rameau

RawGraphs

id : rawgraphs
types : Outils logiciels
mots-clés :
filename : rawgraphs

RawGraphs est un outil en ligne de visualisation de données tabulaires. Il est possible de télécharger les visualisations ainsi constituées sous forme d’images prêtes à la publication ou sous forme de fichiers .svg pouvant être retravaillés avec des logiciels d’édition d’images vectorielles.

Site web : https://app.rawgraphs.io

RCommander

id : rcommander
types : Outils logiciels
mots-clés :
filename : rcommander

RCommander (Rcmdr) est un package R. Son interface graphique permet à l'utilisateur l'analyse statistique de documents textuels sans avoir à programmer, à rédiger des scripts R.

RDA-FR

id : rda-fr
types : Pratiques et méthodes
mots-clés :
filename : rda-fr

Le RDA est un code de catalogage à vocation internationale qui fonde ses règles d’identification et de description des ressources sur le modèle FRBR.

Le RDA-FR constitue la transposition du code RDA au contexte de catalogage français. Il remplace progressivement les normes AFNOR de catalogage.

RDF

id : rdf
types : Pratiques et méthodes
mots-clés :
filename : rdf

RDF (Resource Description Framework) : modèle simplifié de description de données dont le principe de base consiste à transformer l’information des ressources afin qu’elles puissent être lisibles par les machines et permettre, par conséquent, la création de liens à partir des valeurs des relations. Sa « grammaire » est constituée de triplets de trois éléments : sujet, prédicat et objet. Les données RDF sont stockées dans un triple store.

Voir Web sémantique.

Re3Data

id : re3data
types : Ressources
mots-clés :
filename : re3data

Il s’agit d’un répertoire mondial qui recense les entrepôts de données de recherche.

Il fournit un moteur de recherche qu’il est notamment possible d’interroger par discipline.

Site web : https://www.re3data.org/search

React

id : react
types : Outils logiciels
mots-clés :
filename : react

React est une bibliothèque JavaScript open source utilisée pour la création d’interfaces utilisateur interactives et réactives. Il est possible d’ajouter React à une page HTML de manière très facile. React est très utilisé pour concevoir des sites web ou bien des applications mobiles.

Site web : https://react.dev/

Tutoriel : https://www.youtube.com/watch?v=Ke90Tje7VS0&ab_channel=ProgrammingwithMosh

READ

id : read
types : Outils logiciels
mots-clés :
filename : read

Recognition and Enrichment of Archival Documents. Plateforme de transcription et outil de reconnaissance automatique d’écriture manuscrite (HTR).

Voir Transkribus, eScriptorium

Reaveal.js

id : reaveal.js
types : Outils logiciels
mots-clés :
filename : reaveal.js

Reaveal.js est une librairie javascript open source servant à créer des présentations diaporama sur le web en codant en HTML. Un éditeur visuel nommé Slides a été développé pour ceux qui n’ont pas de compétences en codage. Cette librairie inclut un module d’écriture en markdown et un autre en LaTeX. Elle permet de faire des animations, d’intégrer des notes audios, ou encore d’exporter en pdf la présentation.

Site web : https://revealjs.com/

Recherche à facettes

id : recherche à facettes
types : Pratiques et méthodes
mots-clés :
filename : recherche_a_facettes

La recherche à facettes est basée sur une classification préalable des données qui fonctionne à la manière d'un crible : les facettes proposent un résultat en fonction de l'indexation des données à l'intérieur de la classification.

Elle se distingue de la recherche avancée en ce qu'elle ne permet pas de construire des requêtes personnalisées, par exemple en ajoutant des opérateurs booléens (« et », « ou », « sauf »).

Recherche avancée

id : recherche avancée
types : Pratiques et méthodes
mots-clés :
filename : recherche_avancee

Recherche par requête ou multi-critères. La recherche avancée peut aussi porter sur des métadonnées ou des annotations.

Voir Opérateurs booléens

Recherche plein texte

id : recherche plein texte
types : Pratiques et méthodes
mots-clés :
filename : recherche_plein_texte

La recherche plein texte consiste en une technique de recherche au sein d’un document électronique ou d’une base de données textuelles, dans laquelle le moteur de recherche examine tous les mots (chaînes ou suites de caractères) de chaque document enregistré.

Recherche simple

id : recherche simple
types : Pratiques et méthodes
mots-clés :
filename : recherche_simple

La recherche simple se concentre sur un seul champ de recherche (mot, auteur, titre), à l’inverse de la recherche avancée qui permet de croiser plusieurs critères de recherche (titre et auteur ; titre, auteur et date de publication, etc.).

Référencement

id : référencement
types : Pratiques et méthodes
mots-clés :
filename : referencement

Le référencement est, sur le web, l’action de référencer, c’est-à-dire d’indexer toutes les pages web présentes, en faisant un lien d’une page vers une ressource, généralement un moteur de recherche.

Aujourd’hui, le référencement consiste surtout à améliorer la place d’un site dans les résultats afin d’être le plus consulté possible. Pour cela il existe deux pratiques :

  • le SEO pour Search engine optimization, aussi nommé « référencement naturel », qui est un ensemble de techniques et méthodes pour améliorer le classement de son site dans les pages de résultat d’un moteur de recherche ;

  • le SEA pour Search Engine Advertising, qui est une pratique marketing payante visant le même objectif.

Voir : http://aide.meabilis.fr/glossaire/r/definition-referencement.html

Référentiel

id : référentiel
types : Pratiques et méthodes
mots-clés :
filename : referentiel

Ensemble d'informations servant de références, parce qu'elles font autorité, ou parce qu'elles représentent un point de vue privilégié ou offrent une description stable d'une réalité. Un dictionnaire, une nomenclature, un système de coordonnées sont des référentiels.

Certains référentiels sont constitués de données structurées selon des schémas et/ou des vocabulaires standardisés afin de pouvoir être mis en commun d'un système d’information à un autre. Plus généralement on appelle souvent référentiel un thésaurus vérifié et contrôlé permettant d'enrichir des données au sein d'un système d'information.

AURéHAL donne accès par exemple à l'ensemble des référentiels utilisés par la base de données de l'archive ouverte HAL, sous forme de thésaurus contrôlés. Certains de ces thésaurus sont ouverts (celui des auteurs peut être enrichi par les interventions des usagers de l'archive), d'autres sont fermés (le thésaurus des domaines de recherche associés aux publications par exemple). Pour produire et exposer des données de bonne qualité, la plupart des instruments numériques s'appuient sur de tels référentiels, ouverts ou fermés : l'un des plus impressionnant est Rameau qui tient lieu de méta-référentiel pour les données des catalogues de la BNF et les données d'autorité.

Voir Base de données ; Interopérabilité.

Exemples : voir Geonames, Rameau, VIAF.

Ressources web : Référentiels d'Isidore ; Référentiels de la BNF

RENATER

id : renater
types : Groupements institutionnels
mots-clés :
filename : renater

RENATER est le REseau NAtional de télécommunication pour la Technologie, l’Enseignement et la Recherche.

Il s'agit d'un groupement français d’intérêt public créé en 1993 qui assure la gestion du réseau d’interconnexion entre les établissements d’enseignement et de recherche.

Site web : https://www.renater.fr/

RePEc

id : repec
types : Outils logiciels, Ressources
mots-clés :
filename : repec

RePEc (Research Papers in Economics) est un projet collaboratif dont le principal outil développé est une base de données bibliographique décentralisée spécialisée dans la recherche économique.

La base de données recense des papiers de recherche, des articles, des programmes et des logiciels. Les métadonnées collectées sont ensuite utilisées dans divers services tels que EconPapers, IDEAS, NEP ou encore LogEc.

Le réseau RePEc propose d'autres services :

  • RePEc Author Service : fournit un profil utilisateur au chercheur en économie qui le souhaite ;

  • RePEc Biblio : assure une veille bibliographique en économie et fournit de nombreuses bibliographies thématiques régulièrement mises à jour ;

  • RePEc Genealogy : permet de relier les profils de chercheurs entre eux selon des liens tels que « étudiant-professeur » ;

  • SocioRePEc : permet d’annoter les ressources documentaires en PDF et d’établir des relations scientifiques entre les ressources.

Voir aussi : CollEc, CitEc

Site web : http://repec.org

Répertoire

id : répertoire
types : Pratiques et méthodes
mots-clés :
filename : repertoire

Inventaire méthodique (énumération, liste, table, etc.) où les informations sont classées dans un ordre qui permet de les retrouver facilement, support d’informations. En informatique, un répertoire (dossier ou folder) est une liste de descriptions de fichiers. L’endroit de rangement de nos fichiers informatiques.

Requête

id : requête
types : Pratiques et méthodes
mots-clés :
filename : requete

En informatique, le terme requête peut prendre plusieurs sens. Il peut s’agir d’une expression saisie dans un navigateur internet pour interroger un moteur de recherche afin de trouver l’adresse d’un site. Il désigne également l’URL d’une page web, saisie dans la barre d’adresse du navigateur web pour atteindre cette page.

Dans le monde des bases de données, une requête SQL est un ordre d’exécution de traitement sur les données (extraction ou modification de données, par exemple).

Réseau de neurones

id : réseau de neurones
types : Pratiques et méthodes
mots-clés :
filename : reseau_de_neurones

En informatique, un réseau de neurones est un système qui imite le fonctionnement des neurones biologiques.

Les réseaux neuronaux, appelés RNA (réseaux de neurones artificiels) ou ANN (Artificial Neural Network) font partie des technologies utilisées en deep learning ou intelligence artificielle (IA).

Résolveur de liens

id : résolveur de liens
types : Pratiques et méthodes
mots-clés :
filename : resolveur_de_liens

Un résolveur de lien est un outil informatique qui permet de faire le lien entre une citation bibliographique et le texte intégral d’une ressource documentaire numérique pour laquelle une bibliothèque a souscrit un abonnement.

Cet outil s’appuie sur la norme OpenURL qui décrit la syntaxe pour l’acheminement des métadonnées depuis la ressource jusqu’au résolveur de liens et jusqu’aux services de la bibliothèque.

Ressource électronique

id : ressource électronique
types : Pratiques et méthodes
mots-clés :
filename : ressource_electronique

Une ressource électronique est un document encodé de façon à être exploitable par un ordinateur.

Rétroconversion

id : rétroconversion
types : Pratiques et méthodes
mots-clés :
filename : retroconversion

Informatisation d’un catalogue papier afin de le rendre consultable via un catalogue en ligne. L’informatisation des catalogues permet aux lecteurs de pouvoir effectuer des requêtes plus ou moins complexes (recherche simple / recherche avancée) sur les collections, et offre de nouveaux services tels que l’affinage des résultats par facettes (recherche à facettes).

On parle aussi de plus en plus de rétroconversion pour tout processus de mise à disposition numérique d'un contenu auparavant imprimé (pour des anciens numéros de revues par exemple).

RGPD

id : rgpd
types : Pratiques et méthodes
mots-clés :
filename : rgpd

L’acronyme RGPD, « Règlement Général sur la Protection des Données », encadre le traitement des données personnelles sur le territoire de l’Union européenne.

Le contexte juridique s’adapte pour suivre les évolutions des technologies et de nos sociétés (usages accrus du numérique, développement du commerce en ligne, etc.). Ce nouveau règlement européen s’inscrit dans la continuité de la Loi française Informatique et Libertés de 1978 et renforce le contrôle par les citoyens de l’utilisation qui peut être faite des données les concernant. Il harmonise les règles en Europe en offrant un cadre juridique unique aux professionnels. Il permet de développer leurs activités numériques au sein de l’UE en se fondant sur la confiance des utilisateurs.

Voir : Définition sur le site de la CNIL

Rip Sentences

id : rip sentences
types : Outils logiciels
mots-clés :
filename : rip_sentences

Rip Sentences extrait le texte d’une page web spécifique et force les sauts de ligne entre les phrases.

Site web : https://tools.digitalmethods.net/beta/sentences/

Robots.txt Discovery

id : robots.txt discovery
types : Outils logiciels
mots-clés :
filename : robots.txt_discovery

Cet outil permet d’exposer le protocole d’exclusion des robots, protocole placé à la racine des sites web et qui contient la liste des ressources des sites web qui ne doivent pas être indexées par les moteurs de recherche.

Site web : https://tools.digitalmethods.net/robots/

RSS

id : rss
types : Pratiques et méthodes
mots-clés :
filename : rss

Le RSS (Really Simple Syndication) est une famille de formats basée sur le langage XML dont l’objectif est la syndication de contenus web. Il est souvent utilisé pour obtenir des mises à jour d’information et effectuer de la veille informationnelle.

Un flux RSS est un fichier contenant une liste de contenus ou de pages web. Cette liste peut présenter les diverses métadonnées associées aux contenus ou aux pages web ainsi que les liens permettant d’y accéder.

SailAlign

id : sailalign
types : Outils logiciels
mots-clés :
filename : sailalign

SailAlign constitue un boîte à outils d’alignement phonétique acceptant de très longues séquences et prenant en charge les langues anglaise et espagnole.

Site web : http://cvsp.cs.ntua.gr/~nassos/sail_align.html

Sandcrawler

id : sandcrawler
types : Outils logiciels
mots-clés :
filename : sandcrawler

Sandcrawler est une librairie JavaScript fournissant des outils d’aide à la conception de crawlers et de scrapers complexes.

Cette librairie est considérée comme archivée, n'étant plus maintenue depuis longtemps.

Voir aussi : Web scraping

Site web : http://medialab.github.io/sandcrawler/

Science ouverte

id : science ouverte
types : Groupements institutionnels, Pratiques et méthodes
mots-clés :
filename : science_ouverte

Le mouvement de la science ouverte (open science) vise à construire un écosystème dans lequel la science sera plus cumulative, mieux soutenue par les données, plus transparente, plus rapide et offrant un accès universel. Il s’agit de rendre la recherche scientifique et les données qu’elle produit accessibles à tous et dans tous les niveaux de la société.

Ce mouvement oeuvre pour des sciences participatives et citoyennes.

Voir Open archives (archive ouverte) ; HAL ; Open data (donnée ouverte) ; Open access (Accès ouvert), Épi-revue ; Episciences, Couperin

Site web : https://www.ouvrirlascience.fr/open-science/

Définition sur le site du MESR - L'Open Science sur le site de l'université d'Angers

ScienceScape

id : sciencescape
types : Outils logiciels
mots-clés :
filename : sciencescape

ScienceScape est un environnement en ligne fournissant des outils scientométriques tels que des outils de conversion de fichiers ou encore de production et de visualisation de réseaux.

Site web : https://medialab.github.io/sciencescape/

Sciencesconf

id : sciencesconf
types : Outils logiciels
mots-clés :
filename : sciencesconf

Sciencesconf est une plateforme web multilingue à destination des organisateurs de colloques, conférences scientifiques, workshops. Elle est réservée aux établissements de l’enseignement supérieur et de la recherche.

Elle permet de gérer et de faciliter les différentes étapes de planification des manifestations scientifiques : de la réception des contributions en passant par la relecture et la programmation des axes et thématiques jusqu’à l’édition automatique des actes.

Il s’agit d’un service géré par le CCSD.

Site web : https://www.ccsd.cnrs.fr/gestion-de-colloques/

Scoop-it

id : scoop-it
types : Outils logiciels
mots-clés :
filename : scoop-it

Scoop-it est un outil de veille et de curation de contenu qui permet de créer des pages web thématiques alimentées par les contenus découverts grâce à la veille et de les partager avec d’autres utilisateurs.

Site web : https://www.scoop-it.fr

Screenshot Generator

id : screenshot generator
types : Outils logiciels
mots-clés :
filename : screenshot_generator

Il s’agit d’un outil permettant de générer des captures d’écran à partir d’une liste d’URLs.

Site web : https://wiki.digitalmethods.net/Dmi/ToolScreenshotGenerator

Scripta-PSL

id : scripta-psl
types : Groupements institutionnels
mots-clés :
filename : scripta-psl

Le programme Scripta-PSL vise à relier les sciences fondamentales de l’écrit (paléographie, épigraphie, codicologie, etc.) ainsi que d’autres SHS comme la linguistique, l’histoire ou encore l’anthropologie aux humanités numériques autour de l’étude de l’écrit.

Site web : https://scripta.psl.eu/presentation/

SeeAlsology

id : seealsology
types : Outils logiciels
mots-clés :
filename : seealsology

SeeAlsology est un outil permettant d’explorer la zone sémantique des pages wikipédia en produisant un graphe des liens de la section « Voir aussi » des articles.

Site web : https://densitydesign.github.io/strumentalia-seealsology/

Serveur

id : serveur
types : Pratiques et méthodes
mots-clés :
filename : serveur

Un serveur informatique est un ordinateur qui offre des services à un ou plusieurs clients (parfois des milliers). Généralement, on parle de serveur pour désigner la machine qui héberge et diffuse des sites internet.

Shapefile

id : shapefile
types : Pratiques et méthodes
mots-clés :
filename : shapefile

Shapefile (.shp) : format de fichier SIG le plus courant développé et publié par ESRI en 1998 en parallèle du SIG ArcGIS. De spécification ouverte, ce format est devenu un standard, utilisé par la plupart des logiciels SIG (libres ou commerciaux). Il consiste en une collection de fichiers de même noms et d'extensions propres, dont trois sont obligatoires : .SHP (la forme géométrique), .SHX (l'index de la géométrie) et .DBF (les données attributaires).

ShareDocs

id : sharedocs
types : Outils logiciels
mots-clés :
filename : sharedocs

ShareDocs est une plateforme de gestion de fichiers. Il s’agit d’un service développé par Huma-Num qui permet le stockage et le partage de fichiers.

Le stockage est déporté en ligne sur le réseau de recherche français. Les données hébergées peuvent être cryptées grâce à des outils comme ZED encrypt. ShareDocs est souvent utilisé pour la préparation de fichiers en vue d’une édition ou d’une diffusion en ligne.

Site web : https://documentation.huma-num.fr/sharedocs-stockage/

SHS

id : shs
types : Pratiques et méthodes
mots-clés :
filename : shs

Les Sciences Humaines et Sociales (SHS) sont un ensemble de disciplines s'intéressant aux phénomènes qui touchent à l'humain (linguistique, psychologie, perception, cognition) ou aux groupes d'hommes (sociologie, histoire, géographie, etc.).

SIG

id : sig
types : Technologies et familles d’outils
mots-clés :
filename : sig_websig

Le terme de système d’information géographique renvoie aussi bien à des technologies, qu’à des processus et méthodes. Les logiciels de SIG sont conçus pour acquérir, stocker, traiter et diffuser de l’information géographique, sous forme de plans et de cartes.

Ces logiciels sont parfois disponibles sous forme d’application disponibles sur des sites web, on les appelle alors WebSIG.

Voir Géomatique, Chronocarto, ArcGIS, QGIS, GrassGIS, GeoServer

Sigma.js

id : sigma.js
types : Outils logiciels
mots-clés :
filename : sigma.js

Sigma.js est une librairie JavaScript permettant de visualiser des réseaux directement dans le navigateur.

Site web : http://sigmajs.org

Signet

id : signet
types : Pratiques et méthodes
mots-clés :
filename : signet_ou_bookmark

A l’origine, un signet (bookmark) s’apparente à un marque-page. Il s’agit d’un ruban ou d’un filet inséré entre deux pages d’un livre de façon à signaler l’endroit que l’on souhaite retrouver.

Du point de vue numérique, le signet constitue un mode d’accès rapide à un site web dont l’adresse est préalablement stockée en mémoire par l’internaute. Un signet ne stocke que la localisation d’un site ou d’une page web et pas son contenu. Il est possible de créer des répertoires de signets pour conserver et classer plusieurs adresses électroniques.

SILL

id : sill
types : Pratiques et méthodes, Ressources
mots-clés :
filename : sill

Le SILL, socle interministériel des logiciels libres, est un catalogue de logiciels recommandés pour les administrations.

Site web : https://sill.etalab.gouv.fr/software

Site

id : site
types : Pratiques et méthodes
mots-clés :
filename : site

Un site web, ou simplement site, est un ensemble de pages web et de ressources reliées par des liens hypertextes ; il est défini et accessible par une adresse web. Un site est hébergé sur un serveur web accessible via le réseau mondial internet ou via un intranet local. L’ensemble des sites web constitue le World Wide Web.

Sketch Engine

id : sketch engine
types : Outils logiciels, Ressources
mots-clés :
filename : sketch_engine

Sketch Engine est une plateforme qui héberge des corpus. Il permet d'analyser des textes en langue naturelle, et prend en charge plus de 90 langues. Il est utilisé par les linguistes, les traducteurs.

Site web : https://www.sketchengine.eu/

SKOS

id : skos
types : Technologies et familles d’outils
mots-clés :
filename : skos

Le SKOS (Simple Knowledge Organization System, en français système simple d’organisation des connaissances), est un modèle de données servant à décrire un vocabulaire structuré tel qu'un thésaurus. Le SKOS est développé par le W3C, en suivant le format RDF afin d’être interopérable.

Site web : https://www.w3.org/TR/2009/REC-skos-reference-20090818/

SKOS Play

id : skos play
types : Outils logiciels
mots-clés :
filename : skos_play

SKOS Play est un service en ligne gratuit de visualisation de thésaurus suivant le format SKOS. Il permet pour un vocabulaire d’en vérifier la conception, de le communiquer à des collaborateurs, de le publier, et d’en faire des représentations graphiques. L’outil propose également de convertir des feuilles de calcul Excel en fichier SKOS.

Site web : https://skos-play.sparna.fr/play/

Software Heritage

id : software heritage
types : Outils logiciels, Pratiques et méthodes
mots-clés :
filename : software_heritage

Software Heritage est une plateforme d’archivage de logiciels open source sous la forme de leur code source. Elle est développée par l’INRIA (l’Institut national de recherche en sciences et technologies du numérique).

Site web : https://www.softwareheritage.org/

SPARQL

id : sparql
types : Pratiques et méthodes
mots-clés :
filename : sparql

SPARQL est un langage informatique de programmation. Plus précisément, il s’agit d’un langage de requête et d’un protocole.

Il permet de récupérer, de rechercher, ajouter, modifier et supprimer des données de type RDF disponibles sur Internet. Il est équivalent au langage SQL mais il respecte les standards du W3C et permet la transmission des données à travers le réseau.

SPARQL peut récupérer les données stockées sur des serveurs SPARQL, autrement appelés Triple Store. Souvent, SPARQL est utilisé conjointement à un autre langage de programmation.

SpartiaLite

id : spartialite
types : Pratiques et méthodes
mots-clés :
filename : spartialite

Bibliothèque open source qui étend la bibliothèque SQLite (base de données relationnelle accessible par le langage SQL) en lui donnant des capacités spatiales.

SPPAS

id : sppas
types : Outils logiciels
mots-clés :
filename : sppas

SPAAS est un logiciel d’annotations phonétiques automatisé avec alignement son-texte qui prend en charge plusieurs langues européennes et asiatiques.

Site web : http://www.sppas.org

SQL

id : sql
types : Pratiques et méthodes
mots-clés :
filename : sql

Le SQL (Structured Query Language) est un langage informatique de définition et de manipulation des données ainsi qu’un langage de protection d’accès. Autrement dit, il permet de créer, modifier ou supprimer des tables dans une base de données relationnelle.

Il permet également de sélectionner, modifier, insérer ou supprimer des données au sein d’une table d’une base de données relationnelles.

Avec SQL, il est enfin possible de définir différentes permissions d’accès en fonction des utilisateurs de la base de données, on parle alors de DCL (Data Control Language).

Voir MCD, SPARQL

Star

id : star
types : Outils logiciels
mots-clés :
filename : star

Star est une application professionnelle nationale mise à disposition des établissements habilités à délivrer le diplôme de doctorat.

Cette application sert au signalement et à l’archivage des thèses au format électronique.

Site web : https://abes.fr/reseau-theses/outils-et-services-theses/signalement-theses/

Stylo

id : stylo
types : Outils logiciels
mots-clés :
filename : stylo

Stylo est un éditeur de textes scientifiques qui simplifie la rédaction et l’édition d’articles scientifiques en SHS.

Stylo comprend plusieurs modules : un éditeur de métadonnées, un gestionnaire de versions, un gestionnaire de bibliographie, un outil d’annotation, différents formats d’export, le partage des documents dans le cas d’une édition collaborative.

Site web : https://documentation.huma-num.fr/stylo/

Stylométrie

id : stylométrie
types : Outils logiciels
mots-clés :
filename : stylometrie

En linguistique, la stylométrie est une méthode de fouille de texte qui utilise les statistiques pour définir le style d’un texte.

Voir Textométrie

SVG

id : svg
types : Pratiques et méthodes
mots-clés :
filename : svg

SVG (Scalable Vector Graphics) est un format de données basé sur le langage XML qui permet notamment de décrire des images vectorielles.

Il s’agit d’un format utilisé, entre autres, dans le domaine de la cartographie.

Système d’information

id : système d’information
types : Pratiques et méthodes
mots-clés :
filename : systeme_d'information

Système constitué des ressources humaines (le personnel), des ressources matérielles (l’équipement) et des procédures permettant d’acquérir, de stocker, de traiter et de diffuser les éléments d’information pertinents pour le fonctionnement d’une entreprise ou d’une organisation.

Dans une institution ou une entreprise, le sigle DSI correspond souvent à : "Département du Système d'Informations"

Table 2 Net

id : table 2 net
types : Outils logiciels
mots-clés :
filename : table_2_net

Table 2 Net est un outil qui permet de créer un graphique de réseau à partir d’un fichier CSV.

Site web : https://medialab.github.io/table2net/

TACT

id : tact
types : Outils logiciels
mots-clés :
filename : tact

TACT est une plateforme collaborative de transcription et d’annotation de corpus textuels.

Site web : https://tact.demarre-shs.fr

Tag

id : tag
types : Pratiques et méthodes
mots-clés :
filename : tag

Terme anglais qu’on traduit par « étiquette » ou « mot-clé », le tag est une caractéristique attribuée à l’objet décrit. Il permet des regroupements des objets selon les mots-clés associés (lesquels se rapportent souvent à des thématiques). C’est une métadonnée complexe à spécifier : pour que l'indexation soit pertinente, il convient de choisir un nombre limité de mots-clés ou thématiques, et d'éviter les redondances.

Une visualisation par nuage de tags est une représentation visuelle des tags les plus utilisés sur un site web : généralement, les tags s'affichent dans des tailles et des polices de caractères d'autant plus visibles qu'ils sont utilisés ou populaires.

Tag Cloud Combinator

id : tag cloud combinator
types : Outils logiciels
mots-clés :
filename : tag_cloud_combinator

En entrant deux ou plusieurs nuages de mots-clés dans cet outil, il fait la somme de la valeur de chacun des mots-clés en double et les combine.

Voir Tag

Site web : https://tools.digitalmethods.net/beta/tagCloudCombinator/

Tag Cloud Generator

id : tag cloud generator
types : Outils logiciels
mots-clés :
filename : tag_cloud_generator

Cet outil permet de produire des nuages de mots-clés en entrant des tags et leur valeurs. Le résultat se traduit sous forme de fichier SVG.

Site web : https://tools.digitalmethods.net/beta/svgcloud/

Tag Cloud HTML Generator

id : tag cloud html generator
types : Outils logiciels
mots-clés :
filename : tag_cloud_html_generator

Cet outil permet de produire des nuages ou des listes de mots-clés au format HTML en utilisant des tags et des valeurs au format wordle.

Site web : https://wiki.digitalmethods.net/Dmi/ToolTagCloudHTMLGenerator

Tag Cloud to Wordle

id : tag cloud to wordle
types : Outils logiciels
mots-clés :
filename : tag_cloud_to_wordle

Cet outil permet de transformer un nuages de mots-clés en un nuage de mots-clés wordle.

Voir Tag

Site web : https://tools.digitalmethods.net/beta/tagcloudToWordle/

TAL

id : tal
types : Pratiques et méthodes
mots-clés :
filename : tal

Le traitement automatique des langues (TAL) est un domaine de recherche pluridisciplinaire au carrefour de la linguistique, de l’informatique et de l’intelligence artificielle (en particulier l’apprentissage artificiel). Il entretient aussi des liens privilégiés avec d’autres domaines, comme la didactique ou les sciences cognitives.

Le TAL vise à modéliser le langage humain à des fins d’automatisation au moyen de méthodes symboliques et statistiques ; récemment, les approches neuronales (apprentissage profond) ont permis des avancées importantes. Le TAL utilise et produit des outils logiciels et des ressources linguistiques.

Le TAL peut permettre de repérer les entités nommées dans un texte, identifier des concepts, des acteurs et leurs relations ou encore regrouper les documents similaires dans un corpus (clusterisation). La traduction automatique ou la recherche d’informations multilingues (par exemple dans des bases de brevets) sont des applications phares du TAL. À un niveau plus théorique, le TAL a aussi permis des avancées importantes dans des domaines comme l’acquisition du langage ou la modélisation de l’évolution des langues (diachronie).

Talend

id : talend
types : Pratiques et méthodes
mots-clés :
filename : talend

Talend est un logiciel qui permet de répondre à toutes les problématiques liées au traitement des données. Le logiciel permet de nettoyer des bases de données au format csv par exemple.

Site web : https://www.talend.com/fr/

Tutoriel : https://www.youtube.com/watch?v=HlAXBcEKZ0s&list=PL1YiNEARI38JZPPenoA2ueRHzT3wWGXv6

TEI

id : tei
types : Groupements institutionnels, Pratiques et méthodes
mots-clés :
filename : tei

La TEI (Text Encoding Initiative) est un consortium fondé pour normaliser l'usage du langage XML pour l'encodage sémantique de textes historiques et littéraires. Par extension, on appelle TEI l'ensemble des balises et leurs règles d'application telles que définies et régulièrement mises à jour par le consortium.

Site web : https://tei-c.org/

Telemeta

id : telemeta
types : Outils logiciels
mots-clés :
filename : telemata

Telemata est un logiciel qui permet l’archivage sécurisé, la sauvegarde, le transcodage, l’analyse et la publication de fichiers audios et vidéos auxquels sont liées des métadonnées approfondies.

Site web : http://telemeta.org

Tesselle

id : tesselle
types : Outils logiciels
mots-clés :
filename : tesselle

Tesselle est une application web qui permet l’exploitation de ressources iconographiques. Elle permet notamment d’annoter des images de grand format et en haute définition.

Site web : https://medialab.github.io/tesselle/#/

Tesseract

id : tesseract
types : Outils logiciels
mots-clés :
filename : tesseract

Logiciel libre et open source de reconnaissance optique de caractère (OCR).

Site web : https://github.com/tesseract-ocr/tesseract

Text and Data Mining

id : text and data mining
types : Pratiques et méthodes
mots-clés :
filename : text_and_data_mining

Le Text and Data Mining (TDM) est un ensemble de traitements automatisés extrayant et analysant des informations (textes, images, données, sons, etc) stockées dans des corpus numériques conséquents dans le but d’en tirer de nouvelles connaissances.

Il s’appuie notamment sur les méthodes d’analyse linguistique. Ces traitements répondent à la croissance importante des données numériques qui rend difficile le travail « manuel » de veille, d’analyse et d’exploitation, des chercheurs.

Voir Fouille de texte

Text Ripper

id : text ripper
types : Outils logiciels
mots-clés :
filename : text_ripper

Cet outil permet d’extraire tout le texte d’une page web spécifique.

Site web : https://tools.digitalmethods.net/beta/textRipper/

TextObserver

id : textobserver
types : Outils logiciels
mots-clés :
filename : textobserver

TextObserver est un logiciel d’observation et d’analyse statistique de données textuelles.

Site web : http://textopol.u-pec.fr/textobserver/

Textométrie

id : textométrie
types : Technologies et familles d’outils
mots-clés :
filename : textometrie

La textométrie est l’application de calculs sur des données textuelles : statistique lexicale, analyses factorielles, classifications.

DtmVic, Hyperbase, IRaMuTeQ, Lexico 5, Le Trameur, TXM sont des outils dédiés à l'analyse textométrique.

Voir Stylométrie

The Old Reader

id : the old reader
types : Outils logiciels
mots-clés :
filename : the_old_reader

The Old Reader est un outil de veille qui permet d'agréger des flux RSS et des pages web sur une interface utilisateur personnelle. Il est gratuit en dessous de 100 flux.

Site web : https://theoldreader.com/home

Thème/Template

id : thème/template
types : Pratiques et méthodes
mots-clés :
filename : theme_template

Un template (ou « thème », « layout », etc.) désigne l’enveloppe graphique d’un site internet, indépendamment de son contenu. Il s’agit par exemple de la disposition des colonnes, du choix des caractères ou des couleurs, de la structure des différents éléments, etc. Un template propose plusieurs pages web de base et des feuilles de style. Cela permet de séparer le contenu (les données) et le contenant (le thème), celui-ci pouvant être changé facilement sur les différents CMS.

Thésaurus

id : thésaurus
types : Pratiques et méthodes
mots-clés :
filename : thesaurus

Répertoire structuré de termes (mots clés) pour l’analyse de contenu et le classement de documents.

Voir : Opentheso

En savoir plus : https://www.cnrtl.fr/definition/thésaurus

TIFF

id : tiff
types : Pratiques et méthodes
mots-clés :
filename : tiff

TIFF (Tag Image File Format) : format image propriétaire mais pleinement documenté, il est maintenant maintenu par Adobe. Ce format se caractérise par un en-tête riche comportant des métadonnées de format EXIF, IPTC et XMP. Doté d’une version sans compression, c’est un format image largement utilisé pour la conservation pérenne de numérisation haute qualité et pour l’impression en couleurs.

Voir Image.

Timeline JS

id : timeline js
types : Outils logiciels
mots-clés :
filename : timeline_js

Développé par le Northwestern University Knight Lab, Timeline JS est un service en ligne et gratuit de création de frise chronologique, codé en JavaScript. Cet outil de visualisation utilise des données d’un document Google Sheet pour créer la frise. Cette frise peut ensuite être intégrée dans une page web.

Site web : http://timeline.knightlab.com/

Timestamp Ripper

id : timestamp ripper
types : Outils logiciels
mots-clés :
filename : timestamp_ripper

Cet outil permet d’extraire et de présenter la dernière date de modification d’une page web.

Site web : https://tools.digitalmethods.net/beta/timestamp/

TLD Counts

id : tld counts
types : Outils logiciels
mots-clés :
filename : tld_counts

En entrant des URLs cet outil permet de compter les domaines de premier niveau (top level domains).

Site web : https://tools.digitalmethods.net/beta/tldCounts/

TMX

id : tmx
types : Pratiques et méthodes
mots-clés :
filename : tmx

TMX (Translation Memory eXchange) est un format de fichier basé sur le standard XML. Il est utilisé pour aligner les traductions de phrases dans différentes langues.

Toolbox

id : toolbox
types : Outils logiciels
mots-clés :
filename : toolbox

Toolbox est un outil de gestion et d’analyse de données linguistiques écrites. Il permet l’annotation multi-linéaire, la création de lexique, le tri.

Site web : https://software.sil.org/toolbox/

Tracker Tracker

id : tracker tracker
types : Outils logiciels
mots-clés :
filename : tracker_tracker

Cet outil permet de détecter, dans une liste d’URLs, les empreintes prédéfinies des technologies de traquage web.

Voir aussi : App Tracker Explorer

Site web : https://tools.digitalmethods.net/beta/trackerTracker/

Traduction

id : traduction
types : Pratiques et méthodes
mots-clés :
filename : traduction

Traduire s’est transposer dans une langue cible un texte donné dans une langue source. La traduction doit rendre compte le plus fidèlement possible du texte d’origine tout en étant parfaitement intelligible et correct dans la langue cible. Elle ouvre une multitude de questions de nature linguistique, psychologique, voire philosophique, afin de s’interroger sur les caractéristiques d’une « bonne traduction ».

Traduction automatique

id : traduction automatique
types : Pratiques et méthodes
mots-clés :
filename : traduction_automatique

Aussi appelée, Machine Traduction (MT) ou TAO (traduction automatique outillée), la traduction automatique est la traduction d'un texte effectuée par ordinateur, sans intervention humaine. Ses débuts remontent aux années 50. D’abord basée sur des dictionnaires et règles de transfert, puis sur l’analyse statistique de très grands corpus, elle s’appuie désormais sur l’apprentissage profond.

La qualité des traductions réalisées automatiquement est une question largement débattue. Les mémoires de traduction (bases de données où les traducteurs peuvent trouver des exemples de traductions passées) et la post-édition par un correcteur humain permettent d’améliorer les qualités de la traduction automatique.

Voir : Intelligence artificielle, DeepL, TAL.

TraduXio

id : traduxio
types : Outils logiciels, Ressources
mots-clés :
filename : traduxio

TraduXio est une plateforme participative de traduction de textes culturels. Il permet d’analyser et de comparer les traductions d’une même oeuvre, de conserver toutes les contributions d’un utilisateur, de rechercher la traduction d’un ou plusieurs termes au sein d’une bibliothèque d’oeuvres, de travailler à plusieurs sur la même traduction, de sélectionner une licence en suivant le modèle Creative Commons.

Site web : https://traduxio.org

Train & Align

id : train & align
types : Outils logiciels
mots-clés :
filename : train_align

Train & Align est un outil en ligne qui permet d’aligner automatiquement du son avec sa transcription.

Site web : http://cental.fltr.ucl.ac.be/train_and_align/publi.php

Transana

id : transana
types : Outils logiciels
mots-clés :
filename : transana

Transana est un logiciel d’analyse qualitative de données audios et vidéos. Elle permet l’importation, l’organisation, la transcription, le codage, l’interprétation et la présentation des données.

Site web : https://www.transana.com

Transcriber

id : transcriber
types : Outils logiciels
mots-clés :
filename : transcriber

Transcriber est un outil d’analyse de données orales. Il permet la segmentation, l’étiquetage, la transcription et l’annotation de fichiers audios.

Site web : http://trans.sourceforge.net/en/presentation.php

Transcription

id : transcription
types : Technologies et familles d’outils
mots-clés :
filename : transcription

En paléographie, la transcription consiste à reproduire un texte manuscrit, en notant les particularités du texte et rétablissant (ou non) les erreurs ou les abréviations qu'il peut contenir ; on parle de transcription diplomatique quand tous les phénomènes visibles du texte sont reproduits (comme la reproduction des retours à la ligne).

En édition numérique, il s’agit de reproduire sous forme textuelle un texte qui a été numérisé en mode image. La transcription en contexte numérique obéit aux mêmes principes et méthodologies que la transcription « classique », les problèmes étant les mêmes. Tout travail de transcription est basé sur des principes d’annotation.

En linguistique de l'oral, la transcription d'enregistrements audio (par exemple au format MP3) consiste à reproduire le texte de ce qui est verbalisé - en général en attribuant chaque prise de parole à un locuteur -, et éventuellement à encoder différents événements non verbaux significatifs de l'interaction (intonation, silences, bruits, gestes, regards...). Le texte peut être transcrit en orthographe standard (proche de l'écrit) ou oralisé (proche des caractéristiques auditives : troncatures, répétitions, particularités de prononciation...).

Ces transcriptions peuvent être synchronisées avec l'enregistrement au niveau des prises de paroles voire au niveau des mots. Dans ce dernier cas, la synchronisation est calculée automatiquement par des logiciels. La synchronisation permet d'écouter l'enregistrement au moment de la prononciation d'une certaine prise de parole ou d'un mot particulier de la transcription, ou bien d'afficher la transcription au fil de l'écoute de l'enregistrement.

Voir OCR, Transcriber, Transkribus, eScriptorium, READ, HTR

Transkribus

id : transkribus
types : Outils logiciels
mots-clés :
filename : transkribus

Transkribus est un outil qui permet la reconnaissance de caractères dans des documents transcrits (manuscrits ou imprimés). Il peut être utilisé en local ou via sa plateforme.

Il est porté par l’université d’Insbruck.

Voir : HTR

Site web : https://transkribus.eu/Transkribus

Triangulate

id : triangulate
types : Outils logiciels
mots-clés :
filename : triangulate

Triangulate permet d’extraire et de visualiser les points communs entre plusieurs URLs. Les visualisations possibles incluent un diagramme de Venn.

Site web : https://tools.digitalmethods.net/beta/triangulate/

Triple store

id : triple store
types : Pratiques et méthodes
mots-clés :
filename : triple_store

Entrepôt de données conçu pour le stockage et la récupération de données structurées en RDF. Le langage de requêtage est SPARQL.

Troncature

id : troncature
types : Pratiques et méthodes
mots-clés :
filename : troncature

La troncature est un opérateur qui permet de remplacer des caractères au sein d’un mot. Elle permet par exemple d’élargir une recherche par mot-clé à tous les termes ayant une racine commune. Elle se matérialise le plus souvent par une astérix (*) à la fin d’un mot.

Ainsi, une recherche « jardin* » donne des résultats pour les termes « jardins », « jardiner », « jardinier », « jardinière », « jardinage », « jardinerie ».

Voir Opérateurs booléens

Tropy

id : tropy
types : Outils logiciels
mots-clés :
filename : tropy

Tropy est un logiciel libre et open source de gestion de photothèque développé en 2017 par le Center for History and New Media de l'Université George Mason, qui a également développé le logiciel Zotero. Conçu pour organiser des corpus d'images d'archives, il permet d'annoter des images, de leurs ajouter des tags, et de gérer leurs métadonnées. Le logiciel est téléchargeable pour une utilisation local.

Site web : https://tropy.org/

Tumblr

id : tumblr
types : Outils logiciels
mots-clés :
filename : tumblr

Cet outil permet de récupérer, d’analyser et de visualiser les posts et co-hashtags dans Tumblr.

Site web : http://labs.polsys.net/tools/tumblr/

TXM

id : txm
types : Outils logiciels
mots-clés :
filename : txm

TXM est une plateforme et un logiciel de textométrie open source. Il permet l'analyse de texte, la fouille de texte. Il peut analyser des corpus de transcriptions d'enregistrements au format transcriber, des corpus parallèles au format TMX, des corpus en tableau au format Excel ou Ods et des corpus de textes écrits de niveau d'encodage variable au format TXT, XML ou TEI. Les mots de ces corpus peuvent être automatiquement lemmatisés et annotés grammaticalement à l'import par des outils externes comme TreeTagger. Les textes peuvent être structurés à n'importe quel niveau de profondeur. Les observables textuels utilisables dans les modèles statistiques (AFC...) ou les outils d'exploration (Concordances...) sont extractibles par des requêtes du moteur de recherche CQP équivalentes à des grammaires Unitex/Gramlab. Les modèles statistiques sont implémentés dans un R embarqué. TXM permet d'annoter les textes, notamment en embarquant le moteur du logiciel Analec.

Site web : http://textometrie.ens-lyon.fr/

UAM Corpus Tool

id : uam corpus tool
types : Outils logiciels
mots-clés :
filename : uam_corpus_tool

UAM Corpus Tool est un logiciel d’annotation de corpus textuels.

Site web : http://www.corpustool.com/index.html

UI Design

id : ui design
types : Pratiques et méthodes
mots-clés :
filename : ui_design

L’UI Design (User Interface Design) constitue l’environnement graphique dans lequel un utilisateur évolue sur un site web, un logiciel ou encore une application.

Il doit être agréable et faciliter l’utilisation du site, du logiciel ou de l’application. Il prend en compte des éléments tels que la typographie, les couleurs, les visuels, l’intuitivité, la charte éditoriale.

uMap

id : umap
types : Outils logiciels
mots-clés :
filename : umap

uMap est un outil en ligne qui permet de créer des cartes avec des calques OpenStreetMap et de les intégrer à un site web.

Il complète l’outil Khartis en permettant de projeter les données sur une carte interactive navigable (plutôt que sur une carte statique).

Site web : https://umap.openstreetmap.fr/en/

Unicode/UTF-8

id : unicode/utf-8
types : Pratiques et méthodes
mots-clés :
filename : unicode_utf-8

L’Unicode est un standard informatique international qui permet de décrire toutes les lettres des différentes langues. Il vise au codage du texte écrit en donnant à tout caractère de n’importe quel système d’écriture un identifiant numérique, et ce de manière unifiée, quelle que soit la plateforme informatique ou le logiciel utilisé (à la différence d’ANSI).

Il est plus complet que le code ASCII qui ne possède pas de signe diacritique. Le code informatique d’Unicode est standardisé par l’UTF (Universal Character Set Transformation Format) ; nous sommes maintenant en UTF-8. Le fait que le caractère soit codé en UTF ne veut pas dire qu’il va s’afficher correctement : il faut ensuite disposer de la police de caractère adéquate mais le caractère sera bien interprété informatiquement.

Unitex/GramLab

id : unitex/gramlab
types : Outils logiciels
mots-clés :
filename : unitex_gramlab

Unitex/GramLab est une suite logicielle libre, multiplateforme, multilingue (22 langues) qui est fondée sur des grammaires et des dictionnaires et qui permet l’analyse de corpus textuels.

Site web : https://unitexgramlab.org/fr

Ural

id : ural
types : Outils logiciels
mots-clés :
filename : ural

Ural est une librairie python fournissant des fonctions utiles au traitement et à la manipulation des URLs.

Site web : https://github.com/medialab/ural

URI

id : uri
types : Pratiques et méthodes
mots-clés :
filename : uri

URI (Uniform Resource Identifier – Identifiant Uniforme de Resource) : chaîne de caractères qui identifie de façon unique une ressource sur un réseau. L’adresse URI doit permettre d'identifier une ressource de manière permanente, même si la ressource est déplacée ou supprimée. Une norme gérée par le W3C gère la syntaxe des adresses URI.

L’URL (Uniform Resource Locators) qui permet d’identifier la localisation d’une ressource et l’URN (Uniform Resource Names) qui permet d’identifier une ressource, mais pas de la localiser, sont des spécialisations d’URI.

Voir Web sémantique.

URL

id : url
types : Pratiques et méthodes
mots-clés :
filename : url

L’URL (Uniform Resource Locators) est une adresse qui précise la localisation d’une ressource Internet en indiquant le protocole à adopter, le nom de la machine, le chemin d’accès et le nom du fichier.

Par exemple, http://www.larousse.net est une URL.

UX Design

id : ux design
types : Pratiques et méthodes
mots-clés :
filename : ux_design

L'UX Design (User eXperience Design) consiste à étudier et prendre en compte les attentes et les besoins des utilisateurs lors de la conception d’un site web.

Le but de l’UX Design est de rendre l’expérience de l’utilisateur sur le site plus instinctive, plus ergonomique afin qu’il se sente en confiance, qu’il trouve les informations dont il a besoin et qu’il ait envie d’interagir avec le site.

Valeur

id : valeur
types : Pratiques et méthodes
mots-clés :
filename : valeur

La valeur est ce qui est donné dans un champ à un enregistrement (ex. « 1912 » est la valeur pour le champ Date pour tel document).

Vega

id : vega
types : Pratiques et méthodes
mots-clés :
filename : vega

Vega est un langage informatique permettant de créer des visualisation de données.

Site web : https://vega.github.io

Veille informationnelle

id : veille informationnelle
types : Pratiques et méthodes
mots-clés :
filename : veille_informationnelle

La veille informationnelle désigne l’ensemble des stratégies qui permettent de rester informé grâce à l’utilisation d’outils de signalement automatisés tels que le flux RSS ou encore l’abonnement à des newsletters et des lettres de diffusion.

La veille permet de sélectionner les informations et d’optimiser le temps de recherche en faisant venir l’information plutôt qu’en allant la chercher.

VIAF

id : viaf
types : Ressources
mots-clés :
filename : viaf

VIAF (Fichier d’Autorité International Virtuel), est un fichier d’autorité international de référence (noms de personne, collectivités, noms géographiques, œuvres et expressions).

Voir Référentiel.

Site web : http://viaf.org

Visualisation de données

id : visualisation de données
types : Technologies et familles d’outils
mots-clés :
filename : visualisation_de_donnees

La visualisation de données désigne la représentation graphique d'informations et de données. À l'aide d'éléments visuels comme les graphiques et les cartes, une visualisation de données permet de voir et de comprendre des tendances ou des valeurs inhabituelles dans les données, de manière très accessible.

Dans le monde du Big Data, les outils et technologies de visualisation de données sont indispensables pour analyser d'énormes volumes d'informations et prendre des décisions en s'appuyant sur les données.

Voir Visualisation par graphe

Ressource web : https://www.tableau.com/fr-fr/learn/articles/data-visualization

Visualisation par graphe

id : visualisation par graphe
types : Technologies et familles d’outils
mots-clés :
filename : visualisation_par_graphe

Un graphe est une représentation graphique avec un ensemble de points, dont certaines paires sont directement reliées par un ou plusieurs liens.

Cette technique permet de visualiser de façon différente et précise à la fois les « processus » ou les relations établies entre des données : elle permet de créer un dispositif de représentation de celles-ci dans un ensemble beaucoup plus fin et visuel qu’une simple liste à puces. Mais ce type de visualisation est basé sur des relations ou des rapports entre les données.

Ressource web : http://innovatives.cnrs.fr/IMG/pdf/s6-auber.pdf

Voie classique

id : voie classique
types : Pratiques et méthodes
mots-clés :
filename : voie_classique

Le scientifique publie dans une revue, dont le contenu est accessible via un abonnement. L’accès au texte intégral est donc limité aux institutions qui ont souscrit l’abonnement.

L’article ne peut être déposé en diffusion publique dans une archive ouverte. Ainsi la voie classique se distingue et s’oppose au mouvement de la science ouverte (ou Open Access) qui promeut la publication scientifique en libre accès par le biais de la voie dorée et de la voie verte.

Voie dorée

id : voie dorée
types : Pratiques et méthodes
mots-clés :
filename : voie_doree

La voie dorée ou gold open access concerne des revues ou ouvrages nativement en Open Access, dès leur publication.

En savoir plus : https://openaccess.couperin.org/la-voie-doree-2/

Voie verte

id : voie verte
types : Pratiques et méthodes
mots-clés :
filename : voie_verte

La voie verte ou green open access est la voie de l’auto-archivage ou dépôt par l’auteur dans une archive ouverte.

En savoir plus : https://openaccess.couperin.org/la-voie-verte-2/

Voyager 2

id : voyager 2
types : Outils logiciels
mots-clés :
filename : voyager_2

Voyager 2 est un outil d’analyse visuelle qui mêle des méthodes automatiques et manuelles de spécification de graphiques.

Sites web : https://vega.github.io/voyager2/ - https://medialab.sciencespo.fr/outils/voyager-2/

Voyant Tools

id : voyant tools
types : Outils logiciels
mots-clés :
filename : voyant_tools

Voyant Tools est un environnement en ligne de lecture et d’analyse de textes numériques.

Il s’agit d’un projet canadien développé en open source qui fournit un ensemble d’outils d’analyse de texte et de visualisation des données textuelles.

Voir Text and Data Mining, Fouille de texte

Sites web : http://voyant.tools.huma-num.fr/docs/#!/guide/start - https://voyant-tools.org

W3C

id : w3c
types : Pratiques et méthodes
mots-clés :
filename : w3c

Le W3C ou World Wide Web Consortium est une communauté internationale d’acteurs qui travaille au développement des standards du Web. Il est dirigé par l’inventeur du Web Tim Berners-Lee et par Jeffrey Jaffe.

Voir : Référentiel

Site web : https://www.w3.org/

WaveSurfer

id : wavesurfer
types : Outils logiciels
mots-clés :
filename : wavesurfer

WaveSurfer est un logiciel multiplateforme d’analyse et d’annotation de données audios.

Site web : https://www.speech.kth.se/wavesurfer/

Wayback Machine

id : wayback machine
types : Outils logiciels
mots-clés :
filename : wayback_machine

Wayback Machine est un outil en ligne qui permet la consultation des versions archivées d’un site web.

Site web : http://web.archive.org

Web 2.0

id : web 2.0
types : Technologies et familles d’outils
mots-clés :
filename : web_2.0

Le web 2.0 ou « web participatif » désigne les évolutions techniques et les nouveaux usages du web qui permettent aux utilisateurs d’interagir entre eux mais également participer à la création ou à la modification du contenu des sites web.

Les wikis, les blogs, les flux RSS, les réseaux sociaux sont des outils du Web 2.0.

Voir Crowdsourcing, folksonomie

Web scraping

id : web scraping
types : Pratiques et méthodes
mots-clés :
filename : web_scraping

Le web scraping est une technique d’extraction de contenu de site web. Il repose sur la technique du crawler qui parcourt les sites web et du scraper qui extrait des informations depuis la structure HTML grâce à des sélecteurs (tels que X-path, CSS ou RegEx). Il existe des logiciels spécifiquement conçus pour extraire des données : Octoparse, Google Play Store Scraper, Image scraper, News Agencies Scraper, Search Engine Scraper, iTunes App Store Scraper, … De plus des bibliothèques de programmation ont aussi été créées pour aider les utilisateurs à développer leur propre programme de web scraping (par exemple Artoos.js ou Sandcrawler en Java).

Web sémantique

id : web sémantique
types : Pratiques et méthodes
mots-clés :
filename : web_semantique

Le Web sémantique, appelé aussi Web de données, est le Web permettant d’échanger et d’utiliser des données, de publier et de lier des bases de données sur le Web.

Succédant au Web documentaire, il s’appuie sur un standard du Web, l’URI (Uniform Resource Identifier), qui identifie une ressource. Le modèle de données RDF, également standard du Web sémantique, permet quant à lui de décrire, représenter et relier des données.

Voir DBpedia.

Cours en ligne sur Fun MOOC : https://www.fun-mooc.fr/courses/inria/41002S02/session02/about

WebAnno

id : webanno
types : Outils logiciels
mots-clés :
filename : webanno

WebAnno est un logiciel d’annotations manuelles et de gestion d’annotations de données textuelles.

Site web : https://webanno.github.io/webanno/

WebMAUS

id : webmaus
types : Outils logiciels
mots-clés :
filename : webmaus

WebMAUS est un outil en ligne d’alignement automatique d’un fichier son et de sa transcription textuelle.

Il existe deux versions de cet outil, le WebMAUS Basic et le WebMAUS General.

Sites web :

WFS

id : wfs
types : Pratiques et méthodes
mots-clés :
filename : wfs

WFS (Web Feature Service) : protocole défini par l'Open Geospatial Consortium qui permet d'interroger des objets géographiques vectoriels hébergés sur un serveur au moyen d'une URL formatée.

Wikipedia (outils)

id : wikipedia (outils)
types : Outils logiciels
mots-clés :
filename : wikipedia_outils
  • Wikipedia Categories Scraper. A partir de l’URL d’un article wikipédia, cet outil récupère les catégories d’articles et les catégories des articles liés dans toutes les langues.

  • Wikipedia Cross-Lingual Image Analysis. Cet outil permet de récupérer et de comparer toutes les images des différentes versions linguistiques d’un article Wikipédia.

  • Wikipedia Edits Scraper and IP Localizer. Cet outil récupère et analyse tout l’historique d’une page Wikipédia et quand il trouve une adresse IP au lieu d’un nom d’utilisateur (dans l’historique des modifications), il la géolocalise.

  • Wikipedia Entry Check. Cet outil permet de vérifier si des termes existent sous la forme d’articles Wikipédia.

  • Wikipedia History Flow Companion. Cet outil permet de spécifier un intervalle de révisions wikipédia et est à utiliser avec l’outil de visualisation History Flow.

  • Wikipedia TOC Scraper. Cet outil permet de récupérer les révisions d’une page wikipédia à travers la récupération des sommaires.

WinPitch

id : winpitch
types : Outils logiciels
mots-clés :
filename : winpitch

WinPitch est un logiciel développé pour la recherche prosodique qui permet notamment la visualisation en temps-réel, l’analyse de la courbe mélodique, l’alignement de texte assisté, la segmentation automatique ou encore la création de lexique.

Site web : http://www.winpitch.com

Wordle

id : wordle
types : Outils logiciels
mots-clés :
filename : wordle

Wordle est un outil qui permet de générer des nuages de mots-clés (tags) à partir de textes ou de liens. Wordle offre également des fonctionnalités de design personnalisable.

Site web : http://ww7.wordle.com

Wysiwyg

id : wysiwyg
types : Technologies et familles d’outils
mots-clés :
filename : wysiwyg

Wysiwyg est un acronyme anglais qui signifie « what you see is what you get » : « ce que vous voyez est ce que vous obtenez ». Cela désigne une interface graphique (le plus souvent par formulaire ou bouton) qui permet de composer visuellement le résultat attendu sans passer par l’écriture et donc l’apprentissage de codes informatiques.

L’exemple classique est Word, logiciel de traitement de texte qui permet d’éditer un texte sans passer par XML.

WYSIWYM

id : wysiwym
types : Pratiques et méthodes
mots-clés :
filename : wysiwym

WYSIWYM est un acronyme anglais qui signifie « what you see is what you mean » : « ce que vous voyez est ce que vous voulez dire ». Cela désigne une interface d’édition de texte qui se concentre sur le contenu par rapport à la forme. Dans les logiciels ayant une interface Wysiwym, l’écriture du contenu se fait en ligne de code, et spécifie la valeur des éléments (tels mots sont un titre, tels autres sont un paragraphe, tels autres sont une citation, …). L’interface WYSIWYM est donc différente de l’interface WYSIWYG.

X-Path

id : x-path
types : Technologies et familles d’outils
mots-clés :
filename : x-path

X-Path est un langage de requête pour les données structurées en XML, développé par le W3C. Il permet d’adresser des éléments d’un document XML de façon ciblée. Il est utilisé conjointement avec le langage X-Query afin que ce dernier interroge les données dans les champs désigné par X-Path.

Documentation du W3C

Définition sur le site de l'IONOS

X-Query

id : x-query
types : Technologies et familles d’outils
mots-clés :
filename : x-query

X-Query est un langage de requête pour les données codées en XML. Il a été développé par le W3C. Il sert à la fois à récupérer des données mais aussi à les modifier. Dans le cadre des bases de données en XML, il a le même rôle que le langage de requête SQL.

Voir aussi : SQL

Site web : https://www.w3.org/TR/xquery-31/

XMind

id : xmind
types : Outils logiciels
mots-clés :
filename : xmind

XMind est un logiciel open source de création de "concept map", d'organigrammes, cartes, plans et autres schémas. Très simple d'utilisation, l'application vous permet d'éditer toutes les parties de votre organigramme (liaison, encarts principaux et secondaires, etc.), d'ajouter des images et des liens, d'insérer du texte, d'intégrer des marqueurs (ressemblant à des emoticons) pour indiquer la priorité par exemple, d'annoter votre case, etc. Vous pourrez également attacher un document externe, imprimer, et exporter votre projet aux formats HTML, image, texte, etc.

Site web : https://www.xmind.net/desktop/

XML

id : xml
types : Pratiques et méthodes
mots-clés :
filename : xml

Pour pouvoir être lue et archivée, une ressource numérique demande un encodage qui respecte les exigences de son auteur mais qui soit aussi compréhensible par d’autres. De nombreux standards d’encodage existent. Mais pour la représentation et l’échange des informations contenues dans la ressource, le XML (eXtensible Markup Language, « langage de balisage extensible ») est devenu le langage de référence.

Il est utilisé dans de nombreuses situations et a développé des initiatives dérivées qui permettent de répondre à de nombreux besoins (dont XML-TEI). Le HTML est un langage avec une liste fermée de balises qui ne s’occupent que de la mise en forme. Le XML propose une couche supplémentaire avec une liste non limitée de balises qui permettent de structurer son propre langage : elles concernent généralement la structure ou l’interprétation du contenu. Le XML a donc une structure ouverte, les balises ne sont pas limitées mais il y a des règles d’utilisation à respecter. En tête d’un document XML, il y a généralement les métadonnées Dublin Core.

XML-MEI

id : xml-mei
types : Groupements institutionnels, Pratiques et méthodes
mots-clés :
filename : xml-mei

XML-MEI (XML music encoding initiative) désigne à la fois un ensemble de règles pour les documents de notation musical et la communauté les définissant.

Site web : https://music-encoding.org/

Voir aussi : TEI

XSD

id : xsd
types : Pratiques et méthodes, Technologies et familles d’outils
mots-clés :
filename : xsd

Le schéma de définition XML (XSD pour XML Schema Definition), est un langage de description de la structure d’un document en XML. Il permet de définir chaque éléments (nom et type), leurs attributs et leurs restrictions.

Pour en savoir plus : https://florian-lepretre.herokuapp.com/teaching/webservices/xsd

XSL

id : xsl
types : Pratiques et méthodes
mots-clés :
filename : xsl

XSL (eXtensible Stylesheet Language) est le langage de description de feuilles de style associé à XML.

Ainsi, une feuille de style écrite en XSL constitue un fichier permettant la mise en forme mais aussi la transformation d’un document XML en un autre document XML.

Plus précisément, XSL forme en réalité une famille de langages à trois composantes : XSLT ou le langage de transformation d’un document XML, XPath ou le langage de navigation au sein d’un document XML, XSL-FO ou le langage de mise en forme d’un document XML.

Youtube Data Tools

id : youtube data tools
types : Outils logiciels
mots-clés :
filename : youtube_data_tools

Il s’agit d’une collection d’outils variés permettant l’extraction de données de la plateforme Youtube.

Site web : https://tools.digitalmethods.net/netvizz/youtube/

Zenodo

id : zenodo
types : Outils logiciels, Ressources
mots-clés :
filename : zenodo

Zenodo est un répertoire créé dans le cadre du projet européen OpenAIRE par le CERN (Conseil Européen pour la Recherche Nucléaire).

Il s’agit d’un entrepôt où les chercheurs, de toutes les disciplines et de tous pays, peuvent déposer leurs données ou d’autres types de document.

Zenodo fournit un DOI aux ressources qui en sont dépourvues. Les archives peuvent être déposées en accès ouvert, restreint ou fermé. En revanche leurs métadonnées sont sous licence CC0 et peuvent être moissonnées selon le protocole OAI-PMH.

Site web : https://zenodo.org

Zotero

id : zotero
types : Outils logiciels
mots-clés :
filename : zotero

C’est un logiciel de gestion de références bibliographiques gratuit et open source. Il permet de gérer des données bibliographiques et des documents de recherche (fichiers PDF, images, etc.). Il s’intègre au navigateur web et permet de synchroniser des données depuis plusieurs ordinateurs, ainsi que de faire de la génération de citations (notes et bibliographies).

Le développement du logiciel est à l'initiative du Roy Rosenzweig Center for History and New Media (CHNM) de l'université George Mason, le même centre qui développe Omeka.

Site web : https://www.zotero.org

Aide

Cliquez ici pour accéder à la documentation de Cosma

Raccourcis

Espace Réactiver l'algorithme de dessin du graphe
S Déplacer le curseur dans le champ Recherche
Alt + clic (sur un type de fiche) Désélectionner les autres types
R Réinitialiser le zoom
Alt + R Réinitialiser l'affichage
C Zoomer et centrer sur le nœud sélectionné
F Passer en mode Focus
Echap Fermer la fiche sélectionnée

Glossaire humanités numériques

Ce glossaire a été publié initialement par Marie-Laure Massot (CNRS, UMS 3610 CAPHÉS - ENS Paris) et Agnès Tricoche (CNRS, UMR 8546 AOROC - ENS Paris) à l'adresse <https://digithum.huma-num.fr/ressources/glossaire/>.

Cette version du glossaire a été réalisée par Arthur Perret (ELICO, Université Jean Moulin Lyon 3). Dernière mise à jour : 27 février 2024.

Ce glossaire est conçu au départ de ceux de la plateforme d’édition de manuscrits et d’archives EMAN et du projet Foucault fiches de lectures. Ayant pour vocation d'évoluer au fil du temps, il bénéficie de l'expertise des membres du Groupe de travail humanités numériques de l’EUR Translitterae.

Il doit beaucoup à Pauline Leplongeon, étudiante en master à l'université Côte-d'Azur, et à Anne-Claire Durand, étudiante en master à l’école du Louvre, qui lors de stages réalisés en juillet-août 2021 et en juin 2022, en ont considérablement amélioré et enrichi la présente version.

Par ailleurs, deux sites web ont été particulièrement utiles à l'élaboration de ce glossaire : celui du Médialab de Sciences Po et celui de la Digital Methods Initiative.


Version 2.4.0 • Licence GPL-3.0-or-later

  • Arthur Perret
  • Guillaume Brioudes
  • Clément Borel
  • Olivier Le Deuff
  • Programme ANR HyperOtlet
D3 v4.13.0
Mike Bostock (BSD 3-Clause)
Nunjucks v3.2.3
James Long (BSD 2-Clause)
Js-yaml v4.1.0
Vitaly Puzrin (MIT License)
Markdown-it v12.3.0
Vitaly Puzrin, Alex Kocharin (MIT License)
Citeproc v2.4.62
Frank Bennett (CPAL, AGPL)
Fuse-js v6.4.6
Kiro Risk (Apache License 2.0)