Cliquez sur un nœud du graphe ou dans un élément de l'index pour ouvrir une fiche.

4CAT - Capture and Analysis Toolkit

id : 4cat - capture and analysis toolkit

types : Outils logiciels

mots-clés :

filename : 4cat

4CAT est un outil permettant de créer et d’analyser des fichiers de données à partir d’une variété de forums et de plateformes web.

Site web (connexion nécessaire) : https://4cat.oilab.nl/login/?next=%2F

Présentation de l'outil : https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3914892

ABES

id : abes

types : Groupements institutionnels, Ressources

mots-clés :

filename : abes

L’ABES, Agence Bibliographique de l’Enseignement Supérieur, est un établissement public à caractère administratif créé en 1994 et sous tutelle du Ministère de l’Enseignement supérieur et de la Recherche pour la mise en œuvre du SUDOC (Système Universitaire de Documentation).

Depuis, ses missions se sont développées. Elle fournit ainsi un ensemble d’outils de signalement et d’administration de leurs ressources documentaires aux établissements de l’enseignement supérieur et de la recherche. On compte ainsi le moteur de recherche thèses.fr, le catalogue Calames, le référentiel IdRef, la gestion de l’attribution des numéros ISIL pour les bibliothèques.

Site web : https://abes.fr/

Accessibilité des données

id : accessibilité des données

types : Pratiques et méthodes

mots-clés :

filename : accessibilite_des_donnees

Il s’agit de garantir l’accès et la pérennité des données. Cette accessibilité est généralement assurée par des développements informatiques réalisés à partir de logiciels open source, et à partir de librairies sans dépendances, ou que l’on peut facilement remplacer. Elle est aussi assurée par un choix de format d’encodage des données, format qui doit être ouvert, documenté et utilisé par une communauté.

id : alto

types : Pratiques et méthodes

mots-clés :

filename : alto

Standard XML documentaire permettant de décrire la mise en page physique et la structure logique d'une page de document analysée par reconnaissance optique de caractères (OCR).

Amazon Related Product Graph

id : amazon related product graph

types : Outils logiciels

mots-clés :

filename : amazon_related_product_graph

Il s’agit d’un script PHP qui permet d’entrer dans un ensemble d’ASIN (Amazon Standard Identification Number) et de récupérer leurs recommandations.

Site web : https://github.com/digitalmethodsinitiative/dmi-amazon-recscraper

Analec

id : analec

types : Outils logiciels

mots-clés :

filename : analec

Analec est un logiciel d’annotation et d’analyse de corpus écrits.

Site web : https://www.lattice.cnrs.fr/ressources/logiciels/analec/

AnaText

id : anatext

types : Outils logiciels

mots-clés :

filename : anatext

AnaText est un outil en ligne permettant d’analyser des textes par simple copier-coller. Il est notamment utilisé pour l’initiation à l’exploration de corpus. Il peut traiter des textes de langues variées (une dizaine) et contrairement à AntConc, il affiche la catégorie et le lemme du mot analysé.

Site web : http://phraseotext.univ-grenoble-alpes.fr/anaText/

id : antconc

types : Outils logiciels

mots-clés :

filename : antconc

AntConc est un logiciel d’analyse textuelle spécialisé dans les concordances.

Voir aussi : AnaText

Site web : http://www.laurenceanthony.net/software/antconc/

Anvil

id : anvil

types : Outils logiciels

mots-clés :

filename : anvil

Anvil est un outil d’annotations à plusieurs niveaux de vidéos. Il peut être utilisé dans plusieurs disciplines comme la linguistique, l’anthropologie ou encore la psychothérapie.

Site web : http://www.anvil-software.org

Anystyle.io

id : anystyle.io

types : Outils logiciels

mots-clés :

filename : anystyle.io

AnyStyle permet de séquencer semi-automatiquement une bibliographie rédigée au format électronique et la verser dans les champs structurés de Zotero ou de Endnote.

Site web : https://anystyle.io/

Tutoriel : https://youtu.be/Jqhtsib5yGY

API

id : api

types : Technologies et familles d’outils

mots-clés :

filename : api

Le rôle d’une API (Application Programming Interface) ou interface de programmation est de fournir une bibliothèque d’outils (fonctions, objets, programmes) permettant l’interaction entre d’autres entités informatiques (serveurs, programmes, services).

App Tracker Explorer

id : app tracker explorer

types : Outils logiciels

mots-clés :

filename : app_tracker_explorer

Il s’agit d’un outil permettant de détecter les empreintes de technologies de traçages ou d’autres bibliothèques de code au sein de fichiers APK (Android Package Kit ou format de fichier conçu pour le système d’exploitation android).

Voir aussi : Tracker tracker

Site web : https://tools.digitalmethods.net/beta/appTrackers/

id : archivage

types : Pratiques et méthodes

mots-clés :

filename : archivage

L'archivage est la gestion, le classement et la conservation d'objets, par exemple les corpus.

Archivage numérique

id : archivage numérique

types : Pratiques et méthodes

mots-clés :

filename : archivage_numerique

L’archivage de contenus électroniques est l’ensemble des actions, outils et méthodes mis en œuvre pour réunir, identifier, sélectionner, classer, détruire et conserver des contenus électroniques, sur un support sécurisé, dans le but de les exploiter et de les rendre accessibles dans le temps, que ce soit à titre de preuve (en cas d’obligations légales notamment ou de litiges) ou à titre informatif.

Le contenu archivé est considéré comme figé et ne peut donc être modifié. Ceci est notamment possible en garantissant l'authenticité via l’empreinte électronique, la signature électronique, la traçabilité des accès et bien d'autres moyens. La durée de l’archivage est fonction de la valeur du contenu et porte le plus souvent sur du moyen ou long terme.

Voir aussi : Archivage, Archivage pérenne

Archivage pérenne

id : archivage pérenne

types : Pratiques et méthodes

mots-clés :

filename : archivage_perenne

L’archivage pérenne a pour but de conserver le document, de le rendre accessible et d’en préserver l’intelligibilité. Ce type d’archivage fait face à quatre risques principaux : l’obsolescence du matériel, celle des logiciels, celle du format de fichier ainsi que la perte de la signification du contenu.

Voir aussi : Archivage, Archivage numérique

Site web du CINES, proposant des solutions d'archivage pérenne de données électroniques : https://www.cines.fr

Archive ouverte

id : archive ouverte

types : Technologies et familles d’outils

mots-clés :

filename : archive_ouverte

Une archive ouverte est un réservoir web où sont déposées des publications issues de la recherche scientifique et de l’enseignement dont l’accès est libre et gratuit.

Elle peut être institutionnelle (ex. OATAO de l’ Université de Toulouse), régionale (ex. OpenAIRE pour l’Europe), nationale (HAL pour la France) ou disciplinaire (ex. arXiv en Physique, RePEC en Economie).

Voir OpenAIRE, HAL, Science ouverte

Argos

id : argos

types : Outils logiciels

mots-clés :

filename : argos

Argos est un outil en ligne développé par OpenAIRE qui permet de créer et de publier des plans de gestion des données (ou PGD).

Site web : https://argos.openaire.eu/splash/

ARIES

id : aries

types : Outils logiciels

mots-clés :

filename : aries

ARIES (Art and images exploration space) est une plateforme web d’exploration et d’organisation d’images pour les chercheurs en histoire de l’art. Il permet de créer un projet où regrouper des images afin de les comparer. Ces comparaisons peuvent se faire sur l’iconographie en superposant les images grâce à un système de transparence, sur les dimensions des tableaux en mettant à l’échelle les représentations les unes par rapport aux autres d’après les métadonnées, ou encore sur l’évolution d’une représentation en créant des frises chronologiques également depuis les métadonnées.

Site web : https://artimageexplorationspace.com/

id : balise

types : Pratiques et méthodes

mots-clés :

filename : balise

La balise est une marque que l’on utilise dans les langages informatiques afin de signaler une spécificité descriptive (exemple : italique, gras…) ou pour commander une action à un logiciel. Le langage HTML utilise des balises pour mettre en forme le texte, le XML fait de même mais avec une couche interprétative de ce contenu.

La balise se matérialise par des chevrons ouvrants et fermants, elle est souvent double avec une balise ouvrante et une balise fermante (exemple : <p>texte</p>) ou se compose d’une balise unique qui souvent se termine par un / (exemple : <br/> pour le retour à la ligne qui est par définition unique). Les balises ne sont pas visibles à l’écran mais elles sont consultables en demandant au navigateur l’affichage du code source de la page.

BVH

id : bvh

types : Ressources

mots-clés :

filename : bvh

Le programme « Bibliothèques Virtuelles Humanistes », porté par l’université de Tours, diffuse des documents patrimoniaux (bibliothèque numérique) et poursuit des recherches associant des compétences en sciences humaines et en informatique.

Site web : <http://www.bvh.univ-tours.fr >

Calames

id : calames

types : Ressources

mots-clés :

filename : calames

Géré par l’ABES, Calames (Catalogue en ligne des archives et des manuscrits de l’enseignement supérieur) est le catalogue des archives et des manuscrits présents dans les bibliothèques universitaires, de grands établissements nationaux comme l’Institut de France et des établissements de recherche.

Site web : http://www.calames.abes.fr/pub/

Calenda

id : calenda

types : Ressources

mots-clés :

filename : calenda

plateforme communautaire académique en ligne dédiée à l’actualité de la recherche en lettres et sciences humaines et sociales. Elle publie des annonces de colloques, les programmes de séminaires, les cycles de conférences, les propositions d’emploi et les appels à contribution.

Site web : https://calenda.org

Canvas

id : canvas

types : Outils logiciels

mots-clés :

filename : canvas

Canvas est une plateforme en ligne qui permet aux utilisateurs de concevoir des flyers, des vidéos, des documents, des présentations ou des sites web.

Le site propose des modèles à utiliser et il permet à des personnes n'étant pas "designer" de concevoir des présentations dynamiques et personnalisées.

Site web : https://www.canva.com/

Tutoriel : https://www.youtube.com/watch?v=_XOWhA1dK7Y

CAQDAS

id : caqdas

types : Technologies et familles d’outils

mots-clés :

filename : caqdas

Un CAQDAS (Computer Aided Qualitative Data Analysis Systems) est un outil permettant l'analyse de données qualitatives. Il existe toute une série de logiciels de ce type, payants (comme par exemple NVivo) ou gratuits (comme par exemple WeftQDA, TamsAnalyser).

En savoir plus : http://triangle.ens-lyon.fr/spip.php?article5120

Présentation des logiciels gratuits CAQDAS : https://guides.library.illinois.edu/c.php?g=348074&p=2346107

Carte

id : carte

types : Pratiques et méthodes

mots-clés :

filename : carte

« La carte est une représentation géométrique conventionnelle, généralement plane, en positions relatives, de phénomènes concrets ou abstraits, localisables dans l’espace ; c’est aussi un document portant cette représentation ou une partie de cette représentation sous forme d’une figure manuscrite, imprimée ou réalisée par tout autre moyen. »

Comité français de Cartographie (CFC), 1990.

Voir Cartographie.

Cartographie

id : cartographie

types : Pratiques et méthodes

mots-clés :

filename : cartographie

Ensemble des études et opérations scientifiques, artistiques et techniques, intervenant dans l’élaboration d’une carte, d’un plan ou autre mode d’expression, à partir des résultats d’observations directes ou de l’exploitation d’une documentation, ainsi que dans leur utilisation.

Voir Carte.

Cartomundi

id : cartomundi

types : Outils logiciels

mots-clés :

filename : cartomundi

Cartomundi est une cartothèque numérique proposant en ligne des numérisations de cartes historiques appartenant à différentes institutions européennes (France, Allemagne, Italie, Autriche, et République Tchèque).

Site web : http://www.cartomundi.fr/site/

Voir aussi : OldMapsOnline

Catwalk

id : catwalk

Présentation détaillée : https://www.openscience.fr/Chronocarto-un-Web-SIG-libre-pour-les-archeologues-pas-seulement

CIDOC-CRM

id : cidoc-crm

types : Pratiques et méthodes, Ressources

mots-clés :

filename : cidoc-crm

Le Modèle Conceptuel de Référence du CIDOC (le Comité International pour la DOCumentation du conseil international des musées), est une ontologie informatique qui définit un modèle de structuration des données patrimoniales et leurs relations. Les institutions patrimoniales utilisant cette ontologie permettent ainsi à leurs systèmes d’être interopérables et de partager des données entre-elles. Le CIDOC-CMR est aujourd’hui une norme ISO 21127:2014.

Site web : https://www.cidoc-crm.org/

CINES

id : cines

types : Groupements institutionnels

mots-clés :

filename : cines

Le CINES (Centre Informatique National de l’Enseignement Supérieur) est un établissement public national à caractère administratif. Il est chargé d’assurer un service informatique à destination des établissements publics d’enseignement supérieur et des organismes de recherche.

Il intervient plus précisément dans trois domaines : le calcul numérique intensif, l’archivage pérenne de données électroniques et l’hébergement de matériels informatiques à vocation nationale comme les serveurs de l’ABES par exemple.

Site web : https://www.cines.fr

CIRIS

id : ciris

types : Ressources

mots-clés :

filename : ciris

CIRIS est une base de données bibliographiques collaborative qui recense et décrit les éditions anciennes et récentes des textes non documentaires de l’Antiquité gréco-latine.

Site web : https://ciris.huma-num.fr

CitEc

id : citec

types : Outils logiciels

mots-clés :

filename : citec

CitEc est un outil qui fournit une analyse des citations pour tout document diffusé sur la bibliothèque numérique RePec, spécialisée en économie. La liste des références présentes dans chaque document est automatiquement extraite ce qui permet de savoir quels documents ont été cités, combien de fois et par qui.

Site web :< http://citec.repec.org>

CLARIN

id : clarin

types : Groupements institutionnels, Ressources

mots-clés :

filename : clarin_eric

CLARIN (Common Language Resources and Technology Infrastructure) : infrastructure de recherche européenne pour les ressources linguistiques et la technologie, dont l’objectif est de fédérer les efforts européens faits autour des données de langage, pour toutes les langues, à destination de toutes les disciplines.

CLARIN met les ressources linguistiques numériques à la disposition des universitaires, des chercheurs, des étudiants et des citoyens-chercheurs de toutes les disciplines, en particulier dans les sciences humaines et sociales, grâce à un accès par connexion unique. CLARIN offre des solutions et des services technologiques à long terme pour le déploiement, la connexion, l'analyse et la maintenance des données et des outils linguistiques numériques.

CLARIN soutient les chercheurs qui veulent s'engager dans une recherche de pointe axée sur les données, contribuant ainsi à un véritable espace européen de la recherche multilingue.

Site web : https://www.clarin.eu/

Services proposés par CLARIN : https://www.clarin.eu/content/services

id : codimd

types : Outils logiciels

mots-clés :

filename : codimd

CodiMD est une plateforme collaborative d’édition de texte en Markdown. Elle sert à partager des notes avec des collaborateurs. Cette plateforme permet à la fois d’écrire du texte, mais aussi de réaliser des schémas, diagrammes, graphiques, tableaux etc. et d’insérer des vidéos ou des pdf, et même des formules mathématiques codées en LaTeX.

Site web : https://codimd.math.cnrs.fr/

Collaboratif

id : collaboratif

types : Pratiques et méthodes

mots-clés :

filename : collaboratif

Dispositif qui vise à faciliter la collaboration de différents participants ou publics grâce à des outils informatiques adaptés au partage et à l’échange d’information. On parle aussi de système contributif ou participatif et de Crowdsourcing. Une problématique majeure de ce type de dispositif est la modération des contenus proposés.

Collatinus

id : collatinus

types : Outils logiciels

mots-clés :

filename : collatinus_collatinus-web

Collatinus est un logiciel libre, gratuit et multi-plateforme. Il s’agit d’un lemmatiseur et d’un analyseur morphologique de textes latins. A partir d’un texte latin, l’application propose quatre onglets d’analyse : lexiques, dictionnaires, scansions, flexions. Collatinus-web constitue quant à lui la version web du logiciel Collatinus.

Voir Eulexis pour les textes grecs.

Sites web : https://outils.biblissima.fr/fr/collatinus/ ; https://outils.biblissima.fr/fr/collatinus-web/

CollEc

id : collec

types : Outils logiciels

mots-clés :

filename : collec

CollEc est un service fourni par RePec qui évalue et analyse les réseaux de co-auteurs de la littérature économique.

Site web : https://collec.repec.org/app/collec_app

Collective Access

id : collective access

types : Outils logiciels

mots-clés :

filename : collective_acess

CollectiveAccess est un logiciel open source pour le catalogage et la publication en ligne de collections muséales ou archivistiques. Ce logiciel est full-web, ce que le rend accessible à distance via un navigateur web. Il repose sur le modèle de la base de données relationnelle Access développé par Microsoft.

Site web : https://www.collectiveaccess.org/

Collex-Persée

id : collex-persée

types : Groupements institutionnels

mots-clés :

filename : collex-persee

Collex-Persée est un groupement d’intérêt scientifique (GIS) co-piloté par la bibliothèque nationale universitaire de Strasbourg et le ministère de l’enseignement supérieur et de la recherche. Il regroupe vingt-et-un établissements (universités, Bnf, ABES, Persée, etc.) et une centaine de structures dont les collections documentaires ont été labellisées « collection d’excellence ».

Ce GIS s’organise comme une infrastructure de recherche en informations scientifiques et techniques dont le but est de favoriser la fréquentation des collections des bibliothèques tout en développant de nouveaux services aux chercheurs.

Il se donne plusieurs autres missions : porter une politique nationale de numérisation des documents, rendre visibles les collections par le référencement, enrichir l’offre documentaire par la négociation de ressources sous licences, labelliser les collections d’excellence pour la recherche.

Site web : https://www.collexpersee.eu

Colors for Data Scientists

id : colors for data scientists

types : Outils logiciels

mots-clés :

filename : colors_for_data_scientists

Il s’agit d’un outil qui génère et affine des palettes de couleurs pour la visualisation de données scientifiques.

Site web : https://medialab.github.io/iwanthue/

Commentaire

id : commentaire

types : Pratiques et méthodes

mots-clés :

filename : commentaire

Dans le domaine documentaire, il s'agit d'une explication, interprétation ou analyse d’un texte ; notes et éclaircissements destinés à faciliter l’intelligence d’un texte.

Dans le cadre des outils collaboratifs ou des blogs, le commentaire est une réaction à une contribution.

Voir Annotation et Collaboratif

Community Manager

id : community manager

types : Pratiques et méthodes

mots-clés :

filename : community_manager

Le Community Manager est un professionnel des communautés en ligne qu’il est chargé de fédérer et d’animer pour le compte d’une entreprise, d’une institution ou encore d’une association.

Une de ses missions principales consiste à développer et gérer la présence de son employeur sur les médias sociaux.

Compare Lists

id : compare lists

types : Outils logiciels

mots-clés :

filename : compare_lists

Compare Lists est un outil permettant de comparer deux listes d’URLs pour découvrir leurs points communs et leurs différences.

Site web : https://tools.digitalmethods.net/beta/analyse/

Compare Networks Over Time

id : compare networks over time

types : Outils logiciels

mots-clés :

filename : compare_networks_over_time

Il s’agit d’un outil qui compare dans le temps les réseaux établis par l’outil IssueCrawler et qui expose une liste hiérarchisée d’acteurs. Il est conseillé d’utiliser parallèlement Compare Networks Over Time et IssueCrawler.

Site web : https://tools.digitalmethods.net/beta/ic/comparenetworksovertime/

ConcQuest

id : concquest

id : cortext

types : Outils logiciels

mots-clés :

filename : cortext

Cortext est une plateforme d'analyse de texte qui permet la constitution et la visualisation de réseaux.

Elle maintenue par le laboratoire LISIS.

Site web : https://www.cortext.net/

Cosma

id : cosma

types : Outils logiciels

mots-clés :

filename : cosma

Cosma est un logiciel de visualisation de graphe documentaire. Il permet de représenter des fiches interreliées sous la forme d’un réseau interactif dans une page web.

Cosma est pensé pour les travailleurs de la connaissance. Sa fonction première est de fournir une meilleure vision globale sur un ensemble de documents interreliés, tout en proposant une modalité de partage inédite, puisque l'export (HTML) donne accès aux mêmes fonctionnalités que l'application.

Site web : https://cosma.graphlab.fr

L'exemple du glossaire de Digit_Hum : https://www.arthurperret.fr/digithum-glossaire-hn.html

CoSo

id : coso

types : Groupements institutionnels

mots-clés :

filename : coso

Créé en 2018, le CoSo (ou Comité pour la Science ouverte) est chargé de définir et de mettre en œuvre une politique de soutien à l’ouverture des publications et des données de la recherche à l’échelle nationale et internationale et d’en assurer la coordination entre les établissements et les communautés de chercheurs.

Outre plusieurs groupes de travail, le CoSo comprend quatre collèges - le collège des publications, celui des données de la recherche, le collège compétences et formation ainsi que le collège Europe et international.

Site web : https://www.ccsd.cnrs.fr/project/coso/

Couperin

id : couperin

types : Groupements institutionnels

mots-clés :

filename : couperin

Couperin est un consortium unifié des établissements universitaires et de recherche pour l’accès aux publications numériques qui regroupe des universités, des centres de recherches, des grandes écoles. Il se charge notamment d’évaluer, de négocier et d’organiser l’achat de ressources numériques pour ses membres tout en contribuant à redéfinir et à faire évoluer les relations contractuelles avec les éditeurs.

Couperin assure également une veille et mène une réflexion sur les enjeux de la science ouverte qu’il soutient. Il œuvre au développement de la coopération nationale, européenne et internationale en matière de documentation et de ressources électroniques.

Site web : https://www.couperin.org/

CRAN

id : cran

types : Ressources

mots-clés :

filename : cran

Le Comprehensive R Archive Network (CRAN) est un site web où se trouvent les bibliothèques à télécharger pour R.

Site web : https://cran.r-project.org

Creative Commons

id : creative commons

types : Pratiques et méthodes

mots-clés :

filename : creative_commons

Publiées dès 2002, les licences Creative Commons (CC) proposent une solution légale aux personnes souhaitant offrir une autorisation non exclusive de reproduire, distribuer et communiquer une œuvre au public à titre gratuit. Elles permettent de faire apparaître clairement au public les conditions de la licence de distribution et de réutilisation de cette création.

Site web : https://creativecommons.org/share-your-work/

Crowdsourcing

id : crowdsourcing

types : Pratiques et méthodes

mots-clés :

filename : crowdsourcing

Le crowdsourcing, littéralement “approvisionnement par la foule”, est une pratique de production participative visant à externaliser une activité auprès d’un large réseau d’acteurs le plus souvent anonymes ; activité ordinairement effectuée en interne par une entreprise (ou une institution) ou en externe par un prestataire désigné. Il suppose un appel ouvert à tous, sans restriction de participation et sans discrimination.

Voir Web 2.0, folksonomie, Collaboratif

CSS

id : css

types : Pratiques et méthodes

mots-clés :

filename : css

Les feuilles de style en cascade (Cascading Style Sheets) ou CSS constituent un langage informatique servant à la description de la présentation des documents HTML et XML en dehors de ces mêmes documents. Ainsi, il est possible de décrire la structure d’un document en HTML et de décrire à part toute sa présentation dans une feuille de style CSS.

De cette façon, les styles ou la mise en page ne sont appliqués qu’au moment de la consultation de la page web dans un navigateur web.

Cette séparation entre structure et présentation permet de modifier plus aisément la présentation d’un document, d’en améliorer l’accessibilité, et d’en diminuer la complexité architecturale.

CSV

id : csv

types : Pratiques et méthodes

mots-clés :

filename : csv

Le CSV (Comma-separated values) est un format de stockage des données en texte brut d’une feuille de calcul. Ce format vise la facilité du partage. Il est lisible par la plupart des logiciels de tableur. En revanche il ne permet pas l’enrichissement typographique (gras, italique, etc.) : il conserve du texte brut.

id : dariah

types : Groupements institutionnels

mots-clés :

filename : dariah_eric

DARIAH (Digital Research Infrastructure for the Arts and Humanities) est une infrastructure paneuropéenne pour les chercheurs en arts et en sciences humaines qui travaillent avec des méthodes de calcul.

Elle soutient la recherche numérique ainsi que l'enseignement des méthodes de recherche numérique.

Site web : https://www.dariah.eu/

Services proposés par DARIAH : https://www.dariah.eu/tools-services/tools-and-services/

Lien vers la bibliothèque zotero du réseau DARIAH ERIC :https://www.zotero.org/groups/113737/doing_digital_humanities_-_a_dariah_bibliography

DART-Europe

id : dart-europe

types : Ressources

mots-clés :

filename : dart-europe

Créé en 2005, DART-Europe est un partenariat entre bibliothèques nationales et universitaires et établissements européens d’enseignement supérieur qui fournit un portail d’accès aux thèses électroniques de 29 pays européens.

Site web : https://www.dart-europe.org/basic-search.php

Data Bnf

id : data bnf

types : Ressources

mots-clés :

filename : data_bnf

La bibliothèque de France nous guide dans ses ressources en regroupant sur une même page toutes les informations issues de ses différents catalogues, ainsi que de sa bibliothèque numérique Gallica.

Le projet Data BnF vise ainsi à accroître la visibilité des données de la BnF par une meilleure exposition sur le Web, à faciliter la réutilisation des métadonnées par des tiers, à fédérer les données de la BnF au sein et au-delà des catalogues, contribuer à la coopération et à l’échange de métadonnées par la création de liens entre des ressources structurées et de confiance.

Voir Web sémantique

Site web : https://data.bnf.fr/

Data Documentation Initiative

id : data documentation initiative

types : Groupements institutionnels

mots-clés :

filename : data_documentation_initiative

La Data Documentation Initiative (DDI) est une norme internationale permettant de décrire les données produites par les enquêtes et autres méthodes d'observation dans le domaine des sciences sociales, comportementales, économiques et de la santé. La DDI est une norme gratuite qui permet de documenter et de gérer les différentes étapes du cycle de vie des données de recherche, telles que la conceptualisation, la collecte, le traitement, la distribution, la découverte et l'archivage.

La documentation des données avec DDI facilite la compréhension, l'interprétation et l'utilisation des données par les personnes, les systèmes logiciels et les réseaux informatiques. La norme propose des outils de description des données (DDI Codebook) et du cycle de vie des données (DDI Lifecycle), des vocabulaires contrôlés (Controlled vocabularies) ainsi que des outils de représentation des classifications statistiques (XKOS) ou encore des opérations de transformation des données (SDTL).

Source : https://groupes.renater.fr/sympa/info/dh

Data paper

id : data paper

types : Pratiques et méthodes

mots-clés :

filename : data_paper

Un papier de données ou articles de données est un article scientifique visant à présenter un jeu de données : la méthode d’acquisition de ces données, leur structuration, et leur potentiel de réutilisation. Ce type d’article peut être publié dans des revues classiques, ou dans des data journals qui sont spécialisés dans la publication de data paper.

Voir aussi : Plan de gestion des données, Accessibilité des données

DBpedia

id : dbpedia

types : Ressources

mots-clés :

filename : dbpedia

DBpedia est un projet universitaire et communautaire d'exploration et d’extraction automatiques de données dérivées de Wikipédia. Son principe est de proposer une version structurée et sous forme de données normalisées au format du web sémantique des contenus de chaque fiche encyclopédique.

DBpedia vise aussi à relier à Wikipédia (et inversement) des ensembles d'autres données ouvertes provenant du Web de données.

Voir Web sémantique, Open Data.

Site web : http://fr.dbpedia.org

DeepL

id : deepl

types : Outils logiciels

mots-clés :

filename : deepl

Plateforme de traduction automatique multilingue (voir Intelligence artificielle).

Site web : https://www.deepl.com/fr/translator

Déploiement d’outil

id : déploiement d’outil

types : Pratiques et méthodes

mots-clés :

filename : deploiement_d_outil

Le déploiement consiste à faire passer un prototype à une version pérenne accessible en ligne et une fois cette version stabilisée, à y intégrer les données traitées ou à venir.

Dépouillement

id : dépouillement

types : Pratiques et méthodes

mots-clés :

filename : depouillement

Première étape d'une analyse documentaire : repérage et sélection d'informations contenues dans un document en fonction de critères prédéterminés.

Le dépouillement commence par la sélection des parties composantes (articles, chapitres, images, séquences, etc.) qui seront décrites et analysées en fonction de la politique documentaire.

id : digital methods initiative

types : Groupements institutionnels, Outils logiciels

mots-clés :

filename : digital_methods_initiative

La Digital Methods Initiative est un groupement européen de chercheurs et de doctorants dont les recherches portent sur l’étude de l’Internet.

Pour ce faire, elle développe des outils et des méthodes qui permettent de réutiliser les dispositifs et les plateformes en ligne (youtube, twitter, facebook, google) dans une optique de recherche sur des problématiques sociales et politiques. Un grand nombre d’outils est disponible sur le site web.

Site web : https://wiki.digitalmethods.net/Dmi/DmiAbout

Diigo

id : diigo

types : Outils logiciels

mots-clés :

filename : diigo

Diigo est une plateforme en ligne permettant de sauvegarder des pages et des contenus web depuis un navigateur et d’y ajouter des tags et des annotations.

Diigo permet un usage personnel ou collaboratif et le contenu d’un compte diigo peut être privé ou public.

Site web : https://www.diigo.com/

Dissemin

id : dissemin

types : Ressources

mots-clés :

filename : dissemin

Dissemin est une plateforme web qui récolte des métadonnées depuis différentes sources et qui détermine la disponibilité (ou non) du texte intégral des publications des chercheurs. Cet outil aide leurs auteurs à les télécharger en un clic vers un dépôt ouvert. Grâce à lui, les chercheurs peuvent donc s’assurer que leurs publications sont librement accessibles.

Il a été conçu pour encourager l’usage des dépôts (plutôt que des pages personnelles) mais n’est pas un dépôt lui-même car il ne stocke pas le texte intégral des publications. Il fournit en revanche les liens vers les articles disponibles en texte intégral.

Voir Zenodo, HAL, Science ouverte, Open Access

Site web : https://dissem.in

Dive

id : dive

types : Outils logiciels

mots-clés :

filename : dive

Dive est un logiciel d’exploration, d’analyse et de visualisation de données.

Site web : https://medialab.sciencespo.fr/outils/dive/

Django

id : django

types : Outils logiciels

mots-clés :

filename : django

Django est un framework web open source en Python. Il a pour but de rendre le développement d’applications web simple et basé sur la réutilisation de code.

Site web : https://www.djangoproject.com/

Tutoriel : https://www.youtube.com/watch?v=rHux0gMZ3Eg&ab_channel=ProgrammingwithMosh

DMI-TCAT

id : dmi-tcat

types : Outils logiciels

mots-clés :

filename : dmi-tcat

Twitter Capture and Analysis Toolset (DMI-TCAT) capture et analyse de différentes façons les données de la plateforme twitter.

Site web : https://wiki.digitalmethods.net/Dmi/ToolDmiTcat

DOAB

id : doab

types : Ressources

mots-clés :

filename : doab

DOAB (Directory of Open Access Books) est une plateforme en ligne créée en 2012 qui indexe des livres scientifiques en libre accès, autrement dit, des livres dont le contenu a été révisé et validé par les pairs.

L’objectif principal de DOAB est ainsi d’accroître la visibilité de ces publications en libre accès. Il invite en effet les éditeurs scientifiques à fournir les métadonnées de leurs ouvrages en libre accès de façon à rendre ces métadonnées moissonnables par les catalogues de bibliothèques ou les agrégateurs de contenu.

Site web : https://directory.doabooks.org

DOAJ

id : doaj

types : Ressources

mots-clés :

filename : doaj

Créé en 2003, DOAJ (Directory of Open Access Journals) est un annuaire en ligne qui recense les revues scientifiques en libre accès. Il recense toutes les revues quel que soit leur champ disciplinaire, leur langue ou leur origine géographique.

Il entend ainsi augmenter la visibilité, l’accessibilité, la réputation et l’utilisation des revues scientifiques en libre accès.

Voir Open Access

Site web : https://doaj.org

Document

id : document

types : Pratiques et méthodes

mots-clés :

filename : document

Un document renvoie à un ensemble formé par un support et une information, celle-ci enregistrée de manière persistante. Il a une valeur explicative, descriptive ou de preuve.

DOI

id : doi

types : Pratiques et méthodes

mots-clés :

filename : doi

Le DOI (Digital Object Identifier / identifiant d’objet numérique) est le cœur d’un mécanisme d'identification de ressources numériques, comme les revues, articles scientifiques, rapports, vidéos, etc. Il est parfois comparé aux ISSN ou ISBN pour le web, mais c'est aussi une alternative à l’instabilité des URL par l’association de la localisation du document et des métadonnées qui lui sont liées.

Un DOI unique est attribué à chaque ressource et ne sera pas réutilisé. Ex. pour la Revue Cybergeo : DOI : 10.4000/cybergeo.2373.

Voir Référencement, Interopérabilité, ARK

Définition du DOI sur La Maison des revues et des livres

Données de la recherche

id : données de la recherche

types : Pratiques et méthodes

mots-clés :

filename : donnee_de_la_recherche

Selon l’OCDE « Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. ».

Les données de la recherche forment également l’ensemble des informations et des matériaux produits par les chercheurs et s’apparentent ainsi à une partie des archives de la recherche. Les données sont donc à la fois des informations collectées et produites lors d’un processus de recherche.

Voir Enrichissement des données, FAIR Data, Plan de gestion des données, Open Data.

id : droit d’auteur

types : Pratiques et méthodes

mots-clés :

filename : droit_d_auteur

Le droit d’auteur se décompose en deux ensembles :

a) Les droits moraux, inaliénables, qui concernent l’intégrité de l’œuvre, le droit de retrait et de repentance. Ils ne peuvent pas être cédés.

b) Les droits patrimoniaux qui concernent l’exploitation de l’œuvre (reproduction, représentation). Ils peuvent être cédés par l’ayant droit, à l’image d’un écrivain qui cède les droits de reproduction à son éditeur. Ces droits sont possédés par l’auteur de l’œuvre protégée. Il les transmet à ses héritiers – ou ayants droit – à sa mort.

Si, en France, la durée de protection des droits patrimoniaux est de soixante-dix ans après la mort de l’auteur (sauf dérogation : les auteurs morts pour la France pendant les Guerres mondiales bénéficient de trente ans de protection supplémentaire), les droits moraux sont eux inaliénables et perdurent dans le temps.

Voir le code du patrimoine sur le droit d'auteur

DTD

id : dtd

types : Pratiques et méthodes

mots-clés :

filename : dtd

En XML, le DTD (Document Type Definition ou Définition de Type de Document) est un fichier ou une partie de fichier qui permet de définir le modèle ou la structure d’un document.

DtmVic

id : dtmvic

types : Outils logiciels

mots-clés :

filename : dtmvic

DtmVic, pour Data and Text Mining : Visualisation, Inférence, Classification, est un logiciel d'analyse textométrique.

Site web : https://corli.huma-num.fr/dtmvic/

Dublin Core

id : dublin core

types : Pratiques et méthodes

mots-clés :

filename : dublin_core

Le Dublin Core est un modèle de description de tout type de ressource numérique (audio, vidéo, livre, objet) qui propose un socle de quinze éléments. Ces quinze champs sont les suivants : Titre, Créateur, Sujet, Description, Source, Éditeur, Date, Couverture, Relation, Format, Langue, Type, Identifiant, Contributeur, Droit. Devenu standard international, il permet donc l’échange de données entre différents projets ou outils et facilite l’interopérabilité des données.

Pour plus de précisions sur l’application du Dublin Core, voir la présentation très précise sur le site de la BnF.

Le Dublin Core n’impose pas de compléter tous les champs mais pour une meilleure diffusion et pérennité des données, il est important d’en remplir le plus possible. Ces champs sont tous répétables, sans aucune limite.

Voir Interopérabilité

Site web : https://dublincore.org/

Encodage

id : encodage

types : Pratiques et méthodes

mots-clés :

filename : encodage

Le terme d'encodage recouvre plusieurs acceptions.

De façon générale, il s'agit de l'action de transcrire des données selon un code ou un protocole.

L'encodage est une représentation normalisée de données textuelles : c'est l’action de structurer un texte avec des balises de différents formats (HTML, TEI, EAD, etc., chaque format possédant son propre langage mais également ses propres finalités). L’encodage peut concerner aussi bien des spécifications de mise en forme que des indications de structure ou des interprétations sémantiques.

En informatique, l'encodage désigne également la représentation des caractères par un nombre hexadécimal selon une norme. UTF-8 et ISO 8859-1 sont deux correspondances fréquemment utilisées entre des caractères et leur représentation hexadécimale.

Enregistrement

id : enregistrement

types : Pratiques et méthodes

mots-clés :

filename : enregistrement

Terme consacré dans les bases de données, c’est l’ensemble des valeurs d’une ligne d’un tableau contenant lui-même un certain nombre de colonnes (que sont les champs). C’est équivalent à une notice ou à une fiche.

Enrichissement des données

id : enrichissement des données

types : Pratiques et méthodes

mots-clés :

filename : enrichissement_des_donnees

Ajout d’informations complémentaires pour aider la lecture, comme la normalisation des noms propres, les annotations, etc. Différents types d’enrichissements :

Enrichissement par complétion : ajout de formes normalisées de noms propres et ajout de références bibliographiques (identifiants de notices d’autorités de catalogues en ligne).

Enrichissement par annotation : ajout de commentaires sur le sens du texte rédigé, ajout de rapprochements avec d’autres documents ou avec des œuvres dites et écrites, ajout de références complémentaires, etc.

ENT

id : ent

types : Pratiques et méthodes, Technologies et familles d’outils

mots-clés :

filename : ent

ENT (Espace Numérique de Travail ou Environnement Numérique de Travail) est un ensemble d’outils permettant à un individu d’accéder à distance aux informations relatives à son travail (dossiers, boîte mail, fichiers, etc.) et de communiquer et collaborer avec ses collègues.

Souvent, l’ENT comprend un système de gestion documentaire, un moteur de recherche et un réseau social d’entreprise. Il rend plus flexible le lieu et le temps de travail.

Entité nommée

id : entité nommée

types : Pratiques et méthodes, Technologies et familles d’outils

mots-clés :

filename : entite_nommee

Une entité nommée est une expression linguistique référentielle, souvent associée aux noms propres et aux descriptions définies, qui a émergé avec le besoin d’applications de recherche d’information. Les entités nommées peuvent être objet de traitements à divers degrés de finesse (détection, extraction, reconnaissance, liaison). Elles sont l’objet d’une tâche du traitement automatique du langage naturel appelée reconnaissance d’entités nommées.

Entrepôt OAI-PMH

id : entrepôt oai-pmh

types : Pratiques et méthodes, Technologies et familles d’outils

mots-clés :

filename : entrepot_oai-pmh

C’est un répertoire de serveur web sur lequel les fournisseurs de données peuvent déposer leurs métadonnées en attendant qu’un robot vienne les « moissonner » afin de les intégrer à son propre catalogue. Pour cela il faut utiliser le protocole OAI-PMH.

Environnement de développement intégré (IDE)

id : environnement de développement intégré (ide)

types : Technologies et familles d’outils

mots-clés :

filename : environnement_de_developpement_integre

Un environnement de développement intégré, ou IDE, est un logiciel de création d'applications, qui rassemble des outils de développement fréquemment utilisés dans une seule interface utilisateur graphique (GUI).

Un IDE se compose habituellement des éléments suivants :

Éditeur de code source : un éditeur de texte qui aide à la rédaction du code logiciel, avec des fonctions telles que la coloration syntaxique avec repères visuels, la saisie automatique en fonction du langage et la vérification de bogues dans le code pendant la rédaction.

Utilitaires d'automatisation de version locale : des utilitaires qui permettent d'automatiser des tâches simples et reproductibles lors de la création d'une version locale du logiciel à destination du développeur lui-même, par exemple la compilation du code source en code binaire, la mise en paquet du code binaire et l'exécution de tests automatisés

Débogueur : un programme qui permet de tester d'autres programmes en affichant l'emplacement des bogues dans le code d'origine

Site web : https://www.redhat.com/fr/topics/middleware/what-is-ide

Épi-revue

id : épi-revue

types : Pratiques et méthodes

mots-clés :

filename : epi-revue

Une épi-revue est une revue électronique en libre accès, composée d’articles évalués par les pairs et soumis via un dépôt dans une archive ouverte telle que HAL.

Voir aussi Science ouverte

Site web d'Episciences : https://www.ccsd.cnrs.fr/epi-revues

Episciences

id : episciences

types : Ressources

mots-clés :

filename : episciences

Episciences est une plateforme qui héberge et donne accès aux épi-revues. La soumission des articles se fait par un processus de dépôt dans une archive ouverte.

Cette plateforme est développée et administrée par le CCSD.

Site web : https://episciences.org

ERMS

id : erms

types : Technologies et familles d’outils

mots-clés :

filename : erms

ERMS (Electronic Resource Management System) est un type de logiciels conçu pour favoriser la gestion globale des ressources numériques, notamment des bouquets de périodiques électroniques et des bases de données en ligne.

Il fournit de nombreuses fonctionnalités telles que le bulletinage des périodiques, la gestion des abonnements, la gestion des droits d’utilisation, la gestion des licences et des statistiques ou encore le suivi des collections.

Il existe des ERMS libres comme CORAL ou propriétaires comme Verde.

eScriptorium

id : escriptorium

types : Outils logiciels

mots-clés :

filename : escriptorium

eScriptorium est une plateforme web ayant pour but de fournir un ensemble d'outils pour transcrire, annoter, et éditer numériquement des documents historiques.

eScriptorium permet :

de transcrire automatiquement des documents manuscrits ou imprimés à l'aide de techniques d'apprentissage automatique (kraken) ;

l’emploi une interface utilisateur ergonomique pour segmenter ou annoter les documents textes sous forme d’image et réaliser des transcriptions manuelles ;

la manipulation, l’échange et la conversion de documents et images de différents formats: importation et exportation des transcriptions ou annotations avec ALTO-XML ou Page XML, importation d’images au format zip , IIIF, documents PDF vers les applications eScriptorium ;

de faciliter le travail collaboratif sur les corpus de documents (annotation collaborative, partage de modèles d’IA, versioning).

Site web et ressources : https://escriptorium.fr/

Présentation : https://ephenum.hypotheses.org/1412

Eulexis

id : eulexis

types : Outils logiciels

mots-clés :

filename : eulexis

Eulexis est un logiciel libre et gratuit de lemmatisation de textes en grec ancien. Il existe également une version web de ce logiciel appelée Eulexis-web.

Il s’apparente au logiciel Collatinus qui existe pour les textes latins.

Sites web : https://outils.biblissima.fr/fr/eulexis/ ; https://outils.biblissima.fr/fr/eulexis-web/

id : exmaralda

types : Outils logiciels

mots-clés :

filename : exmaralda

EXMARaLDA est un ensemble d’outils numériques permettant la transcription, l’annotation, la gestion, la recherche et l’analyse de corpus oraux.

Site web : https://exmaralda.org/en/

Expand Tiny URLs

id : expand tiny urls

types : Outils logiciels

mots-clés :

filename : expand_tiny_urls

Il s’agit d’un outil de la Digital Methods Initiative qui permet de déplier des URLs qui ont été raccourcies par des outils tels que tinyurl.com ou bit.ly, particulièrement utilisés sur les réseaux sociaux comme twitter ou facebook.

Site web : https://tools.digitalmethods.net/beta/expandTinyUrls/

Exposition virtuelle

id : exposition virtuelle

types : Pratiques et méthodes

mots-clés :

filename : exposition_virtuelle

L’exposition virtuelle est un moyen de plus en plus utilisé par les musées, les détenteurs de fonds culturels, ainsi que les artistes pour diffuser leurs œuvres sur le web. Elle permet de créer des parcours thématiques à partir des données publiées.

id : fair data

types : Pratiques et méthodes

mots-clés :

filename : fair_data

L’objectif des principes FAIR (Faciles à trouver, Accessibles, Interopérables, Réutilisables) est de favoriser la découverte, l’accès, l’interopérabilité et la réutilisation des données partagées.

Chaque principe FAIR se décline en un ensemble de caractéristiques que doivent présenter les données et les métadonnées pour faciliter leur découverte et leur utilisation par les hommes mais aussi par les machines.

Voir : https://www6.inrae.fr/datapartage/Produire-des-donnees-FAIR - https://www6.inrae.fr/datapartage/Produire-des-donnees-FAIR/Comment-FAIR-en-pratique

Feedly

id : feedly

types : Outils logiciels

id : fouille de texte

types : Pratiques et méthodes

mots-clés :

filename : fouille_de_texte

Extraction de connaissances à l'aide de mesures statistiques ou de repérage d'unités textuelles dans un ou plusieurs textes. La fouille de texte (text mining) permet ainsi d’extraire les entités nommées.

Framework

id : framework

types : Technologies et familles d’outils

mots-clés :

filename : framework

Un framework propose une infrastructure de développement pour un informaticien afin qu’il puisse créer une application (des lignes de code permettant de réaliser des actions).

Frantext

id : frantext

types : Ressources

mots-clés :

filename : frantext

Frantext est une base de données de textes français. Elle contient principalement des textes littéraires et philosophiques, et quelques textes scientifiques et techniques.

La base de données a été développée à l’ATILF (laboratoire d'Analyse et Traitement Informatique de la Langue Française) dans l'optique de servir de réservoir d'exemples pour le Trésor de la Langue Française (TLF). Actuellement, elle est disponible en ligne. Elle est utilisée, par exemple, par les linguistes comme source d'exemples pour illustrer des faits de langue. Elle permet de faire des recherches simples et complexes sur des formes, des lemmes ou des catégories grammaticales.

Site web : https://www.frantext.fr/

Frantiq

id : frantiq

types : Groupements institutionnels

id : gdb géodatabase

types : Outils logiciels

mots-clés :

filename : gdb

Géodatabase de fichiers ESRI permettant de stocker des tables d'attributs et des ensembles de données vectorielles et/ou matricielles. Elle remplace la géodatabase personnelle MDB en offrant des performances plus élevées et des avantages en termes de stockage et de manipulation.

GED

id : ged

types : Pratiques et méthodes

mots-clés :

filename : ged

La GED (Gestion Electronique des Documents) est un système informatisé permettant l’acquisition, le stockage, le classement, l’indexation, l’archivage des documents et des données dématérialisés. Ce système encourage le travail collaboratif ainsi que l’échange et la diffusion des données au sein d’un réseau, d’une institution, d’une entreprise.

id : github

types : Outils logiciels

mots-clés :

filename : github

GitHub est une plateforme d’hébergement, de développement et de partage de logiciels et codes informatiques.

Différents outils sont associés à GitHub :

Github organizations meta-data lookup : permet d’extraire les métadonnées d’une organisation sur Github.
Github repositories meta-data lookup : récupère les métadonnées d’un répertoire sur Github.
Github repositories scraper : récupère les forks d’un répertoire Github. Les fork sont les évolutions technologiques créées à partir du code source d’un logiciel.
Github scraper : permet, à partir d’une liste d’utilisateurs de Github, de récupérer la liste des interactions entre des utilisateurs ainsi que celle des relations entre des utilisateurs et un répertoire.
Github user meta-data lookup : permet d’extraire les métadonnées relatives à un utilisateur sur Github.
GithubContributorsScraper : permet de savoir quels utilisateurs de Github ont contribué au code source d’un répertoire Github.

Voir Git

Site web : https://github.com

GitLab

id : gitlab

types : Outils logiciels

mots-clés :

filename : gitlab

Le GitLab d’Huma-Num se charge de l’hébergement sécurisé et du partage maîtrisé des fichiers de codes suivant le protocole git.

Ses principales fonctionnalités sont la gestion de versions et de dépôts, l’intégration continue, la gestion de tickets, la génération de sites web.

Site web : https://documentation.huma-num.fr/gitlab/

Google Autocomplete

id : google autocomplete

types : Outils logiciels

mots-clés :

filename : google_autocomplete

Cet outil permet de récupérer les suggestions d’autocomplétion de Google.

L’autocomplétion est la fonctionnalité permettant d’accélérer la saisie des mots-clés dans la barre de recherche en proposant des suggestions de requêtes.

Site web : https://tools.digitalmethods.net/beta/scrapeGoogle/autocomplete.php

Google Bookmarklets

id : google bookmarklets

types : Outils logiciels

mots-clés :

filename : google_bookmarklets

Les Google Bookmarklets sont deux boutons à ajouter aux favoris de son navigateur. Le premier permet, à partir d’une page de résultats Google de basculer sur l’ancienne version du moteur de recherche avec 100 résultats par page. Le second permet de télécharger ces résultats au format CSV ou de les stocker dans la mémoire du navigateur.

Site web : https://medialab.sciencespo.fr/outils/google-bookmarklets/

Google Play Store Scraper

id : google play store scraper

types : Outils logiciels

mots-clés :

filename : google_play_store_scraper

Google Play Store Scraper est un outil permettant d'extraire les informations détaillées relatives à une application, de collecter les applications qui lui sont liées, de récupérer les permissions des applications ainsi que la liste des applications pour un mot-clé donné.

Voir aussi : Web scraping

Site web : https://wiki.digitalmethods.net/Dmi/ToolGooglePlayStoreScraper

GPKG GéoPackage

id : gpkg géopackage

types : Outils logiciels

mots-clés :

filename : gpkg

Format de données géographiques non-propriétaire, GeoPackage est construit comme une base de données SQLite autonome. Défini par l'Open Geospatial Consortium et publié en 2014, c'est le format de données par défaut du logiciel libre QGIS.

GPS

id : gps

types : Pratiques et méthodes

mots-clés :

filename : gps

GPS (Global Positioning System) : système permettant de déterminer les coordonnées géographiques d’un point du globe à partir de l’observation des signaux radio émis par des satellites en orbite autour de la terre.

En fonction de la méthode d’utilisation, du nombre et du type de récepteurs exploités, la précision obtenue sur les coordonnées varie de 100 mètres à quelques centimètres. Ces satellites ont été mis en orbite par les États-Unis d’Amérique.

id : hackathon

types : Pratiques et méthodes

mots-clés :

filename : hackathon

Contraction des termes « hack » (pirater) et « marathon », un hackathon désigne le regroupement de plusieurs informaticiens sur une courte période - quelques jours - dont le but est de collaborer à la création de programmes informatiques innovants.

HAL

id : hal

types : Ressources

mots-clés :

filename : hal

L’archive ouverte pluridisciplinaire HAL est destinée au dépôt et à la diffusion d'articles scientifiques de niveau recherche, publiés ou non, et de thèses, émanant des établissements d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Voir Science ouverte).

Site web : https://hal.archives-ouvertes.fr

id : heurist

types : Outils logiciels

mots-clés :

filename : heurist

Huma-Num Box

id : huma-num box

types : Outils logiciels

mots-clés :

filename : huma-num_box

La Huma-Num Box est un dispositif de stockage sécurisé et de gestion de jeux de données volumineux. Elle est destinée aux données tièdes et froides c’est-à-dire que peu d’accès en écriture et en lecture seront faites durant la vie de ces données qui revêtent néanmoins une valeur patrimoniale. Le dispositif ne gère pas l’association entre les données et leurs métadonnées et seuls des fichiers (et non des bases de données) peuvent être stockés sur Huma-Num Box.

Site web : https://documentation.huma-num.fr/humanum-box/

id : hyphe browser

types : Outils logiciels

mots-clés :

filename : hyphe_browser

Hyphe Browser est une application à télécharger fournissant un navigateur web basé sur le moteur Chrome et permettant de naviguer sur le web tout en étant connecté à Hyphe. Cet outil permet de constituer un corpus web tout en visualisant les pages web des sites ce qui en facilite la sélection et la catégorisation.

Site web : https://medialab.sciencespo.fr/outils/hyphe-browser/

Hypotheses.org

id : hypotheses.org

types : Outils logiciels, Ressources

mots-clés :

filename : hypotheses.org

Hypothèses est une plateforme web faisant partie du portail OpenEdition et qui regroupe des milliers de blogs (ou carnets) dans tous les domaines des sciences humaines et sociales. Ces blogs sont librement accessibles.

Site web : https://fr.hypotheses.org

IDEAS

id : ideas

types : Ressources

mots-clés :

filename : ideas

IDEAS est une base de données bibliographiques spécialisée en économie et développée par RePec.

Site web : https://ideas.repec.org

Identifiant

id : identifiant

types : Pratiques et méthodes

mots-clés :

filename : identifiant

En informatique, il s’agit d’un ensemble de caractères ou de symboles permettant d’identifier une entité précise au sein d’un type d’entité. L’identifiant est en principe unique pour chaque objet.

Il existe différents types d’identifiants, le plus commun étant l’identifiant utilisateur qui permet, dans un système multi-utilisateurs, à une personne de se connecter à son compte personnel (pour accéder à ses e-mails par exemple).

Dans ce cadre, l’identifiant est souvent composé d’un nom d’utilisateur et d’un mot de passe. Il existe également des identifiants pour identifier des objets informatiques au sein d’un langage informatique ou d’une base de données par exemple.

Voir Login, DOI, ORCID, ARK, PIDOPIDoR dans OPIDoR

Identifiant pérenne

id : identifiant pérenne

types : Pratiques et méthodes

mots-clés :

filename : identifiant_perenne

Un identifiant pérenne est un code alphanumérique associé à un objet ou une ressource de façon permanente. Il ne changera pas si l’objet est renommé et déplacé. Il est gérable et disponible à long terme.

Un identifiant pérenne peut également être attribué à une personne, c’est le cas de l’IdRef ou encore d’ORCID.

Voir DOI, ARK, PIDOPIDoR dans OPIDoR

IdRef

id : idref

types : Outils logiciels, Ressources

mots-clés :

filename : idref

Identifiants et Référentiels pour l’Enseignement supérieure et la Recherche. Application Web développée et maintenue par l’ABES (Agence bibliographique de l’enseignement supérieur, www.abes.fr/) qui permet, à des structures ou des usagers, d’interroger, consulter, créer et enrichir des notices d’autorité (https://www.idref.fr). Les catalogues Calames, SUDOC, theses.fr ou Persée l’utilisent pour leurs notices d’autorité.

Voir http://documentation.abes.fr/aideidrefutilisateur/index.html

IIIF

id : iiif

types : Groupements institutionnels, Ressources

mots-clés :

filename : iiif

Le consortium IIIF (International Image Interoperability Framework) est né du constat que les bibliothèques numériques se sont développées sans concertation technique, notamment pour la production des images, ce qui rend aujourd’hui difficile leur partage. Si les protocoles d’échange des données (OAI-PMH par exemple) sont aujourd’hui très développés, rien n’existait pour les images.

L’objectif du consortium est de développer un cadre d’interopérabilité pour la diffusion d’images haute résolution grâce à des API développées par le consortium. Une application possible serait de consulter sur une même interface, des images numérisées de plusieurs bibliothèques numériques. Le visualiseur Mirador a été développé à cette fin.

Sites web : < https://iiif.io>, https://doc.biblissima.fr/iiif

Voir aussi : https://doc.biblissima.fr/

Image matricielle

id : image matricielle

types : Pratiques et méthodes

mots-clés :

filename : image_matricielle

Une image matricielle est une image numérique constituée d’un raster, qui est une matrice faite de cases, plus généralement appelées pixels. Chaque case contient une couleur codée par un nombre. La qualité d’une image matricielle dépend de la profondeur de la couleur par pixel (calculée en bits) ainsi que de la hauteur et la largeur de l’image (calculée en pixel).

Ce type d’image convient à la numérisation d’images complexes comme les photographies. Toutefois, ce sont des images qui pèsent lourd et prennent donc plus de place en mémoire. De plus, les images matricielles supportent mal les processus de redimensionnement (agrandissement, rétrécissement) qui se traduisent par une perte de qualité.

Voir Image vectorielle

Image numérique

id : image numérique

types : Pratiques et méthodes

mots-clés :

filename : image_numerique

Image acquise, créée, traitée et stockée sous forme binaire, c'est-à-dire acquise par des convertisseurs analogiques-numériques situés dans des dispositifs comme les scanners, les appareils photo, etc.

Les formats d’images numériques les plus fréquents sont le .JPG (compression destructrice, poids de l’image réduit), le .GIF (peut être animé, format léger), le .PNG (compression sans perte, bon compromis), le .PDF (possibilité de contenir des images en pixels et des données vectorielles, conserve la mise en page), le .TIFF (utilisé par les imprimeurs).

Les formats recommandés :

Images à mettre sur le web : .jpg
Si besoin d’une compression non destructrice : .png pour informatique et .tiff pour l’impression
Pour un CV, mémoire, ou autres documents : .pdf

Image Scraper

id : image scraper

types : Outils logiciels

mots-clés :

filename : image_scraper

Image Scraper récupère les images d’une page web donnée. Il suffit de saisir l’URL de la page en question dans Image Scraper pour extraire tous les fichiers images.

Voir aussi : Web scraping

Site web : https://tools.digitalmethods.net/beta/imagesDeep/

Image vectorielle

id : image vectorielle

types : Pratiques et méthodes

mots-clés :

filename : image_vectorielle

Une image vectorielle est une image numérique constituée à partir de formules mathématiques. En effet, l’image vectorielle est composée de formes (ligne, ellipse, polygone, etc.) qui possèdent des caractéristiques telles que hauteur, largeur, rayon, longueur, couleur. Ces formes sont elles-mêmes composées de vecteurs (d’où « vectorielle ») dont chacun possède une norme, une direction et un sens traduits par des formules mathématiques. Ainsi, l’intérêt de ce type d’image réside dans le poids plus léger et dans l’absence de perte de qualité en cas de redimensionnement puisque les formules mathématiques peuvent être re-calculées.

L’image vectorielle peut être générée automatiquement et certaines de ses formes animées. Du point de vue de la couleur, chaque forme contient une couleur ou son dégradé. Les images vectorielles ne peuvent pas être utilisées pour la numérisation d’images complexes. D’ailleurs, il est nécessaire d’employer des logiciels dédiés pour créer ce type d’images. Le format standard est le SVG. L’image vectorielle sert notamment à l’animation 2D ou à la cartographie quand les informations géographiques sont référencées dans un système de coordonnées géographiques connus.

Voir Image matricielle

IMPACT

id : impact

types : Outils logiciels

mots-clés :

filename : impact

IMPACT est un outil de consultation, d’annotation et de transcription de sources audio-visuelles développé par l’Université de Lausanne.

Site web : https://wp.unil.ch/impact

Indexation

id : indexation

types : Pratiques et méthodes

mots-clés :

filename : indexation

L’indexation est l’opération qui consiste à analyser une ressource documentaire de façon à décrire le contenu de cette ressource dans sa notice bibliographique, au moyen d’un indice de classification ou de mots-clés.

Cette opération permet de rendre la ressource visible au sein du catalogue et d’en faciliter la recherche et l’accès.

Voir RAMEAU

Information géographique

id : information géographique

types : Pratiques et méthodes

mots-clés :

filename : information_geographique

Information qui est reliée à une localisation sur la Terre, exprimée par rapport à un système de référence.

Une information géographique est une information que l’on peut situer sur un plan, une carte, directement par des coordonnées ou indirectement par relation à une autre information géographique. C’est en particulier, l’information sur les objets ou phénomènes naturels, les ressources culturelles, humaines ou économiques.

Infrastructure de recherche

id : infrastructure de recherche

types : Groupements institutionnels

mots-clés :

filename : infrastructure_de_recherche

Une infrastructure de recherche se caractérise par des installations, ressources ou services essentiels, uniques et d’envergure nationale voire européenne ou internationale, dont l’objet est de conduire et soutenir une activité de recherche d’excellence. Elle comprend des équipements scientifiques, des ressources telles que des collections, archives et données scientifiques, des services et infrastructures numériques, et tout autre outil essentiel pour soutenir une recherche et des innovations au meilleur niveau.

Source : https://www.enseignementsup-recherche.gouv.fr/fr/la-feuille-de-route-nationale-des-infrastructures-de-recherche-2021-84056

InoReader

id : inoreader

types : Outils logiciels

mots-clés :

filename : inoreader

InoReader est une plateforme en ligne d’agrégation de contenus qui permet notamment la gestion des abonnements aux flux RSS.

Voir aussi Feedly, Netvibes

Site web : https://www.inoreader.com/language/french

Inrae

id : inrae

types : Ressources

mots-clés :

filename : inrae

Site de gestion et de partage des données scientifiques.

Site web : https://data.inrae.fr

Instapaper

id : instapaper

types : Outils logiciels

mots-clés :

filename : instapaper

Instapaper est un outil de veille permettant d’agréger, sauvegarder, annoter des pages web sur une interface personnelle.

Voir Pocket, Evernote

Site web : https://www.instapaper.com

Intelligence artificielle

id : intelligence artificielle

types : Pratiques et méthodes

mots-clés :

filename : intelligence_artificielle

L’intelligence artificielle (IA, ou « AI » en anglais, pour Artificial Intelligence) est définie par l’un de ses créateurs comme « la construction de programmes informatiques qui s’adonnent à des tâches qui sont, pour l’instant, accomplies de façon plus satisfaisante par des êtres humains car elles demandent des processus mentaux de haut niveau tels que : l’apprentissage perceptuel, l’organisation de la mémoire et le raisonnement critique » (M. Lee Minsky).

Il s’agit en quelque sorte de l’utilisation des ordinateurs ou de processus électroniques dans le but d’imiter le comportement humain, dans les domaines du raisonnement (jeux ou pratique des mathématiques), de la compréhension des langues naturelles, dans la commande d’un robot, etc.

id : ircom

types : Groupements institutionnels, Ressources

mots-clés :

filename : ircom

Le Consortium Corpus Oraux et Multimodaux a été labellisé en août 2011 par Huma-Num, jusqu'en décembre 2015. Il a pour missions principales :

d’organiser et d’accompagner le développement de corpus (ensemble cohérent de ressources - sans nécessairement impliquer un "gros" volume) oraux et multimodaux en linguistique en aidant les chercheurs à s’approprier les outils nécessaires et à développer des standards communs de référence ;
d’aider à développer la valorisation, la visibilité et l'accessibilité des fonds existants ;
d’aider à améliorer leur mise à disposition et leur interopérabilité afin d’intégrer les réseaux internationaux (notamment CLARIN) ;
d’intégrer la communauté des producteurs et utilisateurs de corpus oraux et multimodaux dans ces pratiques et réflexions.

Ceci passe notamment par l’organisation d’une concertation large sur les standards et formats de l’archivage et du traitement numérique, de sessions de formations et de définition de bonnes pratiques. Des groupes de travail ont été mis en place.

Site web : IRCOM

ISBD

id : isbd

types : Pratiques et méthodes

mots-clés :

filename : isbd

L’ISBD (International Standard Bibliographic Description) est un ensemble de règles validées au niveau international qui déterminent la façon dont doit s’effectuer la description de tous de types de ressources documentaires publiées. Il est élaboré par l’IFLA (International Federation of Library Associations and Institutions).

L’ISBD définit tous les éléments de description bibliographique d’une notice (titre, auteur, éditeur, date, etc.) ce qui en garantit la rigueur, la fiabilité et en facilite la communicabilité entre bibliothèques.

ISBN

id : isbn

types : Pratiques et méthodes

mots-clés :

filename : isbn

L’ISBN (International Standard Book Number) est un numéro international normalisé permettant l’identification d’un livre dans une édition donnée. Ce numéro doit figurer sur tous les exemplaires d’une même œuvre dans une même édition.

L’ISBN a été conçu pour simplifier le traitement informatisé des livres : les libraires peuvent passer des commandes standardisées, les distributeurs ont le même code pour traiter les commandes et les retours, les différentes opérations de gestion dans les bibliothèques et centres de documentation sont également facilitées. Par ailleurs, le caractère international de cette numérotation constitue, à l’étranger également, une référence unique pour tous les professionnels du livre.

En France, c’est l’Agence francophone pour la numérotation internationale du livre (AFNIL) qui attribue les ISBN. Ex. ISBN 978-2-07-078677-0.

Voir : Définition sur le site de l'AFNIL

Isidore

id : isidore

types : Ressources

mots-clés :

filename : isidore

Isidore est un moteur de recherche permettant l’accès aux données numériques des sciences humaines et sociales. Il collecte, enrichit et fournit un signalement et un accès unifiés aux documents et aux données numériques en libre accès des SHS.

Site web : https://www.rechercheisidore.fr

Isilex

id : isilex

types : Outils logiciels

mots-clés :

filename : isilex

Isilex est à la fois un serveur web, un CMS et un gestionnaire de base de données XML ainsi qu’un gestionnaire privé de réseau social. Il permet de publier et de modifier des données, d’intégrer des contenus multimédias et des fiches liées.

Plus précisément, Isilex permet de créer un corpus seul ou en groupe et de le publier sur le web, de créer des groupes de rédacteurs par tâches de projets, d’exporter en .odt ou en .PDF des données (par fiche ou par lot), de marquer en un clic toutes les occurrences d’un mot dans une fiche, de modifier les pages web du site en un clic, de modifier les données de la base XML en un clic, de demander la validation des données par le modérateur du projet, de modifier la configuration du site, de gérer un site bilingue, de créer un forum, de gérer un réseau social interne

Site web : https://isilex.github.io/easy-xml-fr/

ISO

id : iso

types : Groupements institutionnels, Pratiques et méthodes

mots-clés :

filename : iso

L’ISO (International Organisation for Standardization) est une organisation non gouvernementale créée en 1947 constituée de 164 pays. L’ISO forme ainsi la fédération mondiale des organismes nationaux de normalisation. La France est ainsi représentée par l’AFNOR au sein de l’ISO.

Les travaux de cette organisation se traduisent par des accords internationaux qui sont publiés sous la forme de normes internationales. Elle a donc pour missions d’encourager le développement de la normalisation dans le but de favoriser entre les nations, les échanges de biens et de services ainsi que la coopération dans les domaines intellectuels, économiques, scientifiques et techniques.

id : issuecrawler

types : Outils logiciels

mots-clés :

filename : issuecrawler

IssueCrawler permet à partir de plusieurs URLs de départ et de plusieurs mots-clés ou thématiques de construire une représentation graphique des acteurs de la controverse ou de la thématique.

Voir Compare Networks Over Time

Site web : https://www.issuecrawler.net

Documentation en français : http://www.govcom.org/GuideIssueCrawler2005-2006.pdf

ISTEX

id : istex

types : Ressources

mots-clés :

filename : istex

ISTEX est une plateforme qui offre à l’ensemble des membres de la communauté de l’enseignement supérieur et de la recherche française un accès en ligne aux collections rétrospectives de la littérature scientifique dans toutes les disciplines. Istex met en oeuvre une politique d’achat centralisés d’archives scientifiques et de collections sous la forme de licences nationales.

Un budget de 54 millions d’euros a été consacré à des acquisitions définitives et pérennes de documents électroniques en texte intégral : livres électroniques, revues, corpus de textes, etc. Istex fournit également des services aux chercheurs leur permettant d’optimiser l’exploitation de ces corpus grâce à des outils de fouille de corpus (TDM) et de valorisation interactive.

Voir Fouille de corpus

Site web : https://www.istex.fr

ITunes App Store Scraper

id : itunes app store scraper

types : Outils logiciels

mots-clés :

filename : itunes_app_store_scraper

Cet outil permet d’extraire les détails relatifs à une application, de collecter les applications liées et de récupérer une liste d’applications pour un mot-clé donné.

Voir aussi : Web scraping

Site web : https://wiki.digitalmethods.net/Dmi/TooliTunesAppStoreScraper

Java

id : java

types : Pratiques et méthodes

mots-clés :

filename : java

Java est un langage de programmation informatique orienté objet créé en 1995. Il permet d’écrire des logiciels qui sont facilement portés par différents systèmes d’exploitation (Windows, MacOS, GNU/Linux, UNIX) sans qu’il soit nécessaire d’apporter beaucoup de modifications selon les systèmes.

Java est donc un langage informatique mais aussi la plateforme qui garantit la portabilité des logiciels développés en langage Java.

JournalTOCs

id : journaltocs

types : Outils logiciels

mots-clés :

filename : journaltocs

JournalTOCs est un outil de veille sur les sommaires de revues scientifiques. Il permet d’importer les flux RSS des sommaires de plus de 20 000 revues, de suivre les sommaires de plusieurs revues en créant un compte, d’exporter plusieurs sommaires via un fichier OPML à importer dans Netvibes.

Site web : https://www.journaltocs.ac.uk/index.php

JPG/JPEG

id : jpg/jpeg

types : Pratiques et méthodes

mots-clés :

filename : jpg_jpeg

JPEG (Joint Photographic Experts Group) : format standardisé d’images numériques qui permet une visualisation dans la plupart des logiciels d’images ainsi que sur les navigateurs internet. C’est le format image par excellence pour internet.

Ce format ouvert et libre est associé à une méthode de compression avec pertes qui permet de diffuser des images au moindre coût taille/qualité. Mais la perte d’informations due à la compression est irréversible. Si la compression est trop forte, l’image s’affichera dans une qualité médiocre, voire de façon pixellisée. On parle aussi d’« image brûlée ».

Les préconisations sont de numériser dans des formats non compressés et de haute qualité (TIFF généralement) puis de faire une copie JPEG pour la visualisation. Il existe désormais un nouveau format JPEG : le JPEG 2000 dont la méthode de compression est nettement moins destructive. À ratio équivalent, la compression JPEG 2000 est de meilleure qualité. Le JPEG 2000 peut également être utilisé sans compression, ce qui le rend très intéressant en termes de taille/qualité, notamment pour des fichiers de haute qualité. La BnF l’a adopté comme format de numérisation haute résolution et d’archivage pérenne.

JSON

id : json

types : Pratiques et méthodes

mots-clés :

filename : json

JSON (JavaScript Object Notation) est un format d'échange de données structurées inspiré du langage objet.

L'échange se fait par transmission de chaînes de caractères (donc faciles à écrire et à lire par des humains).

JSON-LD JavaScript Object Notation for Linked Data

id : json-ld javascript object notation for linked data

types : Technologies et familles d’outils

mots-clés :

filename : json-ld

Le JSON-LD (JavaScript Object Notation for Linked Data) est une méthode d’intégration de données structurées sur le web, basée sur le format JSON. Il fait partie des recommandations du W3C.

Site web : https://json-ld.org/

Jupyter

id : jupyter

types : Groupements institutionnels

mots-clés :

filename : jupyter

Jupyter est un projet et une communauté dont l'objectif est de développer des logiciels open source, des standards ouverts et des services pour l'informatique interactive à travers des dizaines de langages de programmation.

Le nom du projet Jupyter fait référence aux trois principaux langages de programmation pris en charge par Jupyter, à savoir Julia, Python et R, et est également un hommage aux carnets de Galilée qui enregistraient la découverte des lunes de Jupiter.

Le projet Jupyter a développé et soutenu les produits informatiques interactifs Jupyter Notebook, JupyterHub et JupyterLab. Jupyter est un projet sponsorisé fiscalement par NumFOCUS.

Site web : https://jupyter.org/

Conférences ou tutoriels :

https://www.youtube.com/watch?v=NzlAUmj5fkg

https://github.com/quinnanya/dh-jupyter

https://digitalhumanitiesnow.org/2019/12/introduction-to-jupyter-notebooks/

https://www.cdh.cam.ac.uk/events/first-steps-coding-jupyter-notebooks

https://curriculum.dhinstitutes.org/workshops/text-analysis/

Jupyter Book

id : jupyter book

types : Outils logiciels

mots-clés :

filename : jupyter_book

Jupyter Book est un outil open source permettant de créer des documents PDF, des documents LaTeX ou de publier un site web à partir d’une combinaison de différents types de fichiers tels que les Jupyter Notebooks et les fichiers Markdown.

Cet outil permet de faciliter la publication d’articles scientifiques ou la publication de sites internet.

Site web : https://jupyterbook.org/en/stable/intro.html

Tutoriel : https://www.youtube.com/watch?v=wuP54pQpK00

Kanboard

id : kanboard

types : Outils logiciels

mots-clés :

filename : kanboard

Kanboard est un logiciel de gestion de projet collaboratif qui peut également être employé comme mur collaboratif. Il utilise la méthode Kanban. Il permet la mise à jour en temps réel entre plusieurs utilisateurs, l’administration et la personnalisation des projets (couleurs, tableaux), la gestion des tâches et des sous-tâches, la classification des éléments par couleur et catégorie, l’attribution des tâches, la définition des échéances, l’importation de pièces-jointes, l’exportation des projets, la définition des autorisations d’accès, la recherche et le filtrage.

Site web : https://kanboard.org

Khartis

id : khartis

types : Outils logiciels

mots-clés :

filename : khartis

Outil de cartographie en ligne, développé par Sciences Po, pour créer simplement des cartes thématiques.

Site web : https://www.sciencespo.fr/cartographie/khartis/

id : leaflet

types : Outils logiciels

mots-clés :

filename : leaflet

Bibliothèque javascript open source de cartographie développée à partir de 2011. Elle est plus légère et plus simple qu'OpenLayers, mais avec moins de possibilités. Elle dispose d'une importante communauté de développeurs et de nombreux plugins existent pour la compléter.

Documentation en anglais : https://leafletjs.com/.

Exemples de tutoriels en français :

Lexico 5

id : lexico 5

types : Outils logiciels

mots-clés :

filename : lexico_5

Lexico 5 est un logiciel d'analyse textométrique.

Site web : http://www.lexi-co.com

Lexicoscope

id : lexicoscope

types : Outils logiciels

mots-clés :

filename : lexicoscope

Lexicoscope est une interface web d’exploration de corpus textuels. Il permet d’explorer l’environnement lexicosyntaxique des mots du corpus. Il s’agit d’un outil spécialement dédié à l’analyse des contextes et des cooccurrences.

id : lien hypertexte

types : Pratiques et méthodes

mots-clés :

filename : lien_hypertexte

Lien opéré par un code HTML qui relie deux pages ou deux endroits accessibles par le protocole HTTP (web), il permet de passer automatiquement d’un document à un autre.

Quand on clique sur un lien hypertexte, le navigateur nous envoie à une autre page internet (du même site ou d’un autre site) ou à un autre endroit dans la même page (lien interne avec une ancre), soit dans la même fenêtre, soit dans un nouvel onglet.

Link Ripper

id : link ripper

types : Outils logiciels

mots-clés :

filename : link_ripper

Link Ripper permet d’extraire tous les liens internes et/ou externes d’une page web.

Site web : https://tools.digitalmethods.net/beta/linkRipper/

Linked Data

id : linked data

types : Pratiques et méthodes

mots-clés :

filename : linked_data

Notion introduite en 2006, par Tim Berners-Lee. Il s’agit d’une méthode de publication de données structurées, de manière à ce qu’on puisse établir efficacement des relations (liens) entre les données. Cela permet la création d’un réseau global d’informations et le décloisonnement des données.

Voir Web sémantique.

Lippmannian Device

id : lippmannian device

types : Outils logiciels

mots-clés :

filename : lippmannian_device

L’outil Lippmannian Device permet de détecter la partisanerie ou les partis pris d’un acteur sur le web. Un des principaux usages de cet outil consiste à rechercher la présence et le classement de sources spécifiques au sein des résultats d’un moteur de recherche. L’outil est également utilisé dans les recherches sur la censure.

L'outil Lippmannian Device to Gephi permet par ailleurs de visualiser les résultats obtenus sous forme d’un réseau Gephi.

Sites web : https://tools.digitalmethods.net/beta/lippmannianDevice/, https://tools.digitalmethods.net/beta/lippmannianDeviceToGephi/

Lodex

id : lodex

types : Outils logiciels

mots-clés :

filename : lodex

Lodex est un logiciel open source permettant de publier selon les normes du web sémantique des tableaux comportant des données brutes, d’en faciliter la transformation en données structurées, d’explorer le jeu de données publié selon différents angles de vues, de référencer et valoriser chaque ressource, d’aider à aligner les données à publier avec des données similaires ou connexes.

Site web : https://lodex.inist.fr

LogEc

id : logec

types : Ressources

mots-clés :

filename : logec

LogEc est un outil qui collecte les statistiques d’accès aux ressources de RePec. Il permet ainsi de connaître les sujets les plus traités par les économistes ainsi que l’impact de sa propre recherche.

Site web : https://logec.repec.org

Logiciel

id : logiciel

types : Technologies et familles d’outils

mots-clés :

filename : logiciel

En informatique, un logiciel est un ensemble de séquences d’instructions interprétables par une machine (ou programmes informatiques) et d’un jeu de données nécessaires à ces opérations.

Le logiciel détermine donc les tâches qui peuvent être effectuées par la machine, ordonne son fonctionnement et lui procure ainsi son utilité fonctionnelle.

Mashup / Application composite

id : mashup / application composite

types : Technologies et familles d’outils

mots-clés :

filename : mashup

Un mashup est une application qui permet sur un site web d’agréger ou retraiter de l’information en provenances d’une ou plusieurs sources extérieures. Un mashup se caractérise par la combinaison, la visualisation et l’agrégation de données. Google Maps est ainsi un mashup car il est utilisé par d’autres sites pour faire fonctionner leur système de géolocalisation.

MATE-SHS

id : mate-shs

types : Groupements institutionnels

mots-clés :

filename : mate-shs

Le réseau Mate-shs (Méthodes, Analyses, Terrains, Enquêtes en SHS) entend réunir les professionnels de la recherche s’intéressant, de manière large, à la production, au traitement, à la visualisation et à la préservation de données et de corpus en sciences humaines et sociales. Mate-shs a pour ambition de devenir un des lieux de référence de discussion, transmission et construction des pratiques professionnelles du métier ; de découverte et de maîtrise de nouvelles méthodes / nouveaux logiciels par la communauté ; et d’être, sur tous ces sujets, un interlocuteur reconnu et légitime auprès des institutions chargées de l’organisation de la recherche.

Site web : https://mate-shs.cnrs.fr/

Formulaire d'inscription sur la liste de diffusion : https://www.enquetes.mate-shs.cnrs.fr/index.php/113498?lang=fr

MCD

id : mcd

types : Pratiques et méthodes

mots-clés :

filename : mcd

Un modèle conceptuel de données (ou MCD) est une représentation graphique des données permettant de comprendre quelles relations lient les éléments entre eux grâce à des diagrammes codifiés. Il s’agit d’une des étapes de création d’une base de données.

Plusieurs éléments composent les diagrammes notamment les entités qui correspondent à un objet, les propriétés qui sont la liste des données de l’entité, les relations qui expliquent comment les entités sont reliées entre elles et les cardinalités qui caractérisent les liens entre les entités.

Il existe différents modèles de MCD : le modèle « entité-association », le modèle binaire ou encore le modèle Z.

Des logiciels spécialisés existent pour réaliser ces modèles. Ils peuvent être propriétaires (Microsoft Visio, Maestro SQL, Oracle Designer) ou libres (MySQL Workbench, DBDesigner).

Voir SQL

Mercury

id : mercury

types : Outils logiciels

mots-clés :

filename : mercury

Mercury est un framework qui permet de créer des pages HTML interactives à partir de widgets. Cela permet de partager des widgets qui peuvent être ensuite utilisés dans un site web pour augmenter son interactivité.

Site web : https://mljar.com/mercury/

Tutoriel : https://www.youtube.com/watch?v=WcD908-a7Z8&ab_channel=MLJAR

Métadonnées

id : métadonnées

types : Pratiques et méthodes

mots-clés :

filename : metadonnees

On appelle « métadonnées » des données structurées décrivant une ressource ou une autre donnée. Une notice bibliographique, qui décrit selon un format ordonné un document en segmentant ses informations, contient des métadonnées.

Les métadonnées servent à référencer, identifier et partager correctement un document. Elles permettent la description et le traitement des ressources numériques (ou papier), elles sont généralement standardisées et à l’extérieur ou en entête du texte ou du document qu’elles décrivent.

On distingue plusieurs types de métadonnées, descriptives (EAD, Dublin Core, MODS), techniques (EXIF, MIX-NISO, etc.), de structure (ALTO, METS, TEI).

id : mir@bel

types : Ressources

mots-clés :

filename : mir@bel

Mutualisation d’information sur les revues et leurs accès dans les bases en ligne. Site web qui facilite l’accès aux revues (principalement celles de sciences humaines et sociales) en indiquant pour chacune les liens vers le texte intégral, les sommaires, les résumés ou l’indexation des articles.

Il est alimenté par les établissements du type bibliothèque, par les éditeurs et par les ressources en ligne.

Site web : https://reseau-mirabel.info

Mirador

id : mirador

types : Outils logiciels

mots-clés :

filename : mirador

Mirador est un visualiseur web d’images numériques répondant au standard de description des images IIIF. Il permet de comparer des images provenant de différentes institutions sur un même écran, de zoomer, et d'annoter certaines parties des images.

Site web : https://projectmirador.org/

Moissonnage

id : moissonnage

types : Pratiques et méthodes

mots-clés :

filename : moissonnage

Le moissonnage est un mécanisme permettant de récolter des métadonnées sur un catalogue distant, une base de données distante ou encore sur le web puis de les stocker sur un serveur local pour y accéder plus rapidement.

Le moissonnage s’effectue automatiquement et régulièrement et nécessite les mêmes protocoles entre l’organisme qui moissonne et celui qui est moissonné.

C’est dans cette optique que sont développés les protocoles comme l’OAI-PMH qui sert notamment au moissonnage des archives ouvertes.

Voir Moteur de recherche

MOOC - Massive open online courses

id : mooc - massive open online courses

types : Ressources

mots-clés :

filename : mooc

Les MOOC sont des cours en ligne ouvert à tous. Ce type de formation peut donner droit à des crédits ECTS, et/ou à des certifications de suivi avec succès. Les MOOC sont généralement basés sur des vidéos pédagogiques, des QCM d'évaluation, et des forums de discussion avec les autres apprenants et parfois les professeurs.

Plateforme de MOOC : OpenClassRooms, FUN mooc (France Université Numérique), Coursera

Moteur de recherche

id : moteur de recherche

types : Technologies et familles d’outils

mots-clés :

filename : moteur_de_recherche

Un moteur de recherche est une machine (matérielle et logicielle) qui permet de rechercher sur le web des informations, des documents, des ressources à partir d’une requête par mots-clés. Les moteurs de recherche fonctionnent grâce à des robots appelés crawler ou spider qui parcourent le web et indexent les pages web dans leurs bases de données.

Autrement dit, à chaque page web sont attribués des mots-clés si bien que quand l’internaute donne les mots-clés de sa recherche, le moteur de recherche consulte sa base de données et renvoie comme résultats les pages web indexées avec les mêmes mots-clés que ceux de l’utilisateur. Les résultats de la requête sont classés selon leur pertinence et des critères propres à l’algorithme de chaque moteur de recherche.

Il existe différents moteurs de recherche, le plus connu est Google. Certains sont spécialisés, ainsi Startpage s’est spécialisé dans la protection des données et l’anonymat de ses utilisateurs ; Ecosia et Lilo dans l’écologie et la solidarité (à chaque recherche, un arbre est planté ou de l’argent est reversé à des associations).

Voir : Opérateurs booléens, Troncature

Munich Personal RePEc Archive

id : munich personal repec archive

types : Outils logiciels

mots-clés :

filename : munich_personal_repec_archive

Munich Personal RePEc Archive est un service qui permet au chercheur de déposer les travaux qu’il souhaite diffuser sur les autres services du réseau RePec comme IDEAS ou EconPapers.

Site web : https://mpra.ub.uni-muenchen.de

MuseScore

id : musescore

types : Outils logiciels

mots-clés :

filename : musescore

MuseScore est un logiciel open source d’édition de partition. La plateforme en ligne propose également des partitions à télécharger.

Site web : https://musescore.org/fr

myST

id : myst

types : Outils logiciels

mots-clés :

filename : myst

Les fichiers markdown du Jupyter Book peuvent être écrits grâce à myST (Markedly Structured Text), une version spéciale de Markdown qui a été conçue pour faciliter la création de documents informatiques en fournissant des fonctionnalités supplémentaires. myST permet d’améliorer la mise en page des documents markdowns qui peuvent ensuite être exportés en format pdf, LaTeX ou en format web.

Site web : https://myst-tools.org/

Tutoriel : https://www.youtube.com/watch?v=NxSNVt9XsCI&t=1490s&ab_channel=curvenote

NAKALA

id : nakala

types : Outils logiciels, Ressources

mots-clés :

filename : nakala

NAKALA est un service d’Huma-Num permettant à des chercheurs, enseignants-chercheurs ou équipes de recherche de partager, publier et valoriser tous types de données numériques documentées (fichiers textes, sons, images, vidéos, objets 3D, etc.) dans un entrepôt sécurisé afin de les publier en accord avec les principes du FAIR Data (Facile à trouver, Accessible, Interopérable et Réutilisable).

Site web : https://documentation.huma-num.fr/nakala/

Navigateur web

id : navigateur web

types : Pratiques et méthodes

mots-clés :

filename : navigateur_web

Un navigateur web (web browser en anglais) est un logiciel conçu pour consulter et afficher le World Wide Web. Techniquement, c'est au minimum un client HTTP (logiciel conçu pour se connecter à un serveur HTTP, Hypertext Transfer Protocol).

Il existe de nombreux navigateurs web, pour toutes sortes de matériels (ordinateur, tablette, téléphone mobile et pour différents systèmes d'exploitation (GNU/Linux, Windows, Mac OS, iOS et Android). Actuellement, les navigateurs les plus utilisés sont Google Chrome, Mozilla Firefox, Internet Explorer/Edge, Safari, Opera.

Netvibes

id : netvibes

types : Outils logiciels

mots-clés :

filename : netvibes

Netvibes est un outil en ligne de veille informationnelle. Il s’agit d’un agrégateur d’abonnements à des flux RSS. Il offre la possibilité de consulter le site web agrégé à l’intérieur de l’agrégateur.

Voir aussi : InoReader, Feedly

Site web : https://www.netvibes.com/fr

id : noota

types : Outils logiciels

mots-clés :

filename : noota

Noota est un service propriétaire de transcription d’enregistrements audios. La plateforme web propose également des solutions d’enregistrement de réunion, d’analyse de texte et d’audios, d’annotation et de sous-titrage de vidéo.

Site web : https://noota.io/

Notebook

id : notebook

types : Technologies et familles d’outils

mots-clés :

filename : notebook

Un notebook est un environnement où on peut inscrire du code avec des données et de la prose, exécuter le code et visualiser simultanément les résultats.

Voir aussi : Jupyter, Observable, R Markdown, …

Définition issue de https://www.arthurperret.fr/blog/2021-06-11-du-notebook-au-bloc-code.html

Notice bibliographique

id : notice bibliographique

types : Pratiques et méthodes

mots-clés :

filename : notice_bibliographique

Une notice bibliographique est un fichier qui contient l’ensemble des éléments descriptifs d’un document tels que le type de document, le titre, l’auteur, la maison d’édition, la date de publication. Elle peut également comprendre des éléments permettant la localisation du document (cote, adresse URL).

Après une analyse du document, la notice peut présenter un résumé, des mots-clés ou encore un indice de classification qui donnent à voir le contenu du document. Les notices bibliographiques se rencontrent par exemple dans les bibliographies, les catalogues de bibliothèques ou encore les bases de données.

Les notices bibliographiques sont normées et respectent des règles de présentations strictes. Ces règles peuvent avoir une portée internationale comme c’est le cas de l’ISBD mis au point par l’IFLA. En France, l’AFNOR établit des normes en suivant les recommandations de l’IFLA.

Notice d’autorité

id : notice d’autorité

types : Pratiques et méthodes

mots-clés :

filename : notice_d'autorite

Une notice d’autorité est la forme normalisée et validée de noms d'œuvres, de noms d’auteurs, de noms géographiques. Elle sert à identifier et retrouver tous les documents produits par une même entité en évitant les ambiguïtés et les doublons.

Ainsi, dans les catalogues informatisés, le catalogage des points d’accès auteurs et sujets s’effectue à partir des notices d’autorités. Les notices d’autorités s’organisent en listes d’autorités, telles que le RAMEAU, qui constituent elles-mêmes un langage d’indexation.

NTIC

id : ntic

types : Pratiques et méthodes, Technologies et familles d’outils

mots-clés :

filename : ntic

NTIC (Nouvelles Technologies de l’Information et de la Communication) désigne l’ensemble des technologies permettant le traitement et la transmission des informations principalement numériques.

Les téléphones portables, les ordinateurs, les messageries instantanées, internet font partie des NTIC.

Numérisation

id : numérisation

types : Pratiques et méthodes

mots-clés :

filename : numerisation

Processus qui consiste à convertir des informations d’un support (texte, image, audio, vidéo) ou d’un signal électrique en données numériques.

Pour la numérisation des images, voir JPEG, PNG, TIFF, PDF

OAI-PMH

id : oai-pmh

types : Pratiques et méthodes

mots-clés :

filename : oai-pmh

L’OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting) est un protocole informatique développé afin d’échanger des métadonnées – uniquement celles-ci et non les ressources elles-mêmes.

L’OAI-PMH définit deux types d’acteurs : les fournisseurs de données, qui déposent leurs métadonnées sur un serveur web appelé « entrepôt », et les fournisseurs de service qui collectent (qui « moissonnent ») ces données. Le moissonnage s’effectue à partir de requêtes formalisées à l’adresse de l’entrepôt, les résultats sont alors intégrés dans l’index ou le répertoire du site moissonneur. La liste des requêtes peut être consultée par exemple sur le site de la BNF. Le standard de base d’échange du protocole OAI-PMH est le Dublin Core mais d’autres formats de métadonnées peuvent être exposés (EAD, RDF, etc.).

Ce protocole est utilisé notamment par les Archives Ouvertes et les entrepôts institutionnels, il s’est aujourd’hui largement répandu dans les institutions patrimoniales et notamment les bibliothèques. Il permet entre autres de construire des sites portails thématiques avec uniquement le résultat de requêtes sur les entrepôts repérés sur cette thématique. Europeana, la bibliothèque numérique européenne, est alimentée via le protocole OAI-PMH.

Voir Interopérabilité

Lien utile : Europeana

Océrisation

id : océrisation

types : Pratiques et méthodes

mots-clés :

filename : ocerisation

L’océrisation désigne le processus d’utilisation d’un logiciel de reconnaissance optique de caractères (Optical Character Recognition - OCR) permettant de transformer l’image numérisée d’un texte imprimé en document textuel et de le sauvegarder sous forme d’un fichier ensuite exploitable dans un logiciel de traitement de texte.

OCR

id : ocr

types : Technologies et familles d’outils

mots-clés :

filename : optical_character_recognition

La reconnaissance optique de caractère (optical character recognition, OCR, en anglais) est une technologie qui transcrit l’image d’un texte dactylographié en un fichier textuel numérique.

Contrairement à l’HTR, l’OCR se focalise uniquement sur la reconnaissance des caractères un par un, sans prendre en compte leur contexte que ce soit dans un mot, une phrase ou une ligne.

Voir aussi : HTR, Transcription

OldMapsOnline

id : oldmapsonline

types : Ressources

mots-clés :

filename : oldmapsonline

Il s’agit d’un moteur de recherche qui indexe plus de 400 000 cartes historiques grâce à la participation de bibliothèques universitaires et d’établissement de recherche.

Site web : https://www.oldmapsonline.org/about/

Omeka

id : omeka

types : Outils logiciels

mots-clés :

filename : omeka

Logiciel de gestion de bibliothèque numérique mis à disposition sous licence libre (GNU – General Public License).

De conception modulaire, l’outil permet à chaque site d’adapter les fonctionnalités proposées à l’aide de plugins et de thèmes. L’outil est développé aux États-Unis par le Roy Rosenzweig Center for History and New Media (CHNM) de l’Université George Mason qui est aussi à l’origine du logiciel de gestion bibliographique Zotero.

Site web : https://omeka.org

Onglet

id : onglet

types : Pratiques et méthodes

mots-clés :

filename : onglet

Un onglet est, dans un fichier ou autre système de rangement, une petite excroissance visuelle porteuse d'une étiquette (typiquement, alphabétique) permettant un accès direct aisé aux documents ou une partie du document.

Par analogie, sur les navigateurs internet, il permet d’avoir accès à plusieurs sites ou pages sur une seule fenêtre et de pouvoir passer rapidement d’une page à une autre. Cette interface riche sur une seule fenêtre provoque le risque d’avoir trop d’onglets ouverts…

Ontologie

id : ontologie

types : Pratiques et méthodes

mots-clés :

filename : ontologie

L’ontologie est une branche de la philosophie qui vise à élucider le sens de l’être considéré en tant qu’être général, abstrait, essentiel et en tant qu’être singulier, concret, existentiel. Il s’agit également de l’étude des être en eux-mêmes et non tels qu’ils nous apparaissent.

Par extension, le terme signifie l’ensemble des vérités fondamentales de l’être. Du point de vue de l’histoire de la médecine, l’ontologie se réfère à l’étude de l’être de la maladie ou à l’étude des êtres vivants et des phénomènes individuels.

En informatique, une ontologie est « la spécification d'une conceptualisation d'un domaine de connaissance » (Th. Gruber), autrement dit c’est un modèle structuré de concepts se rapportant à une discipline. Pour chaque concept, une ontologie définit des « classes », des « attributs » aussi nommés « propriétés », et des « relations ». Souvent une ontologie est représentée par un schéma explicitant ces différents éléments.

Site web : https://www.cnrtl.fr/lexicographie/ontologie

Site web : https://tomgruber.org/writing/ontology-in-encyclopedia-of-dbs.pdf

Ontome

id : ontome

types : Outils logiciels

mots-clés :

filename : ontome

Ontome est un environnement de gestion d’ontologie en ligne. Il permet de gérer un projet de création et de maintien d’une ontologie collaborative. Cet outil sert à aligner une ontologie avec celle du CIDOC-CRM.

Site web : https://ontome.net/

Open Access

id : open access

types : Pratiques et méthodes

mots-clés :

filename : open_access

L’Open Access (ou aussi « libre accès », ou encore « accès ouvert ») à la littérature scientifique est un mode de diffusion des articles de recherche sous forme numérique, gratuite et dans le respect du droit d’auteur. Cette notion recouvre l’accès ouvert (gratis open access), les données diffusées en ligne gratuitement et le libre accès (libre open access), données diffusées en ligne gratuitement et librement, c'est-à-dire soumises à une licence d’utilisation dite libre (ex. Creative Commons). On distingue plusieurs modèles ou voies de l’open access : la voie verte et la voie dorée.

Lien utile : Comment définir l'Open Access

Open Data

id : open data

types : Pratiques et méthodes

mots-clés :

filename : open_data

Données ouvertes, dont l’accès est public et libre de droit, tout comme leur exploitation.

Open Geospatial Consortium

id : open geospatial consortium

types : Groupements institutionnels

mots-clés :

filename : open_geospatial_consortium

L’Open Geospatial Consortium est un regroupement de professionnels, d’entreprises et d’institutions qui travaillent à la valorisation des données géographiques, notamment à travers le respect des principes FAIR Data. Le consortium met également en place des référentiels pour le partage et l’interopérabilité des données géographiques.

Site web : https://www.ogc.org/

Open Source

id : open source

types : Pratiques et méthodes

mots-clés :

filename : open_source

Cela désigne le « code source ouvert » et s'applique aux logiciels dont la licence respecte les possibilités d'accès au code source du logiciel, de libre redistribution de ce code et de possibilités de travaux dérivés à partir de celui-ci.

On peut ainsi adapter le code source d’un logiciel open source à ses propres besoins. La principale licence pour le logiciel open source est la licence GNU (General Public License). De plus en plus, on étend la définition de « l’open source » aux données et plus uniquement au code informatique, on parle alors d’Open Data.

Voir GitHub

OpenAIRE

id : openaire

types : Groupements institutionnels, Pratiques et méthodes

mots-clés :

filename : openaire

OpenAIRE (Open Access Infrastructure for Research in Europe) est un projet européen dont la mission consiste à favoriser le libre accès de l’information scientifique en créant un réseau d’experts de la science ouverte pour mettre au point des formations et une infrastructure technique ouverte pour la centralisation, la gestion et le partage des publications scientifiques et des données de la recherche.

Site web : https://www.openaire.eu

OpenArcheo

id : openarcheo

types : Ressources

mots-clés :

filename : openarcheo

OpenArcheo est une plateforme en ligne mettant à disposition des données issues de l’archéologie alignée sur le modèle du CIDOC-CRM. Les deux interfaces proposées reposent sur le langage de requête SPARQL. Les données sont issues des travaux du Consortium MASA (mémoire des archéologues et des sites archéologiques), et sont hébergées par Huma-Num.

Site web : http://openarchaeo.huma-num.fr/explorateur/home

OpenDOAR

id : opendoar

types : Ressources

mots-clés :

filename : opendoar

OpenDOAR (Directory of Open Access Repositories) est un annuaire qui recense à l’échelle mondiale les archives ouvertes et les dépôts en libre accès.

La recherche et la navigation au sein des résultats peuvent être filtrées par nom, par région du monde, par pays ou encore par logiciel.

Site web : https://v2.sherpa.ac.uk/opendoar/search.html

OpenEdition

id : openedition

types : Outils logiciels, Ressources

mots-clés :

filename : openedition

Ressources électroniques en sciences humaines et sociales.

OpenEdition est une infrastructure complète d’édition électronique au service de la communication scientifique en sciences humaines et sociales. Elle rassemble quatre plateformes complémentaires dédiées (OpenEdition Journals, OpenEdition Books, Hypothèses, Calenda).

Voir Science ouverte

Site web : https://www.openedition.org

OpenLayers

id : openlayers

types : Pratiques et méthodes

mots-clés :

filename : openlayers

Bibliothèque JavaScript open source publiée en 2006 permettant d'afficher des cartes dans un navigateur web. Elle offre des fonctionnalités équivalentes à un logiciel SIG.

Site web : https://openlayers.org/

OpenRefine

id : openrefine

types : Outils logiciels

mots-clés :

filename : openrefine

OpenRefine est une application permettant de traiter des fichiers de données comportant des incohérences internes dans les formats ou la structure des données ou encore dans la terminologie employée. Cet outil normalise et nettoie les données sans modifier les données originales.

Site web : https://openrefine.org

OpenStreetMap

id : openstreetmap

types : Outils logiciels

mots-clés :

filename : osm

OpenStreetMap est une application web de cartographie. Elle partage également des données géographiques libres d'utilisation.

Site web : https://www.openstreetmap.org/

Opentheso

id : opentheso

types : Outils logiciels

mots-clés :

filename : opentheso

Opentheso est un logiciel libre de gestion de thésaurus multilingue créé suite à la collaboration entre Frantiq et la plateforme « Tête de réseaux documentaires » de la Maison de l’Orient et de la Méditerranée.

Voir PACTOLS

Site web : <https://documentation.huma-num.fr/opentheso/ >

Logiciel : https://github.com/miledrousset/Opentheso2

Opérateurs booléens

id : opérateurs booléens

types : Pratiques et méthodes

mots-clés :

filename : operateurs_booleens

Les opérateurs booléens permettent d’affiner une recherche dans un moteur de recherche ou un ensemble de résultats en combinant des critères de recherche logiques. Les principaux opérateurs booléens sont «ET », « OU » et « SAUF ».

L’opérateur « ET » présente uniquement les résultats contenant les deux mots qui l’entourent. L’opérateur « OU » présente les résultats des deux termes qui l’entourent ou uniquement l’un des deux termes. L’opérateur « NOT » ne présente que les résultats qui contiennent le mot précédent l’opérateur tout en excluant ceux qui contiennent le second terme.

Voir Troncature

OPIDoR

id : opidor

types : Ressources

mots-clés :

filename : opidor

OPIDoR (Optimiser le Partage et l’Interopérabilité des Données de la Recherche) est un portail mis en place par l’Inist-CNRS à destination de la communauté de l’enseignement supérieur et de la recherche qui propose un ensemble d’outils et de services facilitant la mise en application des principes du FAIR Data.

OPIDoR propose trois services.

DMP OPIDoR, outil d’aide à la création en ligne de plans de gestion des données.
Cat OPIDoR, catalogue qui recense et décrit les services français qui participent à la gestion, au partage et à la réutilisation des données.
PID OPIDoR, service permettant d’attribuer des identifiants pérennes (DOI) aux données de la recherche.

Voir ARK, ORCID

Site web : https://opidor.fr

ORCID

id : orcid

types : Pratiques et méthodes, Ressources

mots-clés :

filename : orcid

L'Open Researcher and Contributor ID (ORCID) est un code qui permet d'identifier de manière unique les auteurs de contributions académiques et scientifiques.

Site web : https://orcid.org

Ortolang

id : ortolang

types : Outils logiciels, Ressources

mots-clés :

filename : ortolang

Ortolang est une plateforme de données (corpus, lexiques, dictionnaires, etc.) et d’outils sur la langue et son traitement.

Elle propose également un service d'hébergement et d'archivage de projets en linguistiques. Elle met à disposition des outils de traitement automatique de la langue française.

Site web : https://www.ortolang.fr/

Ovide

id : ovide

types : Outils logiciels

mots-clés :

filename : ovide

Ovide est un logiciel d’écriture et d’édition. Il permet de travailler avec des images, des vidéos, des références bibliographiques et de produire diverses éditions imprimées et web à partir d’un même corpus d’écrits. Il fonctionne en tandem avec l’éditeur Fonio.

Site web : https://peritext.github.io/ovide/

OxGarage

id : oxgarage

types : Outils logiciels

mots-clés :

filename : oxgarage

OxGarage est un service web proposant et gérant la conversion de documents en plusieurs formats de fichiers.

Sites web : https://oxgarage2.tei-c.org/# ; https://github.com/TEIC/oxgarage/

PACTOLS

id : pactols

types : Ressources

mots-clés :

filename : pactols

PACTOLS est un thésaurus créé par Frantiq dans le but d’organiser les mots-clés utilisés dans l’indexation des ressources documentaires de domaine archéologique. Il couvre toutes les thématiques de l’archéologie, de la préhistoire à l’époque contemporaine. Les concepts sont classés dans sept thématiques : Peuples, Anthroponymes, Chronologie, Toponymes, Oeuvres, Lieux, Sujets (PACTOLS).

Le thésaurus est interopérable et multilingue (7 langues), chaque concept possède un identifiant ARK qui en fait un objet web unique, citable et réutilisable sur le web sémantique.

Site web : https://pactols.frantiq.fr/opentheso/

Page web

id : page web

types : Pratiques et méthodes

mots-clés :

filename : page_web

C’est l'unité de base du web. Elle est conçue pour être consultée par un navigateur web et elle est identifiée par une adresse web.

Elle est généralement constituée d’une structure en HTML, avec du texte et souvent d’images, de feuilles de style ou de scripts permettant l’affichage de données venant de bases de données. Elle est fabriquée à partir d’un éditeur HTML et localisée sur un serveur web (hébergement). Son affichage peut être paramétré pour s’adapter aux conditions locales de consultation (écran d’ordinateur fixe ou portable, écran de télévision, téléphone mobile, etc.) à travers une feuille de style.

Palladio

id : palladio

types : Outils logiciels

mots-clés :

filename : palladio

Palladio est une plateforme de visualisation développée par l'Université de Stanford (USA).

Palladio est un ensemble d'outils permettant de télécharger facilement des données et de les étudier. Il s'agit d'un ensemble de visualisations entrelacées conçues pour des données complexes et multidimensionnelles. C'est un produit du projet "Networks in History" qui trouve ses racines dans un autre projet de recherche en sciences humaines basé à Stanford : Mapping the Republic of Letters (MRofL).

Site web : https://hdlab.stanford.edu/palladio/

Parser/Parseur

id : parser/parseur

types : Technologies et familles d’outils

mots-clés :

filename : parser

Un parseur est un programme informatique d’analyse syntaxique qui peut être appliqué à du langage naturel ou à un langage informatique en fonction de sa configuration. Il sert notamment à extraire les informations essentielles d’un fichier ou d’une page web.

PDF

id : pdf

id : plan de gestion des données

types : Pratiques et méthodes

mots-clés :

filename : plan_de_gestion_des_donnees

Le plan de gestion des données est un outil de gestion. Il se présente sous forme d’un document structuré en rubriques. Il a pour objectif de synthétiser la description et l’évolution des jeux de données de votre projet de recherche. Il prépare le partage, la réutilisation et la pérennisation des données.

Voir données de la recherche, FAIR Data, OPIDoR

Voir aussi le site de DoRANum - Cours en ligne (formation URFIST)

Plateforme

id : plateforme

types : Technologies et familles d’outils

mots-clés :

filename : plateforme

Une plateforme informatique est un espace de travail virtuel qui permet d’utiliser un ensemble de logiciels, de stocker et de diffuser des données, et enfin de travailler à plusieurs. Elle se confond souvent avec un site internet (qui n’est basé que sur une seule technologie) ou avec une bibliothèque numérique (qui rassemble des contenus ayant un lien entre eux).

Plugin

id : plugin

types : Technologies et familles d’outils

mots-clés :

filename : plugin

En informatique, un plugin ou plug-in, aussi nommé module greffon ou plugiciel (ou extension dans les CMS ou Omeka), est un paquet structuré de codes informatiques qui complète un logiciel hôte pour lui apporter de nouvelles fonctionnalités.

id : progedo

types : Groupements institutionnels

mots-clés :

filename : progedo

L’infrastructure de recherche PROGEDO a pour but de développer la culture des données, d’impulser et structurer une politique des données d’enquêtes pour la recherche en sciences sociales.

Quetelet-Progedo-Diffusion contribue à répondre aux problématiques d’archivage, de documentation et de diffusion des données françaises pour la recherche en sciences humaines et sociales. Le Centre d'Accès Sécurisé aux Données (CASD) organise l'accès aux données confidentielles. L'infrastructure organise enfin l'accès aux enquêtes internationales européennes ainsi qu'autres catalogues de données comme l'Inter-university Consortium for Political and Social Reasearch (ICPSR) américain.

Site web : https://www.progedo.fr/

Progiciel

id : progiciel

types : Technologies et familles d’outils

mots-clés :

filename : progiciel

Un progiciel est un ensemble de programmes informatiques élaborés pour être fourni à plusieurs utilisateurs en vue d’une même application ou d’une même fonction.

Il s’agit donc d’une catégorie de logiciels qui répond aux besoins communs de plusieurs utilisateurs à la différence des logiciels développés au sein d’une entreprise pour répondre à un besoin spécifique à cette entreprise.

Le terme est également employé pour désigner les logiciels professionnels composés de plusieurs modules communiquant entre eux et dont chacun assure une fonction.

Programmation informatique

id : programmation informatique

types : Pratiques et méthodes

mots-clés :

filename : programmation_informatique

Dans le domaine de l'informatique, la programmation, appelée aussi codage, est l'ensemble des activités qui permettent l'écriture des programmes informatiques. C'est une étape importante du développement de logiciels (voire de matériel).

Site web de MOOCs pour se former en programmation : https://www.my-mooc.com/fr/categorie/programmation

Programme informatique

id : programme informatique

types : Pratiques et méthodes

mots-clés :

filename : programme_informatique

Un programme informatique est un ensemble d'opérations destinées à être exécutées par un ordinateur. Un programme source est un code écrit par un informaticien dans un langage de programmation. Il peut être compilé vers une forme binaire, ou directement interprété.

Protégé

id : protégé

types : Outils logiciels

mots-clés :

filename : protege

Protégé est un logiciel qui permet la création d'ontologies. Il peut lire, créer, et sauvegarder des fichiers d'ontologie dans la plupart des formats : RDF, RDFS, OWL.

Site web : https://protege.stanford.edu/

Tutorial: https://www.youtube.com/watch?v=LQ4iW3PO36E

Python

id : python

types : Pratiques et méthodes

mots-clés :

filename : python

Python est langage informatique de programmation majoritairement utilisé dans les domaines de Data Science, Big Data et Machine Learning. Il permet d’automatiser l’écriture de script ce qui facilite son utilisation et fonctionne sur tous les principaux systèmes d’exploitation.

Il est employé à différentes fonctions comme la création de logiciel, l’analyse de données, la gestion d’infrastructures, à l’inverse du langage HTML dédié à la programmation web.

QGIS

id : qgis

types : Outils logiciels

mots-clés :

filename : qgis

QGIS est un logiciel libre et open source de traitement des données géographiques. Il est multi-plateforme et peut être utilisé sur plusieurs systèmes d’exploitation.

Il gère à la fois les , ainsi que les bases de données.

QGIS est une alternative à ArcGIS et fédère une large communauté. Il implique de nombreuses dépendances comme SQLite, GDAL ou PostGIS.

Site web : https://www.qgis.org/fr/site/

QR Code

id : qr code

types : Pratiques et méthodes

mots-clés :

filename : qr_code

Le QR Code (Quick Response Code) est un code-barre en deux dimensions dont l’agencement des points (noirs sur fond blanc) définit l’information contenue dans le code.

Ce code permet de stocker des données facilement lues par des applications et déclenchant des actions telles que la connexion à un site web, l’envoi d’un SMS, la connexion à une borne wifi, l’affichage d’un texte.

Il est lisible par les téléphones mobiles pourvus d’une application dédiée à sa lecture.

QUANTI

id : quanti

types : Groupements institutionnels

mots-clés :

filename : quanti

La liste de discussion "Quanti", créée après la journée d'études "Enseigner le quanti" qui a eu lieu à Paris le 5 juin 2015, a pour vocation d'accueillir les contributions et les échanges de toutes celles et tous ceux qui s'intéressent aux questions d'enseignement des méthodes quantitatives dans les sciences sociales.

Le wiki de la liste de diffusion propose une liste de logiciels généralistes et de logiciels spécialisés pour la construction et l'analyse de données d'enquêtes ou encore de données textuelles et de réseaux.

Site web : https://groupes.renater.fr/sympa/info/quanti

R

id : r

types : Outils logiciels, Technologies et familles d’outils

mots-clés :

filename : r

R est un outil de programmation (comme SPSS ou SAS, par exemple) et un langage de programmation.

Il permet de manipuler des données, faire des calculs et créer des graphiques. Il est libre et ouvert au développement, chaque utilisateur peut développer ses propres packages.

RAMEAU

id : rameau

types : Ressources

mots-clés :

filename : rameau

RAMEAU, pour Répertoire d’Autorité-Matière Encyclopédique et Alphabétique Unifié, est langage documentaire d’indexation matière. Le langage RAMEAU permet l’indexation analytique de tous les types de documents. Il s’agit d’un répertoire qui contient des notices d’autorité-matière reliées entre elles et qui permet la recherche par sujet dans les catalogues.

Site web : https://www.bnf.fr/fr/indexation-sujet-les-referentiels-utilises-par-la-bnf#bnf-rameau

RawGraphs

id : rawgraphs

types : Outils logiciels

mots-clés :

filename : rawgraphs

RawGraphs est un outil en ligne de visualisation de données tabulaires. Il est possible de télécharger les visualisations ainsi constituées sous forme d’images prêtes à la publication ou sous forme de fichiers .svg pouvant être retravaillés avec des logiciels d’édition d’images vectorielles.

Site web : https://app.rawgraphs.io

id : re3data

types : Ressources

mots-clés :

filename : re3data

Il s’agit d’un répertoire mondial qui recense les entrepôts de données de recherche.

Il fournit un moteur de recherche qu’il est notamment possible d’interroger par discipline.

Site web : https://www.re3data.org/search

React

id : react

types : Outils logiciels

mots-clés :

filename : react

React est une bibliothèque JavaScript open source utilisée pour la création d’interfaces utilisateur interactives et réactives. Il est possible d’ajouter React à une page HTML de manière très facile. React est très utilisé pour concevoir des sites web ou bien des applications mobiles.

Site web : https://react.dev/

Tutoriel : https://www.youtube.com/watch?v=Ke90Tje7VS0&ab_channel=ProgrammingwithMosh

READ

id : read

types : Outils logiciels

mots-clés :

filename : read

Recognition and Enrichment of Archival Documents. Plateforme de transcription et outil de reconnaissance automatique d’écriture manuscrite (HTR).

Voir Transkribus, eScriptorium

Reaveal.js

id : reaveal.js

types : Outils logiciels

mots-clés :

filename : reaveal.js

Reaveal.js est une librairie javascript open source servant à créer des présentations diaporama sur le web en codant en HTML. Un éditeur visuel nommé Slides a été développé pour ceux qui n’ont pas de compétences en codage. Cette librairie inclut un module d’écriture en markdown et un autre en LaTeX. Elle permet de faire des animations, d’intégrer des notes audios, ou encore d’exporter en pdf la présentation.

Site web : https://revealjs.com/

Recherche à facettes

id : recherche à facettes

types : Pratiques et méthodes

mots-clés :

filename : recherche_a_facettes

La recherche à facettes est basée sur une classification préalable des données qui fonctionne à la manière d'un crible : les facettes proposent un résultat en fonction de l'indexation des données à l'intérieur de la classification.

Elle se distingue de la recherche avancée en ce qu'elle ne permet pas de construire des requêtes personnalisées, par exemple en ajoutant des opérateurs booléens (« et », « ou », « sauf »).

Recherche avancée

id : recherche avancée

types : Pratiques et méthodes

mots-clés :

filename : recherche_avancee

Recherche par requête ou multi-critères. La recherche avancée peut aussi porter sur des métadonnées ou des annotations.

Voir Opérateurs booléens

Recherche plein texte

id : recherche plein texte

types : Pratiques et méthodes

mots-clés :

filename : recherche_plein_texte

La recherche plein texte consiste en une technique de recherche au sein d’un document électronique ou d’une base de données textuelles, dans laquelle le moteur de recherche examine tous les mots (chaînes ou suites de caractères) de chaque document enregistré.

Recherche simple

id : recherche simple

types : Pratiques et méthodes

mots-clés :

filename : recherche_simple

La recherche simple se concentre sur un seul champ de recherche (mot, auteur, titre), à l’inverse de la recherche avancée qui permet de croiser plusieurs critères de recherche (titre et auteur ; titre, auteur et date de publication, etc.).

Référencement

id : référencement

types : Pratiques et méthodes

mots-clés :

filename : referencement

Le référencement est, sur le web, l’action de référencer, c’est-à-dire d’indexer toutes les pages web présentes, en faisant un lien d’une page vers une ressource, généralement un moteur de recherche.

Aujourd’hui, le référencement consiste surtout à améliorer la place d’un site dans les résultats afin d’être le plus consulté possible. Pour cela il existe deux pratiques :

le SEO pour Search engine optimization, aussi nommé « référencement naturel », qui est un ensemble de techniques et méthodes pour améliorer le classement de son site dans les pages de résultat d’un moteur de recherche ;
le SEA pour Search Engine Advertising, qui est une pratique marketing payante visant le même objectif.

Voir : http://aide.meabilis.fr/glossaire/r/definition-referencement.html

Référentiel

id : référentiel

types : Pratiques et méthodes

mots-clés :

filename : referentiel

Ensemble d'informations servant de références, parce qu'elles font autorité, ou parce qu'elles représentent un point de vue privilégié ou offrent une description stable d'une réalité. Un dictionnaire, une nomenclature, un système de coordonnées sont des référentiels.

Certains référentiels sont constitués de données structurées selon des schémas et/ou des vocabulaires standardisés afin de pouvoir être mis en commun d'un système d’information à un autre. Plus généralement on appelle souvent référentiel un thésaurus vérifié et contrôlé permettant d'enrichir des données au sein d'un système d'information.

AURéHAL donne accès par exemple à l'ensemble des référentiels utilisés par la base de données de l'archive ouverte HAL, sous forme de thésaurus contrôlés. Certains de ces thésaurus sont ouverts (celui des auteurs peut être enrichi par les interventions des usagers de l'archive), d'autres sont fermés (le thésaurus des domaines de recherche associés aux publications par exemple). Pour produire et exposer des données de bonne qualité, la plupart des instruments numériques s'appuient sur de tels référentiels, ouverts ou fermés : l'un des plus impressionnant est Rameau qui tient lieu de méta-référentiel pour les données des catalogues de la BNF et les données d'autorité.

Voir Base de données ; Interopérabilité.

Exemples : voir Geonames, Rameau, VIAF.

Ressources web : Référentiels d'Isidore ; Référentiels de la BNF

RENATER

id : renater

types : Groupements institutionnels

mots-clés :

filename : renater

RENATER est le REseau NAtional de télécommunication pour la Technologie, l’Enseignement et la Recherche.

Il s'agit d'un groupement français d’intérêt public créé en 1993 qui assure la gestion du réseau d’interconnexion entre les établissements d’enseignement et de recherche.

Site web : https://www.renater.fr/

RePEc

id : repec

types : Outils logiciels, Ressources

mots-clés :

filename : repec

RePEc (Research Papers in Economics) est un projet collaboratif dont le principal outil développé est une base de données bibliographique décentralisée spécialisée dans la recherche économique.

La base de données recense des papiers de recherche, des articles, des programmes et des logiciels. Les métadonnées collectées sont ensuite utilisées dans divers services tels que EconPapers, IDEAS, NEP ou encore LogEc.

Le réseau RePEc propose d'autres services :

RePEc Author Service : fournit un profil utilisateur au chercheur en économie qui le souhaite ;
RePEc Biblio : assure une veille bibliographique en économie et fournit de nombreuses bibliographies thématiques régulièrement mises à jour ;
RePEc Genealogy : permet de relier les profils de chercheurs entre eux selon des liens tels que « étudiant-professeur » ;
SocioRePEc : permet d’annoter les ressources documentaires en PDF et d’établir des relations scientifiques entre les ressources.

Voir aussi : CollEc, CitEc

Site web : http://repec.org

id : ressource électronique

types : Pratiques et méthodes

mots-clés :

filename : ressource_electronique

Une ressource électronique est un document encodé de façon à être exploitable par un ordinateur.

Rétroconversion

id : rétroconversion

types : Pratiques et méthodes

mots-clés :

filename : retroconversion

Informatisation d’un catalogue papier afin de le rendre consultable via un catalogue en ligne. L’informatisation des catalogues permet aux lecteurs de pouvoir effectuer des requêtes plus ou moins complexes (recherche simple / recherche avancée) sur les collections, et offre de nouveaux services tels que l’affinage des résultats par facettes (recherche à facettes).

On parle aussi de plus en plus de rétroconversion pour tout processus de mise à disposition numérique d'un contenu auparavant imprimé (pour des anciens numéros de revues par exemple).

RGPD

id : rgpd

Site web : http://medialab.github.io/sandcrawler/

Science ouverte

id : science ouverte

types : Groupements institutionnels, Pratiques et méthodes

mots-clés :

filename : science_ouverte

Le mouvement de la science ouverte (open science) vise à construire un écosystème dans lequel la science sera plus cumulative, mieux soutenue par les données, plus transparente, plus rapide et offrant un accès universel. Il s’agit de rendre la recherche scientifique et les données qu’elle produit accessibles à tous et dans tous les niveaux de la société.

Ce mouvement oeuvre pour des sciences participatives et citoyennes.

Voir Open archives (archive ouverte) ; HAL ; Open data (donnée ouverte) ; Open access (Accès ouvert), Épi-revue ; Episciences, Couperin

Site web : https://www.ouvrirlascience.fr/open-science/

Définition sur le site du MESR - L'Open Science sur le site de l'université d'Angers

ScienceScape

id : sciencescape

types : Outils logiciels

mots-clés :

filename : sciencescape

ScienceScape est un environnement en ligne fournissant des outils scientométriques tels que des outils de conversion de fichiers ou encore de production et de visualisation de réseaux.

Site web : https://medialab.github.io/sciencescape/

Sciencesconf

id : sciencesconf

types : Outils logiciels

mots-clés :

filename : sciencesconf

Sciencesconf est une plateforme web multilingue à destination des organisateurs de colloques, conférences scientifiques, workshops. Elle est réservée aux établissements de l’enseignement supérieur et de la recherche.

Elle permet de gérer et de faciliter les différentes étapes de planification des manifestations scientifiques : de la réception des contributions en passant par la relecture et la programmation des axes et thématiques jusqu’à l’édition automatique des actes.

Il s’agit d’un service géré par le CCSD.

Site web : https://www.ccsd.cnrs.fr/gestion-de-colloques/

Scoop-it

id : scoop-it

types : Outils logiciels

mots-clés :

filename : scoop-it

Scoop-it est un outil de veille et de curation de contenu qui permet de créer des pages web thématiques alimentées par les contenus découverts grâce à la veille et de les partager avec d’autres utilisateurs.

Site web : https://www.scoop-it.fr

Screenshot Generator

id : screenshot generator

types : Outils logiciels

mots-clés :

filename : screenshot_generator

Il s’agit d’un outil permettant de générer des captures d’écran à partir d’une liste d’URLs.

Site web : https://wiki.digitalmethods.net/Dmi/ToolScreenshotGenerator

Scripta-PSL

id : scripta-psl

types : Groupements institutionnels

mots-clés :

filename : scripta-psl

Le programme Scripta-PSL vise à relier les sciences fondamentales de l’écrit (paléographie, épigraphie, codicologie, etc.) ainsi que d’autres SHS comme la linguistique, l’histoire ou encore l’anthropologie aux humanités numériques autour de l’étude de l’écrit.

Site web : https://scripta.psl.eu/presentation/

Search Engine Scraper

id : search engine scraper

types : Outils logiciels

mots-clés :

filename : search_engine_scraper

Cet outil permet de récupérer les résultats des moteurs de recherche générés suite à une requête. Il permet notamment de comparer les résultats de différents moteurs de recherche pour une même requête.

Voir aussi : Web scraping

Site web : https://tools.digitalmethods.net/beta/searchEngineScraper/

SeeAlsology

id : seealsology

types : Outils logiciels

mots-clés :

filename : seealsology

SeeAlsology est un outil permettant d’explorer la zone sémantique des pages wikipédia en produisant un graphe des liens de la section « Voir aussi » des articles.

Site web : https://densitydesign.github.io/strumentalia-seealsology/

SEO Search Engine Optimization

id : seo search engine optimization

types : Pratiques et méthodes

mots-clés :

filename : seo

Le SEO pour Search Engine Optimization, aussi nommé « référencement naturel », est un ensemble de techniques permettant à un site web d’améliorer son classement dans les pages de résultat d’un moteur de recherche. Le SEO repose sur la conception technique du site web, sur son contenu informatif, et sur l’affluence des visiteurs.

Le SEO est à différencier du SEA Search Engine Advertising qui est une pratique marketing payante permettant de faire apparaître un site web dans les premiers résultats d’un moteur de recherche.

Serveur

id : serveur

types : Pratiques et méthodes

mots-clés :

filename : serveur

Un serveur informatique est un ordinateur qui offre des services à un ou plusieurs clients (parfois des milliers). Généralement, on parle de serveur pour désigner la machine qui héberge et diffuse des sites internet.

Shapefile

id : shapefile

types : Pratiques et méthodes

mots-clés :

filename : shapefile

Shapefile (.shp) : format de fichier SIG le plus courant développé et publié par ESRI en 1998 en parallèle du SIG ArcGIS. De spécification ouverte, ce format est devenu un standard, utilisé par la plupart des logiciels SIG (libres ou commerciaux). Il consiste en une collection de fichiers de même noms et d'extensions propres, dont trois sont obligatoires : .SHP (la forme géométrique), .SHX (l'index de la géométrie) et .DBF (les données attributaires).

ShareDocs

id : sharedocs

types : Outils logiciels

mots-clés :

filename : sharedocs

ShareDocs est une plateforme de gestion de fichiers. Il s’agit d’un service développé par Huma-Num qui permet le stockage et le partage de fichiers.

Le stockage est déporté en ligne sur le réseau de recherche français. Les données hébergées peuvent être cryptées grâce à des outils comme ZED encrypt. ShareDocs est souvent utilisé pour la préparation de fichiers en vue d’une édition ou d’une diffusion en ligne.

Site web : https://documentation.huma-num.fr/sharedocs-stockage/

SHS

id : shs

types : Pratiques et méthodes

mots-clés :

filename : shs

Les Sciences Humaines et Sociales (SHS) sont un ensemble de disciplines s'intéressant aux phénomènes qui touchent à l'humain (linguistique, psychologie, perception, cognition) ou aux groupes d'hommes (sociologie, histoire, géographie, etc.).

SIG

id : sig

types : Technologies et familles d’outils

mots-clés :

filename : sig_websig

Le terme de système d’information géographique renvoie aussi bien à des technologies, qu’à des processus et méthodes. Les logiciels de SIG sont conçus pour acquérir, stocker, traiter et diffuser de l’information géographique, sous forme de plans et de cartes.

Ces logiciels sont parfois disponibles sous forme d’application disponibles sur des sites web, on les appelle alors WebSIG.

Voir Géomatique, Chronocarto, ArcGIS, QGIS, GrassGIS, GeoServer

Sigma.js

id : sigma.js

types : Outils logiciels

mots-clés :

filename : sigma.js

Sigma.js est une librairie JavaScript permettant de visualiser des réseaux directement dans le navigateur.

Site web : http://sigmajs.org

Signet

id : signet

types : Pratiques et méthodes

mots-clés :

filename : signet_ou_bookmark

A l’origine, un signet (bookmark) s’apparente à un marque-page. Il s’agit d’un ruban ou d’un filet inséré entre deux pages d’un livre de façon à signaler l’endroit que l’on souhaite retrouver.

Du point de vue numérique, le signet constitue un mode d’accès rapide à un site web dont l’adresse est préalablement stockée en mémoire par l’internaute. Un signet ne stocke que la localisation d’un site ou d’une page web et pas son contenu. Il est possible de créer des répertoires de signets pour conserver et classer plusieurs adresses électroniques.

SILL

id : sill

types : Pratiques et méthodes, Ressources

mots-clés :

filename : sill

Le SILL, socle interministériel des logiciels libres, est un catalogue de logiciels recommandés pour les administrations.

Site web : https://sill.etalab.gouv.fr/software

id : sparql

types : Pratiques et méthodes

mots-clés :

filename : sparql

SPARQL est un langage informatique de programmation. Plus précisément, il s’agit d’un langage de requête et d’un protocole.

Il permet de récupérer, de rechercher, ajouter, modifier et supprimer des données de type RDF disponibles sur Internet. Il est équivalent au langage SQL mais il respecte les standards du W3C et permet la transmission des données à travers le réseau.

SPARQL peut récupérer les données stockées sur des serveurs SPARQL, autrement appelés Triple Store. Souvent, SPARQL est utilisé conjointement à un autre langage de programmation.

SpartiaLite

id : spartialite

types : Pratiques et méthodes

mots-clés :

filename : spartialite

Bibliothèque open source qui étend la bibliothèque SQLite (base de données relationnelle accessible par le langage SQL) en lui donnant des capacités spatiales.

SPPAS

id : sppas

types : Outils logiciels

mots-clés :

filename : sppas

SPAAS est un logiciel d’annotations phonétiques automatisé avec alignement son-texte qui prend en charge plusieurs langues européennes et asiatiques.

Site web : http://www.sppas.org

SQL

id : sql

types : Pratiques et méthodes

mots-clés :

filename : sql

Le SQL (Structured Query Language) est un langage informatique de définition et de manipulation des données ainsi qu’un langage de protection d’accès. Autrement dit, il permet de créer, modifier ou supprimer des tables dans une base de données relationnelle.

Il permet également de sélectionner, modifier, insérer ou supprimer des données au sein d’une table d’une base de données relationnelles.

Avec SQL, il est enfin possible de définir différentes permissions d’accès en fonction des utilisateurs de la base de données, on parle alors de DCL (Data Control Language).

Voir MCD, SPARQL

Star

id : star

types : Outils logiciels

mots-clés :

filename : star

Star est une application professionnelle nationale mise à disposition des établissements habilités à délivrer le diplôme de doctorat.

Cette application sert au signalement et à l’archivage des thèses au format électronique.

Site web : https://abes.fr/reseau-theses/outils-et-services-theses/signalement-theses/

Stylo

id : stylo

id : tei

types : Groupements institutionnels, Pratiques et méthodes

mots-clés :

filename : tei

La TEI (Text Encoding Initiative) est un consortium fondé pour normaliser l'usage du langage XML pour l'encodage sémantique de textes historiques et littéraires. Par extension, on appelle TEI l'ensemble des balises et leurs règles d'application telles que définies et régulièrement mises à jour par le consortium.

Site web : https://tei-c.org/

Telemeta

id : telemeta

types : Outils logiciels

mots-clés :

filename : telemata

Telemata est un logiciel qui permet l’archivage sécurisé, la sauvegarde, le transcodage, l’analyse et la publication de fichiers audios et vidéos auxquels sont liées des métadonnées approfondies.

Site web : http://telemeta.org

Tesselle

id : tesselle

types : Outils logiciels

mots-clés :

filename : tesselle

Tesselle est une application web qui permet l’exploitation de ressources iconographiques. Elle permet notamment d’annoter des images de grand format et en haute définition.

Site web : https://medialab.github.io/tesselle/#/

Tesseract

id : tesseract

types : Outils logiciels

mots-clés :

filename : tesseract

Logiciel libre et open source de reconnaissance optique de caractère (OCR).

Site web : https://github.com/tesseract-ocr/tesseract

Text and Data Mining

id : text and data mining

types : Pratiques et méthodes

mots-clés :

filename : text_and_data_mining

Le Text and Data Mining (TDM) est un ensemble de traitements automatisés extrayant et analysant des informations (textes, images, données, sons, etc) stockées dans des corpus numériques conséquents dans le but d’en tirer de nouvelles connaissances.

Il s’appuie notamment sur les méthodes d’analyse linguistique. Ces traitements répondent à la croissance importante des données numériques qui rend difficile le travail « manuel » de veille, d’analyse et d’exploitation, des chercheurs.

Voir Fouille de texte

Text Ripper

id : text ripper

types : Outils logiciels

mots-clés :

filename : text_ripper

Cet outil permet d’extraire tout le texte d’une page web spécifique.

Site web : https://tools.digitalmethods.net/beta/textRipper/

TextObserver

id : textobserver

types : Outils logiciels

mots-clés :

filename : textobserver

TextObserver est un logiciel d’observation et d’analyse statistique de données textuelles.

Site web : http://textopol.u-pec.fr/textobserver/

Textométrie

id : textométrie

types : Technologies et familles d’outils

mots-clés :

filename : textometrie

La textométrie est l’application de calculs sur des données textuelles : statistique lexicale, analyses factorielles, classifications.

DtmVic, Hyperbase, IRaMuTeQ, Lexico 5, Le Trameur, TXM sont des outils dédiés à l'analyse textométrique.

Voir Stylométrie

The Old Reader

id : the old reader

types : Outils logiciels

mots-clés :

filename : the_old_reader

The Old Reader est un outil de veille qui permet d'agréger des flux RSS et des pages web sur une interface utilisateur personnelle. Il est gratuit en dessous de 100 flux.

Site web : https://theoldreader.com/home

Thème/Template

id : thème/template

types : Pratiques et méthodes

mots-clés :

filename : theme_template

Un template (ou « thème », « layout », etc.) désigne l’enveloppe graphique d’un site internet, indépendamment de son contenu. Il s’agit par exemple de la disposition des colonnes, du choix des caractères ou des couleurs, de la structure des différents éléments, etc. Un template propose plusieurs pages web de base et des feuilles de style. Cela permet de séparer le contenu (les données) et le contenant (le thème), celui-ci pouvant être changé facilement sur les différents CMS.

Thésaurus

id : thésaurus

types : Pratiques et méthodes

mots-clés :

filename : thesaurus

Répertoire structuré de termes (mots clés) pour l’analyse de contenu et le classement de documents.

Voir : Opentheso

En savoir plus : https://www.cnrtl.fr/definition/thésaurus

TIFF

id : tiff

types : Pratiques et méthodes

mots-clés :

filename : tiff

TIFF (Tag Image File Format) : format image propriétaire mais pleinement documenté, il est maintenant maintenu par Adobe. Ce format se caractérise par un en-tête riche comportant des métadonnées de format EXIF, IPTC et XMP. Doté d’une version sans compression, c’est un format image largement utilisé pour la conservation pérenne de numérisation haute qualité et pour l’impression en couleurs.

Voir Image.

Timeline JS

id : timeline js

types : Outils logiciels

mots-clés :

filename : timeline_js

Développé par le Northwestern University Knight Lab, Timeline JS est un service en ligne et gratuit de création de frise chronologique, codé en JavaScript. Cet outil de visualisation utilise des données d’un document Google Sheet pour créer la frise. Cette frise peut ensuite être intégrée dans une page web.

Site web : http://timeline.knightlab.com/

Timestamp Ripper

id : timestamp ripper

types : Outils logiciels

mots-clés :

filename : timestamp_ripper

Cet outil permet d’extraire et de présenter la dernière date de modification d’une page web.

Site web : https://tools.digitalmethods.net/beta/timestamp/

TLD Counts

id : tld counts

types : Outils logiciels

mots-clés :

filename : tld_counts

En entrant des URLs cet outil permet de compter les domaines de premier niveau (top level domains).

Site web : https://tools.digitalmethods.net/beta/tldCounts/

TMX

id : tmx

types : Pratiques et méthodes

mots-clés :

filename : tmx

TMX (Translation Memory eXchange) est un format de fichier basé sur le standard XML. Il est utilisé pour aligner les traductions de phrases dans différentes langues.

Toolbox

id : toolbox

types : Outils logiciels

mots-clés :

filename : toolbox

Toolbox est un outil de gestion et d’analyse de données linguistiques écrites. Il permet l’annotation multi-linéaire, la création de lexique, le tri.

Site web : https://software.sil.org/toolbox/

Tracker Tracker

id : tracker tracker

types : Outils logiciels

mots-clés :

filename : tracker_tracker

Cet outil permet de détecter, dans une liste d’URLs, les empreintes prédéfinies des technologies de traquage web.

Voir aussi : App Tracker Explorer

Site web : https://tools.digitalmethods.net/beta/trackerTracker/

Traduction

id : traduction

types : Pratiques et méthodes

mots-clés :

filename : traduction

Traduire s’est transposer dans une langue cible un texte donné dans une langue source. La traduction doit rendre compte le plus fidèlement possible du texte d’origine tout en étant parfaitement intelligible et correct dans la langue cible. Elle ouvre une multitude de questions de nature linguistique, psychologique, voire philosophique, afin de s’interroger sur les caractéristiques d’une « bonne traduction ».

Traduction automatique

id : traduction automatique

Ces transcriptions peuvent être synchronisées avec l'enregistrement au niveau des prises de paroles voire au niveau des mots. Dans ce dernier cas, la synchronisation est calculée automatiquement par des logiciels. La synchronisation permet d'écouter l'enregistrement au moment de la prononciation d'une certaine prise de parole ou d'un mot particulier de la transcription, ou bien d'afficher la transcription au fil de l'écoute de l'enregistrement.

Voir OCR, Transcriber, Transkribus, eScriptorium, READ, HTR

Transkribus

id : transkribus

types : Outils logiciels

mots-clés :

filename : transkribus

Transkribus est un outil qui permet la reconnaissance de caractères dans des documents transcrits (manuscrits ou imprimés). Il peut être utilisé en local ou via sa plateforme.

Il est porté par l’université d’Insbruck.

Voir : HTR

Site web : https://transkribus.eu/Transkribus

Triangulate

id : triangulate

types : Outils logiciels

mots-clés :

filename : triangulate

Triangulate permet d’extraire et de visualiser les points communs entre plusieurs URLs. Les visualisations possibles incluent un diagramme de Venn.

Site web : https://tools.digitalmethods.net/beta/triangulate/

Triple store

id : triple store

types : Pratiques et méthodes

mots-clés :

filename : triple_store

Entrepôt de données conçu pour le stockage et la récupération de données structurées en RDF. Le langage de requêtage est SPARQL.

Troncature

id : troncature

id : umap

types : Outils logiciels

mots-clés :

filename : umap

uMap est un outil en ligne qui permet de créer des cartes avec des calques OpenStreetMap et de les intégrer à un site web.

Il complète l’outil Khartis en permettant de projeter les données sur une carte interactive navigable (plutôt que sur une carte statique).

Site web : https://umap.openstreetmap.fr/en/

Unicode/UTF-8

id : unicode/utf-8

types : Pratiques et méthodes

mots-clés :

filename : unicode_utf-8

L’Unicode est un standard informatique international qui permet de décrire toutes les lettres des différentes langues. Il vise au codage du texte écrit en donnant à tout caractère de n’importe quel système d’écriture un identifiant numérique, et ce de manière unifiée, quelle que soit la plateforme informatique ou le logiciel utilisé (à la différence d’ANSI).

Il est plus complet que le code ASCII qui ne possède pas de signe diacritique. Le code informatique d’Unicode est standardisé par l’UTF (Universal Character Set Transformation Format) ; nous sommes maintenant en UTF-8. Le fait que le caractère soit codé en UTF ne veut pas dire qu’il va s’afficher correctement : il faut ensuite disposer de la police de caractère adéquate mais le caractère sera bien interprété informatiquement.

Unitex/GramLab

id : unitex/gramlab

types : Outils logiciels

mots-clés :

filename : unitex_gramlab

Unitex/GramLab est une suite logicielle libre, multiplateforme, multilingue (22 langues) qui est fondée sur des grammaires et des dictionnaires et qui permet l’analyse de corpus textuels.

Site web : https://unitexgramlab.org/fr

Ural

id : ural

types : Outils logiciels

mots-clés :

filename : ural

Ural est une librairie python fournissant des fonctions utiles au traitement et à la manipulation des URLs.

Site web : https://github.com/medialab/ural

URI

id : uri

types : Pratiques et méthodes

mots-clés :

filename : uri

URI (Uniform Resource Identifier – Identifiant Uniforme de Resource) : chaîne de caractères qui identifie de façon unique une ressource sur un réseau. L’adresse URI doit permettre d'identifier une ressource de manière permanente, même si la ressource est déplacée ou supprimée. Une norme gérée par le W3C gère la syntaxe des adresses URI.

L’URL (Uniform Resource Locators) qui permet d’identifier la localisation d’une ressource et l’URN (Uniform Resource Names) qui permet d’identifier une ressource, mais pas de la localiser, sont des spécialisations d’URI.

Voir Web sémantique.

URL

id : url

types : Pratiques et méthodes

mots-clés :

filename : url

L’URL (Uniform Resource Locators) est une adresse qui précise la localisation d’une ressource Internet en indiquant le protocole à adopter, le nom de la machine, le chemin d’accès et le nom du fichier.

Par exemple, http://www.larousse.net est une URL.

UX Design

id : ux design

types : Pratiques et méthodes

mots-clés :

filename : ux_design

L'UX Design (User eXperience Design) consiste à étudier et prendre en compte les attentes et les besoins des utilisateurs lors de la conception d’un site web.

Le but de l’UX Design est de rendre l’expérience de l’utilisateur sur le site plus instinctive, plus ergonomique afin qu’il se sente en confiance, qu’il trouve les informations dont il a besoin et qu’il ait envie d’interagir avec le site.

id : viaf

types : Ressources

mots-clés :

filename : viaf

VIAF (Fichier d’Autorité International Virtuel), est un fichier d’autorité international de référence (noms de personne, collectivités, noms géographiques, œuvres et expressions).

Voir Référentiel.

Site web : http://viaf.org

Visualisation de données

id : visualisation de données

types : Technologies et familles d’outils

mots-clés :

filename : visualisation_de_donnees

La visualisation de données désigne la représentation graphique d'informations et de données. À l'aide d'éléments visuels comme les graphiques et les cartes, une visualisation de données permet de voir et de comprendre des tendances ou des valeurs inhabituelles dans les données, de manière très accessible.

Dans le monde du Big Data, les outils et technologies de visualisation de données sont indispensables pour analyser d'énormes volumes d'informations et prendre des décisions en s'appuyant sur les données.

Voir Visualisation par graphe

Ressource web : https://www.tableau.com/fr-fr/learn/articles/data-visualization

Visualisation par graphe

id : visualisation par graphe

Sites web : http://voyant.tools.huma-num.fr/docs/#!/guide/start - https://voyant-tools.org

W3C

id : w3c

types : Pratiques et méthodes

mots-clés :

filename : w3c

Le W3C ou World Wide Web Consortium est une communauté internationale d’acteurs qui travaille au développement des standards du Web. Il est dirigé par l’inventeur du Web Tim Berners-Lee et par Jeffrey Jaffe.

Voir : Référentiel

Site web : https://www.w3.org/

WaveSurfer

id : wavesurfer

types : Outils logiciels

mots-clés :

filename : wavesurfer

WaveSurfer est un logiciel multiplateforme d’analyse et d’annotation de données audios.

Site web : https://www.speech.kth.se/wavesurfer/

Wayback Machine

id : wayback machine

types : Outils logiciels

mots-clés :

filename : wayback_machine

Wayback Machine est un outil en ligne qui permet la consultation des versions archivées d’un site web.

Site web : http://web.archive.org

Web 2.0

id : web 2.0

types : Technologies et familles d’outils

mots-clés :

filename : web_2.0

Le web 2.0 ou « web participatif » désigne les évolutions techniques et les nouveaux usages du web qui permettent aux utilisateurs d’interagir entre eux mais également participer à la création ou à la modification du contenu des sites web.

Les wikis, les blogs, les flux RSS, les réseaux sociaux sont des outils du Web 2.0.

Voir Crowdsourcing, folksonomie

Web scraping

id : web scraping

types : Pratiques et méthodes

mots-clés :

filename : web_scraping

Le web scraping est une technique d’extraction de contenu de site web. Il repose sur la technique du crawler qui parcourt les sites web et du scraper qui extrait des informations depuis la structure HTML grâce à des sélecteurs (tels que X-path, CSS ou RegEx). Il existe des logiciels spécifiquement conçus pour extraire des données : Octoparse, Google Play Store Scraper, Image scraper, News Agencies Scraper, Search Engine Scraper, iTunes App Store Scraper, … De plus des bibliothèques de programmation ont aussi été créées pour aider les utilisateurs à développer leur propre programme de web scraping (par exemple Artoos.js ou Sandcrawler en Java).

Web sémantique

id : web sémantique

types : Pratiques et méthodes

mots-clés :

filename : web_semantique

Le Web sémantique, appelé aussi Web de données, est le Web permettant d’échanger et d’utiliser des données, de publier et de lier des bases de données sur le Web.

Succédant au Web documentaire, il s’appuie sur un standard du Web, l’URI (Uniform Resource Identifier), qui identifie une ressource. Le modèle de données RDF, également standard du Web sémantique, permet quant à lui de décrire, représenter et relier des données.

Voir DBpedia.

Cours en ligne sur Fun MOOC : https://www.fun-mooc.fr/courses/inria/41002S02/session02/about

WebAnno

id : webanno

types : Outils logiciels

mots-clés :

filename : webanno

WebAnno est un logiciel d’annotations manuelles et de gestion d’annotations de données textuelles.

Site web : https://webanno.github.io/webanno/

WebMAUS

id : webmaus

types : Outils logiciels

mots-clés :

filename : webmaus

WebMAUS est un outil en ligne d’alignement automatique d’un fichier son et de sa transcription textuelle.

Il existe deux versions de cet outil, le WebMAUS Basic et le WebMAUS General.

Sites web :

WFS

id : wfs

types : Pratiques et méthodes

mots-clés :

filename : wfs

WFS (Web Feature Service) : protocole défini par l'Open Geospatial Consortium qui permet d'interroger des objets géographiques vectoriels hébergés sur un serveur au moyen d'une URL formatée.

Wikipedia (outils)

id : wikipedia (outils)

types : Outils logiciels

mots-clés :

filename : wikipedia_outils

Wikipedia Categories Scraper. A partir de l’URL d’un article wikipédia, cet outil récupère les catégories d’articles et les catégories des articles liés dans toutes les langues.
Wikipedia Cross-Lingual Image Analysis. Cet outil permet de récupérer et de comparer toutes les images des différentes versions linguistiques d’un article Wikipédia.
Wikipedia Edits Scraper and IP Localizer. Cet outil récupère et analyse tout l’historique d’une page Wikipédia et quand il trouve une adresse IP au lieu d’un nom d’utilisateur (dans l’historique des modifications), il la géolocalise.
Wikipedia Entry Check. Cet outil permet de vérifier si des termes existent sous la forme d’articles Wikipédia.
Wikipedia History Flow Companion. Cet outil permet de spécifier un intervalle de révisions wikipédia et est à utiliser avec l’outil de visualisation History Flow.
Wikipedia TOC Scraper. Cet outil permet de récupérer les révisions d’une page wikipédia à travers la récupération des sommaires.

WinPitch

id : winpitch

types : Outils logiciels

mots-clés :

filename : winpitch

WinPitch est un logiciel développé pour la recherche prosodique qui permet notamment la visualisation en temps-réel, l’analyse de la courbe mélodique, l’alignement de texte assisté, la segmentation automatique ou encore la création de lexique.

Site web : http://www.winpitch.com

Wordle

id : wordle

types : Outils logiciels

mots-clés :

filename : wordle

Wordle est un outil qui permet de générer des nuages de mots-clés (tags) à partir de textes ou de liens. Wordle offre également des fonctionnalités de design personnalisable.

Site web : http://ww7.wordle.com

Wysiwyg

id : wysiwyg

types : Technologies et familles d’outils

mots-clés :

filename : wysiwyg

Wysiwyg est un acronyme anglais qui signifie « what you see is what you get » : « ce que vous voyez est ce que vous obtenez ». Cela désigne une interface graphique (le plus souvent par formulaire ou bouton) qui permet de composer visuellement le résultat attendu sans passer par l’écriture et donc l’apprentissage de codes informatiques.

id : xmind

types : Outils logiciels

mots-clés :

filename : xmind

XMind est un logiciel open source de création de "concept map", d'organigrammes, cartes, plans et autres schémas. Très simple d'utilisation, l'application vous permet d'éditer toutes les parties de votre organigramme (liaison, encarts principaux et secondaires, etc.), d'ajouter des images et des liens, d'insérer du texte, d'intégrer des marqueurs (ressemblant à des emoticons) pour indiquer la priorité par exemple, d'annoter votre case, etc. Vous pourrez également attacher un document externe, imprimer, et exporter votre projet aux formats HTML, image, texte, etc.

Site web : https://www.xmind.net/desktop/

XML

id : xml

types : Pratiques et méthodes

mots-clés :

filename : xml

Pour pouvoir être lue et archivée, une ressource numérique demande un encodage qui respecte les exigences de son auteur mais qui soit aussi compréhensible par d’autres. De nombreux standards d’encodage existent. Mais pour la représentation et l’échange des informations contenues dans la ressource, le XML (eXtensible Markup Language, « langage de balisage extensible ») est devenu le langage de référence.

Il est utilisé dans de nombreuses situations et a développé des initiatives dérivées qui permettent de répondre à de nombreux besoins (dont XML-TEI). Le HTML est un langage avec une liste fermée de balises qui ne s’occupent que de la mise en forme. Le XML propose une couche supplémentaire avec une liste non limitée de balises qui permettent de structurer son propre langage : elles concernent généralement la structure ou l’interprétation du contenu. Le XML a donc une structure ouverte, les balises ne sont pas limitées mais il y a des règles d’utilisation à respecter. En tête d’un document XML, il y a généralement les métadonnées Dublin Core.

XML-MEI

id : xml-mei

types : Groupements institutionnels, Pratiques et méthodes

mots-clés :

filename : xml-mei

XML-MEI (XML music encoding initiative) désigne à la fois un ensemble de règles pour les documents de notation musical et la communauté les définissant.

Site web : https://music-encoding.org/

Voir aussi : TEI

XSD

id : xsd

types : Pratiques et méthodes, Technologies et familles d’outils

mots-clés :

filename : xsd

Le schéma de définition XML (XSD pour XML Schema Definition), est un langage de description de la structure d’un document en XML. Il permet de définir chaque éléments (nom et type), leurs attributs et leurs restrictions.

Pour en savoir plus : https://florian-lepretre.herokuapp.com/teaching/webservices/xsd

XSL

id : xsl

types : Pratiques et méthodes

mots-clés :

filename : xsl

XSL (eXtensible Stylesheet Language) est le langage de description de feuilles de style associé à XML.

Ainsi, une feuille de style écrite en XSL constitue un fichier permettant la mise en forme mais aussi la transformation d’un document XML en un autre document XML.

Plus précisément, XSL forme en réalité une famille de langages à trois composantes : XSLT ou le langage de transformation d’un document XML, XPath ou le langage de navigation au sein d’un document XML, XSL-FO ou le langage de mise en forme d’un document XML.

Youtube Data Tools

id : youtube data tools

types : Outils logiciels

mots-clés :

filename : youtube_data_tools

Il s’agit d’une collection d’outils variés permettant l’extraction de données de la plateforme Youtube.

Site web : https://tools.digitalmethods.net/netvizz/youtube/

Zenodo

id : zenodo

types : Outils logiciels, Ressources

mots-clés :

filename : zenodo

Zenodo est un répertoire créé dans le cadre du projet européen OpenAIRE par le CERN (Conseil Européen pour la Recherche Nucléaire).

Il s’agit d’un entrepôt où les chercheurs, de toutes les disciplines et de tous pays, peuvent déposer leurs données ou d’autres types de document.

Zenodo fournit un DOI aux ressources qui en sont dépourvues. Les archives peuvent être déposées en accès ouvert, restreint ou fermé. En revanche leurs métadonnées sont sous licence CC0 et peuvent être moissonnées selon le protocole OAI-PMH.

Site web : https://zenodo.org

Zotero

id : zotero

types : Outils logiciels

mots-clés :

filename : zotero

C’est un logiciel de gestion de références bibliographiques gratuit et open source. Il permet de gérer des données bibliographiques et des documents de recherche (fichiers PDF, images, etc.). Il s’intègre au navigateur web et permet de synchroniser des données depuis plusieurs ordinateurs, ainsi que de faire de la génération de citations (notes et bibliographies).

Le développement du logiciel est à l'initiative du Roy Rosenzweig Center for History and New Media (CHNM) de l'université George Mason, le même centre qui développe Omeka.

Site web : https://www.zotero.org

Aide

Cliquez ici pour accéder à la documentation de Cosma

Raccourcis

Espace	Réactiver l'algorithme de dessin du graphe
S	Déplacer le curseur dans le champ Recherche
Alt + clic	(sur un type de fiche) Désélectionner les autres types
R	Réinitialiser le zoom
Alt + R	Réinitialiser l'affichage
C	Zoomer et centrer sur le nœud sélectionné
F	Passer en mode Focus
Echap	Fermer la fiche sélectionnée

Glossaire humanités numériques

Ce glossaire a été publié initialement par Marie-Laure Massot (CNRS, UMS 3610 CAPHÉS - ENS Paris) et Agnès Tricoche (CNRS, UMR 8546 AOROC - ENS Paris) à l'adresse <https://digithum.huma-num.fr/ressources/glossaire/>.

Cette version du glossaire a été réalisée par Arthur Perret (ELICO, Université Jean Moulin Lyon 3). Dernière mise à jour : 27 février 2024.

Ce glossaire est conçu au départ de ceux de la plateforme d’édition de manuscrits et d’archives EMAN et du projet Foucault fiches de lectures. Ayant pour vocation d'évoluer au fil du temps, il bénéficie de l'expertise des membres du Groupe de travail humanités numériques de l’EUR Translitterae.

Il doit beaucoup à Pauline Leplongeon, étudiante en master à l'université Côte-d'Azur, et à Anne-Claire Durand, étudiante en master à l’école du Louvre, qui lors de stages réalisés en juillet-août 2021 et en juin 2022, en ont considérablement amélioré et enrichi la présente version.

Par ailleurs, deux sites web ont été particulièrement utiles à l'élaboration de ce glossaire : celui du Médialab de Sciences Po et celui de la Digital Methods Initiative.

Version 2.4.0 • Licence GPL-3.0-or-later

Arthur Perret
Guillaume Brioudes
Clément Borel
Olivier Le Deuff
Programme ANR HyperOtlet

D3 v4.13.0: Mike Bostock (BSD 3-Clause)
Nunjucks v3.2.3: James Long (BSD 2-Clause)
Js-yaml v4.1.0: Vitaly Puzrin (MIT License)
Markdown-it v12.3.0: Vitaly Puzrin, Alex Kocharin (MIT License)
Citeproc v2.4.62: Frank Bennett (CPAL, AGPL)
Fuse-js v6.4.6: Kiro Risk (Apache License 2.0)