Le 26 novembre 2024, à la Cité des sciences et de l’industrie, 16 journalistes membres ont eu le plaisir de discuter du moteur de recherche ScanR avec un de ses créateurs Emmanuel Weisenburger, chef du département Ingénierie et science des données du ministère de l’Enseignement supérieur et de la Recherche.
A la Cité des Sciences et de l’Industrie, Emmanuel Weisenburger nous présente scanR, un moteur de recherche dédié à la recherche et à l’innovation françaises. Contraint par des moyens limités, scanR se veut agile, frugal et open source. Créé en 2016, une douzaine de personnes travaillent dessus aujourd’hui. Les tâches de fond consistent à collecter des données dans des sources publiques, telles HAL, Sudoc ou theses.fr. Une fois les données agrégées, les algorithmes les relient entre elles et les contextualisent. Partie visible de l’iceberg : l’interface, où chacun accède librement à des métadonnées enrichies illustrant l’écosystème scientifique français – qui fait quoi et avec qui ? Démonstration. La fonctionnalité de base permet de consulter des fiches synthétisant des informations factuelles sur chaque structure de recherche publique ou privée, chaque auteur·rice, chaque financement public, chaque publication et chaque brevet répertoriés par scanR. On y retrouve donc facilement les identifiants IdRef d’un·e chercheur·se, l’adresse ou les réseaux sociaux d’un organisme de recherche, les prix obtenus par chacun·e, le résumé des publications, l’origine des financements publics d’un projet ou la date et le lieu de dépôt d’un brevet. Plus intéressant, une fonctionnalité avancée explore l’écosystème autour de notre cible : liens vers des structures ou publications similaires, nuages de mots-clés révélant des tendances dans la recherche, graphes illustrant les réseaux relationnels entre auteur·rices, etc. Bref, de quoi ouvrir nos perspectives et tirer des fils pour approfondir, ou non, nos enquêtes. En effet, Emmanuel Weisenburger, fier de cet outil unique, nous alerte cependant : scanR donne des indices, mais ne présente pas une vérité absolue. Problèmes d’orthographe ou d’homonymie, non-accès aux données protégées ou privées, informations parfois parcellaires, liens et classifications algorithmiques pas toujours pertinents, ce moteur de recherche reste un outil parmi d’autres dans notre panoplie. Nous lui avons fait part de nos remarques et besoins, très spécifiques. Pourquoi pas un échange plus approfondi entre les journalistes scientifiques et les équipes de scanR pour affiner les fonctionnalités et faire connaître l’outil au plus grand nombre ?
Merci Cynthia Laboureau pour ce compte rendu !
Voici la présentation (merci de ne pas la partager en dehors de l’asso).