Datathon Read Write Cite

Wiki du datathon des 5-6 septembre 2019 à Marseille

Outils pour utilisateurs

Outils du site


defis

Défi 1 - analyser la fréquentation des plateformes

Dans les analyses de l'impact de la science, l’acte de lecture a souvent disparu. L’impact est généralement réduit à la citation académique, mesurée avec des outils inadaptés que le mouvement des Altmetrics tente de réformer. Pourtant, autour des plateformes numériques d'édition comme OpenEdition, les données pullulent pour analyser l'activité de lecture. Deux sources principales peuvent être exploitées : les logs, des journaux sur lesquels un serveur enregistre l’ensemble de ses activités (des données souvent bruitées par les robots) et les trackers, des scripts qui envoient une information au serveur de collecte des données de fréquentation. S'appuyant sur ces sources massives de données, OpenEdition a développé un détecteur de lecteur inattendu pour identifier les cas où la diffusion en open access a favorisé la diffusion de productions scientifique en SHS au-delà du public habituel de la science, généralement des chercheurs dans la même discipline. Les équipes dans le cadre de ce défi tenteront de documenter les cas de lecteurs inattendus, de reconstituer des profils de visiteurs, de comprendre les usages à partir des données voire de créer des personas.

Défi 2 - Analyses textuelles sur les articles publiés sur Hypothèses

Les carnets de chercheurs d’Hypotheses.org constituent un corpus riche pour comprendre les pratiques communicationnelles et la mise en visibilité des chercheurs en SHS dans le nouvel écosystème scientifique numérique. Le projet HYCAR porté par le GIS Réseau URFIST propose deux axes d'analyse sur ce matériau qui constitueront la base de ce deuxième défi : savoir comment les chercheurs s’approprient ces outils et comprendre comment ces carnets s’articulent aux autres formes de présence numérique (archives ouvertes, réseaux sociaux, blogs de revues). Dans ce défi, nous cherchons à discerner différentes stratégies de publication, de distinguer des comportements types ou encore de comprendre l'articulation entre le carnet et les autres publications des chercheurs. Pour répondre à ces questions, nous pourrons nous appuyer sur des données riches avec le texte de l'ensemble des billets des carnets, l'index disciplinaire des carnets ainsi que la taxonomie des billets.

Défi 3 - Les citations dans et vers les plateformes d'OpenEdition

Les citations constituent aujourd'hui l'étalon de la mesure de l'impact des publications scientifiques. Cette approche est couramment critiquée, car elle réduit l'évaluation de la recherche à une seule et unique dimension. Toutefois, les données des citations peuvent servir à des usages très différents de la seule évaluation. Elles peuvent servir à connaître les points d'intersection entre les disciplines, retracer l'évolution des communautés de recherche, découvrir l'émergence de sujets ou encore comprendre les stratégies de carrière des chercheurs. Pour répondre à ces questions, le projet OpenCitations propose près des 14 millions liens de citations entre des publications identifiées par un Crossref DOI. Si les citations académiques “d'articles à articles” constituent une valeur évaluative de la recherche et les indicateurs précisés ci-dessus, elles se restreignent au domaine universitaire. Les indicateurs regroupés sous le terme d'Almétrics intègrent à leurs mesures la présence de citations sur d'autres sphères sociales (réseaux sociaux numérique, site web…). Cependant, ces interfaces ne proposent qu'une lecture quantitative de ces pratiques. Nous proposons pour ce défi, d'explorer les contenus citant OpenEdition dans cette “littérature grise”. Pour cela nous mettrons à disposition les données constituées pour le projet “Appropriation du savoir ouvert” (Lucie Loubère & Fidélia Ibekwe). Des sous ensembles de textes pourront vous êtres proposés pour permettre une exploration plus ciblée sur des pistes non explorées.

defis.txt · Dernière modification: 2019/09/04 12:22 par samgoeta