Archives de catégorie : Moteur et outil de recherche

ScanR : le moteur de recherche du MENESR pour identifier les structures de recherche françaises


scanrinterfaceScanR, lancé le 6/07/2016 en version bêta est présenté comme “le moteur de la recherche et de l’innovation“ qui permet de rechercher des acteurs de la recherche publiques et privés implantés en France. Il a été développé par le Ministère  de l’Éducation Nationale, de l’Enseignement Supérieur et de la recherche à partir d’un nombre impressionnant de ressources fournies par les organismes de recherches mais aussi par des entités travaillant sur l’Open data (Etalab, OpenData…), des référentiels (GRID, Global Research Identifier Database), RNSR, Répertoire national des structures de recherche, Crossref…), des réservoirs de contenus (Espace.net pour les brevets,  theses.fr pour les thèses) et des archives ouvertes (Prodinra et HAL).

scanR-sources

Ces différentes sources alimentent les pages d’informations sur les structures de recherche. Les utilisateurs peuvent y contribuer directement en signalant des erreurs ou en proposant des enrichissements (crowdsourcing).

ScanR permet en particulier

  • d’identifier des partenaires potentiels sur un projet de recherche
  • de connaître les publications d’un laboratoire ou les brevets d’une entreprise
  • de visualiser  les relations entre les différentes entités
  • ou de visualiser les caractéristiques scientifiques d’un territoire.

L’interface permet une recherche en texte intégral qui peut être filtrée par type d’entité (public / privé), par tutelle (CNRS, INRA…..), par thématiques (listes fermées en français),  par localisation géographique et par projet.

Une recherche sur le mot “forêts” permet d’avoir d’une part la liste des structures pour lesquelles le terme apparaît dans une ou plusieurs sources (source spécifiée : Recherche trouvée dans…) :

structure-foret

Exemple de structure apparaissent en réponse à une requête

et d’autre part une vue synthétique des caractéristiques de ces structure :

scanRforets

Exemple de pages d’informations sur l’unité Écologie des Forêts Méditerranéennes  (URFM) de l’INRA

unité Écologie des Forêts Méditerranéennes - fiche de l'unité

unité Écologie des Forêts Méditerranéennes – fiche de l’unité

 Écologie des Forêts Méditerranéennes - visualisation des collaborations

Écologie des Forêts Méditerranéennes – visualisation des collaborations

Écologie des Forêts Méditerranéennes - Publications

Écologie des Forêts Méditerranéennes – Publications

Des API sont proposés pour exploiter les données de scanR, également disponibles sous licence ouverte sur le portail open data de l’enseignement supérieur et à la recherche.

Vu sur :  ADBU.fr : ScanR: le nouveau moteur de recherche du MENESR qui identifie en quelques clics les orientations et les productions de toutes les structures de recherche françaises. .  Voir aussi la  vidéo de l’annonce

accès à ScanR https://scanr.enseignementsup-recherche.gouv.fr/

 

Pour citer ce billet : Aventurier, Pascal, Cocaud, Sylvie. 2016. « ScanR : le moteur de recherche du MENESR pour identifier les structures de recherche françaises | Observatoire des technologies de l’IST ». Consulté le juillet 7 2016 . http://ist.blogs.inra.fr/technologies/2016/07/07/scanr-le-moteur-de-recherche-du-menesr-pour-identifier-les-structures-de-recherche-francaises/.

Une palette d’outils pour les chercheurs

A l’heure de la “transition numérique”, chacun peut se sentir un peu désorienté par la multiplication des outils qui fleurissent sur la toile, utilisables pour une gamme d’actions très variées touchant à la fois aux sphères personnelle et professionnelle.

En recherche, comme dans les autres secteurs, l’offre est très large, les outils nombreux et évolutifs,  souvent en interaction les uns les autres. Comment connaître, comparer et évaluer les outils disponibles ? quelles sont les grandes tendances d’utilisation ?

Des pistes de réponses sont données sur un site original développé par l’université d’Utrecht : Innovations in Scholarly Communications. Changing research workflows.

L’ambition affichée de ce site est de présenter d’une part l’offre en matière d’outils pour la recherche, de l’autre d’identifier et tracer grâce à une large enquête internationale, les usages réels de ces outils et leur impact sur le comportement et le travail des scientifiques.

Plus de 550 outils ou sites sont répertoriés et décrits. Une liste et une représentation graphique originale de cette palette d’outils sont proposées.

L’enquête  s’adresse  à tous les acteurs de la recherche (des étudiants aux chercheurs et  professeurs ) , ou d’appui à la recherche (documentalistes, éditeurs, financeurs ). Ouverte depuis mai 2015, elle restera active jusqu’en février 2016. En août 2015, plus de 4000 personnes y avaient répondu  (26% issues secteur IST, 63% de la communauté scientifique internationale). Les résultats établis sur les 1000 premières réponses sont déjà consultables en ligne. Leur lecture est intéressante et éclairante. Elle confirme comme d’autres enquêtes  l’usage grandissant des réseaux sociaux. Elle permet d’avoir une image des positions relatives par famille d’outils, de pointer certains positionnements dominants ou émergents (Google Scholar, ResearchGate, Twitter…) et celui des outils institutionnels. A terme, les responsables du projet espèrent aussi pouvoir identifier des différences de comportement dans les usages selon les disciplines, les origines géographiques …

Au delà des résultats  de l’enquête, une autre originalité est la présentation de  différents types de  “worflows” possibles qualifiés selon les outils utilisés aux différentes étapes du travail de recherche de : traditionnel, moderne, open science,  innovant, expérimental…

Le site liste enfin, par type d’activité,  les tendances,  attentes, incertitudes, opportunités ou défis sur les développements des outils et leurs usages.

Le poster ci-dessous présenté par les responsables du projet à la conférence  Force2015   (Oxford, Janvier 2015) résume l’ensemble de la démarche.

tableautendances-outils-usages

Prenez plaisir comme moi, à découvrir ce site coloré, clair et riche en informations.

Liens utiles :

Pour mémoire, d’autres sites inventorient des outils utiles en recherche

http://dirtdirectory.org/

Outils 2.0
Webographie de sites gratuits avec une interface en français

Google scholar : extension Firefox et Chrome

Google scholarL’extension Bouton Google Scholar (disponible depuis avril 2015) permet d’accéder facilement à Google Scholar pour lancer une rechercher à partir d’un texte sélectionné sur une page Web (ou dans un document pdf ouvert dans le navigateur). La requête affiche les trois meilleurs résultats dans Scholar, un bouton “Plein écran” permettant de basculer dans Google scholar pour afficher tous les résultats.

Un exemple à partir d’une partie d’un titre d’ouvrage dans un catalogue de bibliothèque :

google-scholar_testChaque référence peut être mise ne forme suivant des normes de citation APA, ISO690 ou MLA (bouton  ) et collée dans le presse papier.

Agris : nouvelle fonctionnalité de recherche multilingue

AGRIS offre depuis janvier la possibilité de faire une recherche dans sa langue maternelle. Cette nouvelle fonctionnalité proposée dans la page des résultats permet d’élargir la recherche.
Exemple : une recherche du terme “avoine” (agris.fao.org/agris-search/searchIndex.do?query=avoine) qui donne 3856 réponses en première instance en donnera 16 479 si l’on coche l’option Multilingual Search.

agris-multilingue

Vu sur : AIMS Newsletter no. 37, February 2015

 

Publications de l’USDA : nouvelle interface de recherche

USDA logoPubAg est une nouvelle interface de recherche, proposée par la National Agricultural Library (NAL), donnant accès aux publications scientifiques du Département américain de l’Agriculture (USDA). Plus de 40 000 articles sont déjà en ligne, les plus anciens datant de 1960. On retrouve un affinage classique par facettes parmi lesquelles l’accès libre au texte intégral (liens vers l’éditeur dans les autres cas). L’indexation utilise le thésaurus de la NAL NAL Thesaurus (NALT).

Vu sur : AIMS Newsletter no. 37, February 2015

Comparatif de 9 “discovery tools”

Dans le numéro d’octobre, Archimag propose un tableau comparatif des “outils de découverte” (discovery tools) qui permettent d’accéder à l’ensemble des fonds documentaires, locaux ou distants, d’un établissement (quels que soient leur support, leur mode et leur lieu de stockage). Ces outils se caractérisent par une simplicité d’usage pour l’utilisateur, doublée d’une possibilité de recherche complexe valorisant au mieux les ressources. Ils s’appuient sur un index central, immense base de métadonnées fournie par le producteur du logiciel et interrogée par le moteur de recherche lorsqu’un usager saisit une requête.

Parmi les outils comparés par Archimag figurent des outils Open Source :

AFI-OPAC1     invenio     vf-beta

Pour aller plus loin, on pourra lire l’étude de l’UKSG sur l’impact des Resource Discovery
Services (RDS) en bibliothèque :

Vu sur : Bibliothèque : découvrir son discovery tool. Archimag. 2014 (278)29-32.

Un nouveau moteur de recherche qui ne collecte pas vos données personnelles

swiwwcows1Source : “NetPublic » . Swisscows : Moteur de Recherche Qui Ne Collecte Pas Les Données Personnelles.” Accessed October 30, 2014. http://www.netpublic.fr/2014/10/swisscows-moteur-de-recherche-qui-ne-collecte-pas-les-donnees-personnelles/.

Netpublic.fr a publié un billet sur un nouveau moteur de recherche Swisscows.  lancé en Suisse en juin 2014 par Hulbee SA/. Ce moteur,  comme DuckDuckGo ne collecte aucune données personnelles. Il cite une analyse sur le blog de François Charlet  : Swisscows, un moteur de recherche 100% suisse qui ne collecte aucune donnée.

Le billet met en avant la recherche d’image “. L’internaute a la possibilité d’affiner ses résultats dans la partie supérieure et de recherche selon des critères spécifiques : aspect, taille, couleur, style, visage. Les images sont affichées en miniatures ou vignettes sur la page.”

La société Swisscows.ch affiche la garantie sur sécurité des données garantie, l’utilisation de technologies  innovantes et la reconnaissance sémantique des informations qui rendent la recherche plus intuitive.

Cependant la démarche commerciale est très présente, et d’ailleurs clairement expliquée sur le site. Sur l’image ci-dessous montrant une recherche avec le mot “agroforestry.” On voit apparaître un bouton shopping et une publicité intégrée à gauche dans les mots permettant d’affiner la requête. François Charlet rappelle que les sites publicitaires auxquels vous accédez à partir de Swisscows n’ont pas, eux, de politique de non collecte des données.

swiwwcows2

A suivre donc pour une évaluation comparative des performances de recherche de ce moteur. Il est quand même intéressant de constater que la non collecte des données personnelles devient un argument marketing.

Paperity, nouvel agrégateur d’articles en OA

paperity1

Test très rapide de ce  tout nouvel agrégateur dont l’objectif affiché est de mettre à disposition de façon exhaustive les articles Peer Review publiés en Open Access.

L’interface de recherche est simplissime : une seule fenêtre de recherche à la Google et surtout  ni aide, ni module de recherche avancée visibles ?

Questionné, le site-support,  par la voix de Marcin Wojnarski (fondateur du site) confirme la volonté de démarrer avec un mode search très simple et demande un peu de patience… Il précise que la syntaxe courante utilisée sur la plupart des moteurs de recherche est utilisable sur Paperity et que des spécifications détaillées seront bientôt publiées.

En attendant de plus amples explications, quelques retours sur des essais très rapides :

  • Outre son objectif affiché d’exhaustivité, l’originalité du site tient en l’agrégation (c’est le mot employé)  entre la référence et le texte intégral (pdf). A  la différence de sites proches comme Pubmed Central ou le DOAJ qui exposent les métadonnées des articles mais redirigent vers des sites externes pour l’accès au texte intégral Paperity s’adapterait à toutes les technologies utilisées par les périodiques pour afficher directement les contenus des articles… Effectivement, la lecture des pdf qui se chargent dans une fenêtre sous chaque référence examinée est agréable et assez rapide (mais cela varie selon la source).
  • On a sous la main les commandes habituelles que l’on trouve dans les lecteurs intégrés et en plus, la possibilité de twitter pour partager un document …
  • J’ai également noté quelques  similitudes avec Mendeley : une commande de copie au format txt du contenu des pdf est disponible (cette fonction a été aussi annoncée dans Mendeley – nouvel onglet “enrichments” visible pour certains articles en OA mais rarement (ou plus)  active à ma connaissance) et le système ramène automatiquement à gauche dans une fenêtre “see also” des articles connexes (la fonction “Related Documents” de Mendeley fait la même chose, mais l’algorithme ne me semble pas ramener les mêmes documents).

Pour la syntaxe de recherche, il semble que :

    • les guillemets sont reconnus pour encadrer une expression littérale,
    • le signe + peut être utilisé pour obtenir une combinaison, l’espace pour le OR implicite …
    • les parenthèses permettent d’isoler des groupes de termes …

mais les requêtes sont difficiles à écrire sans règles explicites, ni surtout la possibilité de rechercher ou limiter sur des champs d’interrogation spécifiques. Enfin, à partir de la liste des résultats à une requête d’interrogation, aucune fonction d’export n’est actuellement proposée.

Voilà quelques impressions à chaud sur ce nouvel outil, à suivre…

paperity2

Les nouveautés de l’archive ouverte HAL v3

Ce billet reprend 2 billets du blog du CCSD http://blog.ccsd.cnrs.fr. Les nouveautés de HAL V3 du 27 juin 2014 et Les API dans HAL v3 du 15 novembre 2013.

Dans les Nouveautés de HAL V3. Le billet décrit la présentation qui a eu lieu dans trois URFIST différents sur les nouveautés de la version 3 de HAL. Au niveau technique sont présentés l’authentification  centralisée, les licences dans HAL et Créative Commons, le moteur  de recherche SOLR et  les API de  recherche (interrogation base et référentiels).

Voir le diaporama Halv3 presentation_ juin_2014 from OAccsd.

Le second billet, Les API dans HAL v3 , détaille, avant la sortie de HAL V3,  les API  disponibles en SWORD (Simple Web-service Offering Repository Deposit). SWORD est un standard d’échanges international fondé par le JISC (Joint Information Systems Committee) pour les imports.

Capturesword

Extracteur de métadonnées :  la V3 de HAL intégrera le même extracteur de métadonnées open source (https://github.com/kermitt2/grobid) que ResearchGate.

Pré-remplissage de méta-données : Lors du dépôt de l’article, des méta-données préremplies et consolidées avec Crossref quand c’est possible, seront proposés.

Moteur de recherche :  Les API s’appuyant sur les fonctionnalités du moteur de recherche Solr seront plus puissantes et permettront d’interroger plus finement les documents déposés et  les référentiels.

Quelques moteurs de questions/réponses à la loupe

Même si la plupart des moteurs de Questions/Réponses ouverts au début des années 2000 ont fermé, une nouvelle génération de moteurs rencontre un certain succès.

Carole Tisserand-Barthole de Bases Publications nous présente cette deuxième génération de moteurs de Questions/Réponses, nous parle de l’intérêt d’utiliser ce type de moteurs et  fait un focus sur 4 d’entre eux : 

quora.comchacha.com, le français gozil.com et l’ancestral Yahoo! Answers.

Lire le billet sur Bases publications…