Archives par étiquette : pdf

3 outils pour insérer des commentaires sur un PDF en ligne

crédit Azursol https://www.iconfinder.com/icons/38899/pdf_icon#size=128

Le site outils Tice s’intéresse aux outils numériques pour l’enseignement. Ce billet présente 3 logiciels pour l’annotation de PDF en ligne de manière collaborative ou non avec des possibilités de publication du PDF et des annotations sur un site web ou un blog pour Crocodoc.

Les 3 outils décrits sont Crocodoc, Marqueed et Google Drive

source : 3 outils pour inserer des commentaires sur un PDF – Les Outils Tice. 10 septembre 2013.

voir aussi :
20 Free Tools to Annotate PDF Documents

Utopia Documents : un lecteur de fichier PDF optimisé pour les publications scientifiques

Utopia Documents explore le contenu d’un article au format PDF en s’appuyant sur des ressources externes et sur les enrichissements présents dans le document lorsqu’ils existent.

Il permet ainsi d’afficher directement dans l’interface de visualisation du pdf :

  • la référence correspondante sous différents formats (via CrossRef),
  • l’impact de l’article dans les réseaux sociaux (via Altmetric),
  • les articles en relation (via Mendeley),
  • la politique de dépôt de la revue (via Sherpa/RoMEO),
  • des données en relation avec l’article (via Dryad),
  • des informations sur les molécules, les gènes, les espèces… ou les matériels de laboratoire utilisés (via SciBite, Protein DataBank, dbpedia, AQnowledge,…)

Les enrichissements apportés par les éditeurs sont exploités (exemple des articles enrichis de Portland Press’ Biochemichal Journal ou de la Royal Society of Chemistry : affichage et rotation d’une molécule en 3D, export ou présentation sous une autre forme des données d’un tableau…).

Cette analyse est réalisée automatiquement à l’ouverture du document.

L’image ci-dessous montre la publication « Towards a worldwide wood economics spectrum » juste après son chargement dans Utopia Documents. A droite apparaissent les informations en relation avec cette publication.

la publication "Towards a worldwide wood economics spectrum" juste après son chargement dans Utopia Documents

Cette première analyse peut être complétée par l’exploration des ressources externes à partir d’un terme ou d’une phrase sélectionnés par l’utilisateur (fonction « Explore » disponible via un menu en info-bulle) ou saisis dans une boite de recherche.

Exemple ci-dessous avec terme « Populus » :

la fonction "Explore" sur le terme "Populus"

Le résultat de l’exploration est affiché dans le partie droite de l’écran :

résultat de l'exploration du terme "populus"

Un terme sélectionné par l’utilisateur peut également faire l’objet d’une recherche sur des sites externes (clic droit puis « Lookup selected text ») : NCBI, Quertle, Google, Wikipedia, Dictionary.com et Thesaurus.com.

Tout document peut être annoté (clic droit puis « Annotate document ») au moyen de différents annotateurs : GPCRDB (information system for G protein-coupled receptors), NuclearDB (information system for Nuclear Receptors) et Reflect (Reflect highlights protein and small molecule names).

Exemple d’information obtenue sur la protéine « PgC » après une annotation par Reflect :

Exemple d'information obtenue sur la protéine "PgC" après une annotation par Reflect

Les informations affichées par Utopia documents sont obtenues via des web-services, des accès à des bases de données ou à des entrepôts RDF (Bio2RDF et DBPedia en particulier).

Les utilisateurs peuvent commenter des parties du document et partager ces commentaires.

Utopia Documents est publié par Lost Island Labs Ltd (LIL) en association avec Academic Concept Knowledge Ltd (AQnowledge) ; il est gratuit et disponible pour Mac, Windows et Linux à http://utopiadocs.com.

Pourquoi les métadonnées des PDF éditeurs sont elles si pauvres ?

C’est la traduction du titre d’un billet sur le blog de Ross Mounce.

Les métadonnées embarquées (embedded metadata) incluses dans les documents sont un eldorado pour les systèmes ou utilisateurs  ayant à gérer ce type de données. On peut les récupérer automatiquement avec des outils comme Endnote, Medeley ou Zotero pour les utilisateurs finaux ou par d’autres applications pour les dépôts dans les archives ouvertes les différents catalogues bibliographiques, les moteurs de recherche, les réseaux sociaux….

Récupérer les métadonnées produites dès la création du document  permet de disposer de données fiables et de bonne qualité si le document est une publication scientifique et que l’éditeur  scientifique prend soin de produire ces données correctement. Le format des données embarquées dans le PDF est  XMP (Adobe’s Extensible Metadata Platform) qui s’appuie sur le Dublin Core et qui est devenue une norme ISO en 2012.

L’auteur propose une analyse des métadonnées de quelques publications.

L’échantillon a porté sur des articles de 21 éditeurs, publiés pour la plupart en 2011,  dont : AAAS (Science), Wiley-Blackwell,  BMJ, Cambridge Journals Online, CSIRO, Elsevier,  Hindawi, National Academy of Sciences (PNAS), NPG, NRC Research Press, PLOS, Royal Society, SAGE, Springer-Verlag, Taylor & Francis …

11 métadonnées différentes ont été analysées dont :  Creator, Title, Subject, Author, Pages, Keywords.

Les résultats ne sont pas très satisfaisants. Sur 70 articles en pdf analysés, seulement 8 possèdent des métadonnées complètes sur la publication et 50 %  le nom des auteurs. Les résultats complets de l’enquête sont disponibles sur figshare.

Il semble cependant que les résultats pourraient être meilleurs si l’outil utilisé pour lire les pdf avait été différent. L’auteur a utilisé PDFinfo, mais on lui conseille d’utiliser un autre outil Exiftool.

La question reste cependant posée : pourquoi si peu de métadonnées embarquées dans les articles scientifiques en PDF ? que l’on peut aussi formuler autrement :  « quelles sont les avantages des éditeurs à mettre à disposition ces métadonnées ? » (voir le commentaire de Rod Page sur le billet cité).

 

source :

Pour en savoir plus :