Agrotagger: indexation automatique de PDFs avec le thesaurus Agrovoc

Le site  Agrotagger 2.0 en version bêta (démonstration) permet de « tagger » ou d’indexer automatiquement, en anglais, vos documents en PDF ou en format Word à l’aide du thesaurus Agrovoc de la FAO. Il utilise un extracteur de terme KEA (qui semble un peu ancien). Les résultats (mots-clés) sont présentés  sous la forme de triplets RDF avec des renvois dans Agrovoc et un nuage de tags des mots clés.
http://agrovoc.mimos.my:58301/AgroTagger/

Voici une démonstration sur le PDF de l’article : Laurent Bréhélin L.; Gascuel O.; Martin O. (2008) Using repeated measurements to validate hierarchical gene clusters. Bioinformatics 24 (5): 682-688. doi : 10.1093/bioinformatics/btn017. Les mots clés trouvés sont les suivants :

Tags Agrovoc URIs
genes http://aims.fao.org/aos/agrovoc/c_27532
gene expression http://aims.fao.org/aos/agrovoc/c_27527
Bioinformatics http://aims.fao.org/aos/agrovoc/c_37958
Animal husbandry http://aims.fao.org/aos/agrovoc/c_25746
genomes http://aims.fao.org/aos/agrovoc/c_3224
Cell differentiation http://aims.fao.org/aos/agrovoc/c_2265
operations research http://aims.fao.org/aos/agrovoc/c_5364
Experimental design http://aims.fao.org/aos/agrovoc/c_29466
transcription http://aims.fao.org/aos/agrovoc/c_35127
Sampling http://aims.fao.org/aos/agrovoc/c_6774

Un autre service est développé  par la FAO dans le cadre du projet agINFRA, utilisant le Framework d’indexation Maui. Une version de test est disponible :  http://maui-indexer.appspot.com/

Le résultat sur le même article est le suivant

Input document : Vol. 24 no. 5 2008, pages 682–688 BIOINFORMATICS doi:10.1093/bioinformatics/btn017 Gene expression Using repeated measurements to validate hierarchical gene clusters.

Source : voir http://aims.fao.org/agrotagger

6 réflexions sur « Agrotagger: indexation automatique de PDFs avec le thesaurus Agrovoc »

  1. Dalb

    Merci pascal pour ce retour et ce test.

    Sur linkedin adbs justement quelqu’un a posé en avril une question sur ce type d’outils.
    Je vais étudier un peu plus précisément les résultats que tu fournis
    (sur l’INIST cela donne : Bioinformatics; Gene cluster / Gene / Repeated measurement – url = « http://www.refdoc.fr/Detailnotice?idarticle=421309 – il faut récupérer les notices, les descripteurs n’apparaissent pas sur l’écran, on se demande bien pourquoi d’ailleurs).

    Mais toi même as-tu un avis ? quelqu’un par chez vous a-t-il fait des tests et une évaluation de la qualité de ces résultats ? des tests sur du français ?

    Petite question : dis moi pourquoi mentionnes-tu « extracteur de terme KEA (qui semble un peu ancien) » ? c’est parce que utilise la v4 alors que le produit est en v5 (http://www.nzdl.org/Kea/download.html) ? mais la différence entre les deux versions ne semble pas porter sur la qualité des algorithmes. Une autre motivation à ta remarque ?
    Dalb

    Répondre
  2. Dalb

    Merci pascal pour ce retour et ce test.

    Sur linkedin adbs justement quelqu’un a posé en avril une question sur ce type d’outils.
    Je vais étudier un peu plus précisément les résultats que tu fournis
    (sur l’INIST cela donne : Bioinformatics; Gene cluster / Gene / Repeated measurement – url = « http://www.refdoc.fr/Detailnotice?idarticle=421309 – il faut récupérer les notices, les descripteurs n’apparaissent pas sur l’écran, on se demande bien pourquoi d’ailleurs).

    Mais toi même as-tu un avis ? quelqu’un par chez vous a-t-il fait des tests et une évaluation de la qualité de ces résultats ? des tests sur du français ?

    Petite question : dis moi pourquoi mentionnes-tu « extracteur de terme KEA (qui semble un peu ancien) » ? c’est parce que utilise la v4 alors que le produit est en v5 (http://www.nzdl.org/Kea/download.html) ? mais la différence entre les deux versions ne semble pas porter sur la qualité des algorithmes. Une autre motivation à ta remarque ?
    Dalb

    Répondre
  3. Pascal M. Aventurier

    Merci Sylvie de tes remarques

    Nous n’avons pas encore fait de tests de comparaison indexeur humain/ KEA
    Par contre; il y a des exemples sur le site http://www.nzdl.org/Kea/examples1.html

    Quand on signale un outil, il est important de savoir si il est toujours en évolution et si il y a un groupe d’utilisateurs/développeurs. C’est pourquoi j’avais mis un peu ancien (V4). Mais effectivement
    il y a une version 5 de janvier 2011 : http://code.google.com/p/kea-algorithm/downloads/list
    et un groupe de discussion Google
    http://groups.google.com/group/kea-and-maui-support

    Répondre
  4. Pascal M. Aventurier Auteur de l’article

    Merci Sylvie de tes remarques

    Nous n’avons pas encore fait de tests de comparaison indexeur humain/ KEA
    Par contre; il y a des exemples sur le site http://www.nzdl.org/Kea/examples1.html

    Quand on signale un outil, il est important de savoir si il est toujours en évolution et si il y a un groupe d’utilisateurs/développeurs. C’est pourquoi j’avais mis un peu ancien (V4). Mais effectivement
    il y a une version 5 de janvier 2011 : http://code.google.com/p/kea-algorithm/downloads/list
    et un groupe de discussion Google
    http://groups.google.com/group/kea-and-maui-support

    Répondre

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.