Text Cloud comme outil de recherche biblio

Posted on juillet 10, 2008

0


Les « tag clouds » et autres « Category clouds » vous connaissez. Ce sont les moyens les plus communs pour identifier les sujets les plus traités d’un blog. Maintenant pourquoi ne pas utiliser ces outils pour extraire la substance et l’essence d’un article scientifique?

Les articles contiennent toujours un abstract (ou résumé) et souvent des keywords (mot-clefs). Mais combien de fois n’avez vous pas été déçu en lisant un papier alors que l’abstract vous mettait l’eau à la bouche.

Les auteurs choisissent les mot-clefs comme étant les termes résumant le mieux le sujet de leur article. Mais les chercheurs sont aussi des êtres humains et leur auto-jugement est biaisé par leur ego. Par exemple, écrivez sur une feuille de papier, 5 mots qui vous caractérisent. Puis demandez à votre moitié de vous résumer en 5 mots. Comparez les deux feuilles…

Il y a quelques temps, j’avais vu passer un post de Brain sur Clasticdetritus sur l’utilisation de “word clouds generator » sur des articles scientifiques. Les deux générateurs les plus utilisés (mais y en a plein d’autres) sont: Wordle et Tagcrowd.

En plus de générer une liste pondérée de mot-clefs, ces outils permettent de faire passer quelques tests à l’article. Le plus célèbre de ces tests est le « suck-up test » ou test d’auto-référencement et de copinage.

Mais bon assez de blabla, on passe à l’exemple. Voici le text cloud du dernier article que j’ai publié (en co-auteur).

Les mots communs anglais ainsi que la liste des références sont ignorés mais c’est amusant de voir « et » et « al » apparaître avec autant d’importance. Le papier passe le « suck-up test » sans problème; pas de « drmouton » dans le cloud 😉 et en plus c’est choli.

Publicités