Nom de code : Bu-Google (1/5)

08 Jun
closeUne année au moins est passée depuis la publication de ce billet qui peut donc contenir des informations un peu datées.

(Merci de votre indulgence :
je vais parler d’un prototype qui n’est pas encore en production)

Comme vous le savez, les moissonneurs de Google ne voient pas l’intérieur de nos catalogues. On s’est donc dit qu’il fallait les aider. Une image valant mieux qu’un long discours, je vous propose d’aller jeter un oeil à cet endroit, de faire une recherche sur “bibliothèque” par exemple (j’expliquerai pourquoi), puis de revenir ici pour que je vous explique de quoi il retourne, comment ça marche, ce qui ne marche pas encore, ce que l’on veut faire de cela, etc. Allez, j’attends votre retour et, pour les fainéants du clic, je colle ci-dessous une copie de ce que les autres sont en train de voir :

BUA Google

OK, vous avez vu ? Qu’est-ce qui se passe ? Simple :

  • nous exportons nos notices catalogue vers Google ;
  • nous  créons une page customisée d’interrogation et de réponse sur laquelle…
  • … nous ventilons les réponses avec, à gauche, les réponses web standards , à droite, des onglets dont le premier ne renvoie que des réponses de notre catalogue ; et les suivants, des réponses issues de sources choisies par nos soins (ici, le blog de la Bu et le site web de l’Université)

Demain, je commence à vous détailler la manière dont on obtiens ça, les problèmes que ça pose, le pourquoi du comment..

Tags : , , ,

18 réponses

  1. LullyNo Gravatar says:

    J’attends la suite avec impatience !
    Tu penseras bien à expliquer comment tu fais pour que Google affiche les titres des ouvrages comme si c’était les titres des pages web, alors que chaque notice de votre Opac a — comme beaucoup d’autres Opac — le même titre “BU Angers — Affichage détaillé”.

  2. RMNo Gravatar says:

    Intéressant. En plus, vous profitez du coup de la correction automatique de Google.

    C’est Darnton qui va être content ;-)

    Seulement, faites gaffe à ce que votre catalogue soit impeccable si vous lui donnez plus de visibilité grâce à Google. Nous avons eu un cas intéressant quand nous avons nous aussi googlo-ouvert notre catalogue il y a qq mois.

    Un Monsieur avait soutenu sa thèse sous un pseudonyme (oui, cela m’a surpris mais il semblerait que ce soit légal). Il avait depuis fait une belle carrière à la fois comme professeur et dans une grande organisation syndicale. Mais, pas toujours d’accord avec les orientations de ce syndicat – bien qu’appartenant à son comité directeur – il écrivait parfois des billets dans des journaux (pas tjs gentils) avec le pseudo utilisé pour sa thèse.

    Malheur n°1 : son directeur avait mis un post-it avec son véritable nom sur ladite thèse. Malheur n°2 : le bibliothécaire de l’époque, très pro, a reporté l’ensemble des informations, créant le seul lien entre vrai nom et pseudo. Malheur n°3 : tout a donc été balancé sur Google il y a qq mois et ça sort *très* bien.

    Panique du Monsieur, recherche d’une solution, effacement dans le catalogue… et solution définitive tjs pas trouvée car les bots de Google ne semblent pas repasser très souvent…

  3. Lionel DujolNo Gravatar says:

    Purée vivement la suite !!!!!!

  4. LullyNo Gravatar says:

    @RM : à Jussieu, il y avait eu un problème encore plus amusant. Une chercheuse française ayant soutenu sa thèse à Paris VI et partie ensuite aux Etats-Unis s’est indignée de retrouver sa date de naissance (information relevant de sa vie privée !) dans notre catalogue.
    Puisqu’elle n’avait pas d’homonyme, nous l’avons effacée !

    Je n’aime pas trop ta phrase (pardon !) : “faites gaffe à ce que votre catalogue soit impeccable si vous lui donnez plus de visibilité grâce à Google”
    Elle me rappelle les craintes des enseignants-chercheurs quand on leur parle de thèses en ligne, et qu’ils s’épouvantent ainsi : “Mais vous ne vous rendez pas compte ! Tout le monde va voir que nous accordons le titre de docteur à des thèses exécrables !”
    L’argument est détestable. Dans le cas d’un catalogue pourri, ma foi, c’est aussi un argument pour demander plus de moyens :-) !

  5. La démarche de dissémination est toujours un plus et mérite d’être louée, mais…quel intérêt à poser son catalogue dans Google à partir du moment où il est possible d’avoir son catalogue en barre de recherche? Je sais que l’argument marche dans les deux sens, mais je me dis que comme personne ne recherche (enfin j’espère !!!) des bouquins de sa BU directement dans Google, ça ne risque pas de donner de très mauvaises habitudes à des usagers qui en sont déjà pétri? :s

  6. StéphanieNo Gravatar says:

    Comment tu comptes le proposer aux étudiants ? indiquer l’url dans ta boîte à outils, ok, “remplacer” le Google traditionnel par le Bu-Google sur tes postes publics ?

  7. JC BrochardNo Gravatar says:

    Super et impressionnant !
    Tout à fait dans l’esprit de ce que j’évoquais dans mon dernier billet (http://bibliothequepublic.blogspot.com/2009/05/twitti-et-grosternet-zai-cru-voir-une.html) il me semble, mais là c’est une réalisation concrète.
    Entièrement d’accord aussi avec l’esprit de ta réponse à Shaunlemouton. Ce qui compte là, c’est qu’il n’y rien à installer, on ne cherche pas à modifier les habitudes des usagers, on leur indique juste une URL et on leur propose toute l’offre Bibliothèque en regard des résultats de recherche Web qu’ils ont d’habitude.
    J’avais tenté -sans succès – un truc du même genre, mais beaucoup plus rudimentaire il y a deux ans : exporter le contenu du catalogue en texte seul sur une page HTML toute simple avec juste une redirection vers le catalogue, en espérant que Google indexerait la page et renverrait les usagers chez nous. Mais mon truc devait être tellement mal fait que même les robots de Google étaient redirigés !

  8. TimotheeNo Gravatar says:

    Et bien, ça a l’air de marcher au poil :-) merci de m’avoir prévenu! je vais montrer ça à mes camarades nippons (petits patapons) tiens.

  9. LullyNo Gravatar says:

    Pour revenir à la remarque de jsicot, longtemps après : il y a désormais 3 résultats à la requête Linux sur le catalogue “BU-Google” (bon, il y en a 202 dans l’opac).
    Au passage, je note un truc pénible : l’URL ne change pas avec les mots recherchés, donc on ne peut pas pointer vers une liste de résultats.

    Dommage !

  10. dbourrionNo Gravatar says:

    @RM moralité : Google est aussi notre conscience…

  11. dbourrionNo Gravatar says:

    @shaunlemouton :

    1. mettre son catalogue en barre de recherche = une opération volontaire de l’usager ; là, il n’a rien à faire, nous sommes là… L’usager n’a pas à travailler pour trouver notre offre, c’est à nous de la pousser vers lui et c’est très exactement la logique qui est derrière Bu-Google. Cela dit, on peut faire les deux (i.e. proposer plusieurs services et chemins d’accès, l’usager fera comme il voudra) ;

    2. Je ne vois pas en quoi, pour un usager, chercher les bouquins de sa Bu dans Google (ou un autre moteur) est une mauvaise habitude. Pour moi, la mauvaise habitude, c’est de penser ça :-) et/ou de vouloir à tout prix que nos usagers entrent dans nos cadres de bibliothécaires… Après tout, nos usagers et nous-même cherchons tout dans les moteurs de recherche, alors pourquoi pas les livres de la Bu ?

  12. LullyNo Gravatar says:

    @shaunlemouton : un complément de réponse : depuis les postes de la BU, un étudiant cherchera sur Google non pas “des livres”, mais “de l’information”.
    Si le réseau est configuré de manière à rediriger les requêtes Google vers cette URL BU-Google, il trouvera à la fois de l’information, et il découvrira aussi que le catalogue contient de l’information.

  13. dbourrionNo Gravatar says:

    @Stéphanie : wait & see (les détails arrivent)

  14. dbourrionNo Gravatar says:

    @Jsicot : bien vu pour Linux : j’explique dans la semaine.

  15. RMNo Gravatar says:

    Oui, tu as raison. Mais on a beau avoir toutes les excuses du monde (y compris être arrivé seulement qq mois plus tôt et n’avoir rien à voir avec ce catalogue), c’est tout de même nous qui passons pour un branquignol quand il y a un problème…

  16. jsicotNo Gravatar says:

    Très joli ! J’imagine toutes les possibilités qui sont offertes par un tel système :
    - une recherche sur votre portail qui interroge à la fois vos sites, celui de l’université et votre catalogue,
    - un plugin de recherche Firefox,
    - des scripts greasemonkey pour faire remonter/ou mettre en évidence les résultats du catalogue dans Google,
    - une meilleure visibilité du fonds de la bibliothèque (+ utilisation du service google “outils pour les webmasters”).
    - etc. (les milliers de codes disponibles sur Google AJAX Search API laissent rêveurs…)

    Ce système est un véritable “cheval de Troie” pour conduire vos usagers à trouver/et utiliser des ressources sur le catalogue. Dommage que tous les catalogues ne permettent pas ça (pas de permalien sur les notices, authentification CAS qui casse les URLs, impossibilité d’effectuer des requêtes distantes, frames (et oui ça existe encore !), etc.)

    Par contre, toutes les notices de votre catalogue ne sont pas encore indexées par Google ? (Je n’ai rien trouvé avec “linux”)

    J’attends la suite avec impatience !!
    MERCI

  17. dbourrionNo Gravatar says:

    Là, franchement c’est très simple – détails demain matin.

  18. dbourrionNo Gravatar says:

    @Lully : en fait, l’onglet Bu ne pointe plus vers /OPD01 mais vers un moteur personnalisé Google qui pointe vers /OPD01 : manifestement, ce dernier est mieux indexé/plus dynamique/efficace (je ne sais pas).
    Et je prends bonne note de ta remarque vers la liste de résultats, au cas où.

Répondre

Face Ecran

Le 'nouveau' blog du taiseux bavard

Get Adobe Flash playerPlugin by wpburn.com wordpress themes