• Cours 9 - Moteurs de recherche et méta-moteurs de sites web

    Qu'est-ce qu'un moteur de recherche plus généralement ? Et quels sont ses objectifs ?

    "Un moteur de recherche ou « search engine » en anglais, est un outil permettant de retrouver plus facilement une page web parmi le très grand nombre de sites qui peuplent la toile. D’incommensurables quantités d’informations sont mises en ligne et renouvelées chaque jour, et les moteurs de recherche sont là pour que les internautes, grâce à une barre de recherche dans laquelle ces derniers vont insérer un ou plusieurs mots-clés, puissent trouver la réponse à leur requête le plus rapidement et précisément possible." (source : seo.fr)

    Quel est son fonctionnement ?

    - Le moteur de recherche va parcourir automatiquement les pages qui sont en accès public, on appelle cela le crawling.
    - Il indexe les pages, il extrait les mots clés de chacune de pages, et va en conserver une copie, on appelle cela le cache.
    - Enfin, il va classer les pages selon leur pertinence par rapport à un mot clé : on appelle cela le "page ranking". (source : CNIL)


    • Le SEO

    Le SEO (Search Engine Optimization) signifie en français "Optimisation pour les moteurs de recherche." Il est associé aux techniques mises en place pour améliorer la position d'un site web sur les pages de résultats des moteurs de recherches, appelé aussi "référencement naturel". Chaque moteur de recherches ayant ses propres règles pour classer les pages, la visibilité d'une page (le "page ranking") dépend  par exemple du nombre d'internautes cliquant sur le lien, et de nombre de pages pointant vers cette page. (source : CNIL)

    C'est donc un outil très utile dans le secteur des entreprises et du marketing, aujourd'hui.

    Archie, l'ancêtre des moteurs de recherche

    Avant que le web n'ouvre ses portes à ses moteurs de recherche plus élaborés, Archie crée en 1987 était considéré comme le premier moteur de recherche internet, il indexait le contenu proposé par les différents sites FTP permettant de retrouver rapidement un fichier donné. (source : abondance)

    Les différents types de moteurs de recherche

    Aujourd'hui, 90 % des utilisateurs web du monde entier utilisent Google comme moteur de recherche. 
    Il existe pourtant une multitude d'autres moteurs de recherches apparaissant plus respectueux de la vie privée, plus anciens ou encore écologiques.
     

    • Les moteurs multilingues

    Les autres moteurs de recherche multilingues présents dans le monde entier, sont Bing, crée par Microsoft en 2009 représentant le deuxième moteur de recherche le plus utilisé au monde, Yahoo! crée en 1994 et donc un des plus anciens, et Yandex, basé en Russie.

    • Moteurs territoriaux et nationaux

    Il existent des moteurs territoriaux et nationaux, mais qui regroupent des informations souvent anciennes comme Search Engine Colossus.

    - Moteurs francophones 

    Qwant, existant depuis 2013, se caractérise par son refus de tracer ses utilisateurs ou de vendre leurs données personnelles pour garantir la vie privée. Cependant, il connaît des dysfonctionnements, et a peu de fonctionnalités avancées, le nombre de réponses et l'index sont encore limité.

    Exalead, crée en 2000, est un moteur ciblant d'avantage les professionnels. Pour le grand public, les résultats ne sont pas les plus aboutis. 

    - Moteurs locaux, qui n'agissent que localement, dans un pays.

    Baidu : le moteur de recherche le plus utilisé en Chine. Effectivement, le moteur de recherche Google est bloqué dans ce pays.

    Yandex :
    en Russie il est le second moteur de recherche le plus utilisé, et est donc aussi populaire que Google. 

    (source : solidarité-numérique)

    Les moteurs de recherche généralistes

    • Qu'est-ce qu'un moteur de recherche généraliste ? 

    "Un moteur de recherche généraliste permet à l’internaute de chercher des informations dans tous les domaines, grâce à des requêtes par mots clés. " (source : kompass)

    Ils sont intéressant dans la recherches d'informations ponctuelles, mais il est plus compliqué de trouver des informations plus complexes et ciblés comme des synthèses, des comparatifs... D'où la nécessité d'utiliser les fonctionnalités avancées des moteurs, de réorienter la recherche...


    Les moteurs de recherche scientifiques

    • Qu'est-ce qu'un moteur de recherche scientifique ?

    "Un moteur de recherche spécialisé (également appelé moteur de recherche vertical) procède selon un mode opératoire identique, sinon qu’il limite ses recherches" (source : kompass)

    Il existe en effet de nombreux moteurs de recherche scientifiques, très utiles notamment pour les étudiants car ils regorgent de nombreuses ressources documentaires.Ils restent cependant peu connus.

    Google Scholar

    Certaines fonctions des moteurs généralistes peuvent concurrencer directement les moteurs spécialisés en matière de recherche par types de documents. C'est le cas de Google Scholar qui permet aux universitaires de faire des recherches sur des articles scientifiques. Il base sa recherche sur les thèses, des références bibliographiques à caractère académique, des livres scientifiques ou encore des citations.

    Semantic Scholar
    C'est un moteur de recherche gratuit et à but non lucratif mis sur le marché pour le monde universitaire, indexant les documents scientifiques libres accès.

    Mais également Dimensions et Scinapse

    Les moteurs de recherches pour la biologie, la chimie et la médecine, la science comme.
    BioTech Search pour la biologie, et Profusion Chimie ou PubChem pour les chimistes.

    Autres notions

    • Qu'est-ce qu'un opérateur booléen ?

    "Les opérateurs booléens servent à relier les idées / concepts / mots-clés utilisés lors de la
    recherche afin de trouver les résultats les plus pertinents que possible." (source : bibliothèque champlain)

    Ils peuvent être exprimés sous forme de symboles ou de mots, les plus utilisés sont :

    - OR / OU :
    Mot-clé A, ou mot-clé B, ou les deux
    (A&B) sont présents dans les documents repêchés

    = augmente le nombre de résultats


    -
    AND / ET :
    Mot-clé A et mot-clé B doivent tous les
    deux être présents dans les documents repêchés

    = réduit le nombre de résultats


    - NOT / SAUF : Mot-clé A est présent dans les docu-
    ments mais mot-clé B est exclu

    = réduit le nombre de résultats


    - Utilisation des guillemets : elle est utile quand y a plusieurs mots dans la notion que l'on cherche. Ainsi le moteur cherchera l'expression exacte, et ne séparera pas les mots dans la recherche.

    • Les métamoteurs

    "Le préfixe "méta" est d'origine grec. Il évoque une notion d'élévation et de niveau supérieur" (source : 1min30). Il est donc situé au dessus des autres moteurs en terme de hiérarchie. C'est donc un logiciel qui puise ses informations sur plusieurs moteurs de recherches différents, et retourne les résultats de chacun d'eux.

    Exemples de métamoteurs : Dogpile, Webcrawler, Metacrawler

    Les inconvénients : Ils ne possèdent pas leur index propre et se retrouvent dépendent par les informations fournis des autres moteurs. Ils ne remontent que les premiers contenus enlevant de la visibilité aux sites moins connus. Il doit avoir recours à plusieurs infrastructures (celle du méta moteur lui-même et celles des autres moteurs qu'il interroge).

    Mais alors, quels sont ses avantages ?

    Cela peut faire gagner du temps à l'utilisateur qui n'a alors besoin que d'une seule recherche pour avoir des données de plusieurs moteurs de recherches.

    • Moteur de clustering, Carrot2

    Carrot² est un moteur de clustering (regroupement) de résultats de recherche open source. Il peut regrouper automatiquement de petites collections de documents.


  • Commentaires

    Aucun commentaire pour le moment

    Suivre le flux RSS des commentaires


    Ajouter un commentaire

    Nom / Pseudo :

    E-mail (facultatif) :

    Site Web (facultatif) :

    Commentaire :