Moteur de recherche

Un moteur de recherche (Search Engine) est un outil, un logiciel qui parcoure le web et indexe automatiquement le contenu qu’il visite. Il permet d’accéder à différentes ressources comme des pages web, des images, de la musique, des vidéos, … Lorsque l’internaute effectue une recherche, le moteur lui retourne une liste de résultats classés selon leur pertinence avec cette requête, interrogation.

Sur internet, un moteur de recherche réalise :

  1. Exploration du web par ses robots (spider, crawler)
  2. Indexation de contenus web
  3. Recherche dans son index

Exploration du web par un robot

Les moteurs de recherche utilisent des robots d’indexation, aussi appelés web spiders ou web crawlers, qui suivent les liens qu’ils trouvent sur le web. Durant leur parcours, certaines ressources seront indexées et d’autres seront rejetées ou mise en retrait de l’index. Une non-indexation peut résulter notamment de :

  • Refus explicite de se faire indexer sur internet par un robot
  • Notion de ‘contenu dupliqué’
  • Tentative de spamdexing (référencement par des méthodes interdites pas les moteurs)

Indexation de contenus internet par un moteur de recherche

Le contenu de chaque page web parcourue est analysé pour déterminer comment l’indexer. Les informations recueillies, des mots clés, sont alors conservées dans une base de données. Les moteurs de recherche comme Google mémorisent toute une page web ou seulement une partie alors que d’autres enregistrent systématiquement leur entièreté.

Lors de l’indexation d’une page internet, l’outil donne une valeur à chaque terme significatif. Cette valeur, ce poids, dépend de l’importance relative de ce mot clé dans le document (utilisation dans le titre, mise en évidence, fréquence d’utilisation, …).

Recherche dans l'index d'un moteur

L’internaute interroge un moteur de recherche au moyen d’une requête. Cette requête correspond à une suite de mots clés. Le moteur explore alors son index et retourne une série ordonnée de ressources se rapportant à cette recherche. Ces résultats sont généralement composés d’un titre et d’une description issue de la balise méta description ou du contenu visible sur le site internet.

Moteur de recherche sémantique

L’analyse sémantique utilise l’occurrence de termes similaires dans la recherche de résultats. Cette évolution vise à améliorer les résultats présentés par un moteur de recherche en se focalisant sur le sens d’une requête et non strictement sur l’expression recherchée. Le mot ‘voyage’ est ainsi automatiquement associé à des termes sémantiquement proches comme ‘vacances’.

Annuaire

Les annuaires (directory) sont souvent assimilés, à tord, aux moteurs de recherche. Au contraire des moteurs, ils sont créés manuellement. Ce sont des personnes, et non des robots, qui parcourent internet et référencient dans leur annuaire des sites jugés pertinents pour leur thématique.

Cet outil réalise un inventaire, généralisé ou spécialisé, qui répertorie des sites classés dans des catégories. Il existe par exemple des annuaires spécialisés sur la Belgique, les produits durables ou la photographie. Un annuaire est ainsi composé d’un nombre importants de liens hypertextes menant vers d’autres sites web ou catégories de l’annuaire.

Principaux moteurs de recherche

Google est incontestablement le moteur le plus populaire, avec plus de 90% des parts de marché en Belgique. Google ne dispose cependant pas de cette importance dans toutes les régions du monde. D’autres grands outils de recherche : Yahoo, Bing (Microsoft), Exalead, Baidu, Altavista, …, quelques moteurs moins connus mais apportant des résultats pertinents Veosearch, MozbotCuil, … et des metamoteurs : Zuula, Mamma, …

Derniers projets clients

Taupier professionnel pour chasser vos taupesUn taupier professionnel chasse les taupes de votre jardin dans le respect de la nature

  • Référencement externe de site internet
  • Création et diffusion de communiqués de presse, commentaires, digg-like, ...

Nos clients

Spécialiste liens commerciaux Google Adwords Signataire de la charte referencement eTIC