Un moteur de recherche est un logiciel permettant de retrouver des
ressources (pages Web, forums Usenet, images, vidéo, etc.) associées
à des mots quelconques. Certains sites Web offrent un moteur de
recherche comme principale fonctionnalité ; on appelle alors moteur
de recherche le site lui-même.
Le fonctionnement d'un moteur de recherche se décompose en trois
étapes principales.
Le Web est systématiquement exploré par un robot d'indexation
suivant récursivement tous les hyperliens qu'il trouve et récupérant
les ressources jugées intéressantes. L'exploration est lancée depuis
une ressource pivot, comme une page d'annuaire Web.
L'indexation des ressources récupérées consiste à extraire les mots
considérés comme significatifs (pratiquement tous) correspondant à
chaque ressource. Les mots extraits sont enregistrés dans une base
de données organisée comme un gigantesque dictionnaire inverse. La
partie requêtes du moteur de recherche peut ainsi rapidement
retrouver les correspondances. Un algorithme gardé secret est
généralement appliqué pour donner un poids variable aux
correspondances, afin de pouvoir présenter les résultats des
recherches par ordre de pertinence supposé. L'algorithme tient
généralement compte du contexte du mot clé (titre, paragraphe,
hyperlien...) et de la ressource (ressources liées, popularité du
site...)
La ressource indexée peut ensuite être retournée dans les résultats
d'une recherche d'un visiteur contenant un mot clé correspondant.
Source wikipedia