| Annuaire : site proposant une liste de sites classés par catégories. Le classement se fait dans une arborescence de catégories, sensée couvrir tout ou partie des centres d'intérêt des visiteurs. Contrairement aux moteurs de recherche : - la classification dans les annuaires est réalisée par des humains - les annuaires référencent des sites (http://www.exemple.com) et non des pages (http://www.exemple.com/exemple.html). Backlink (BL) : lien entrant vers une page d’un site. Si la page B fait un lien vers la page A, alors B est un backlink de A. Le nombre de backlinks et le PageRank™ de ces backlinks constituent un des critères utilisés par Google dans le positionnement des pages web sur les requêtes de ses visiteurs. Plus la page A comporte de backlinks au PageRank™ élevé et au thème proche du sien, plus le PageRank™ de la page A sera à son tour élevé et meilleure sera la popularité de cette page, ce qui aura une incidence positive sur le positionnement de cette dernière par Google. D’où l’importance de la mise en place d’une stratégie pertinente d’échange de liens (A et B font un lien réciproque vers chacun, occasionnant un bénéfice mutuel pour chaque partie). Balises méta : zones de code html généralement en tête de la version html de chaque page d’un site Internet, dans la partie « Head ». Elle permettent d'inclure des informations destinées aux robots lors de leur passage sur la page pour l'indexation des pages web sur les moteurs. Balises méta les plus utilisées : - Title correspond au titre de la page (environ 60 caractères), - Description correspond à la description de la page (environ 250 caractères), - Keywords correspond aux mots-clés associés à la page (5 à 6 mots-clés), - Les balises h1 à h6 (situées dans la partie « Body » de la page) permettent la hiérarchisation par niveaux d’importance des sous-titres de la page, h1 étant le niveau hiérarchique le plus important, - Robot permet d'autoriser/empêcher les robots parcourant la page d'indexer son contenu et de suivre les liens hypertextes qui s'y trouvent. Black-listage : sanction consistant en la suppression par un moteur de recherche de toutes les pages d’un site de son index. Voici quelques pratiques pouvant mener à un black-listage : - pages contenant du texte caché pour l'internaute mais visible pour le moteur de recherche (cloaking), - pages de redirection reprenant un maximum de fois les mots intéressants, - pages spécifiques pour le moteur de recherche et pour l'internaute, - pages contenant de liens vers des sites jugés douteux par les moteurs de recherche. Checksum : le checksum d'un fichier est une séquence de chiffres et de lettres définissant de manière précise (mais non unique) un fichier afin de savoir s’il a été altéré. Google utilise aussi un algorithme de checksum pour coder les échanges de données entre sa barre d'outils et ses serveurs. Cloaking : technique visant à améliorer le positionnement d’une page au sein des moteurs de recherche en fournissant à ces derniers une version différente de celle visible par les internautes. Cette pratique, considérée comme du spamdexing, peut être source de black-listage. Commandes Google : outils renvoyant diverses informations au sujet d’une URL. De la forme « commande:www.exemple.com », elles sont directement saisies dans le champs de recherche Google (sans les guillemets). Liste des commandes Google les plus utilisées : - Link renvoie la liste des backlinks de l’URL saisie. - Site renvoie la liste des pages du site saisi (ne fonctionne que dans le cadre de la saisie d’un nom de domaine. Par ex. : www.exemple.com) indexées par Google. - Info renvoie les informations de l’URL saisie si cette dernière est indexée par Google. - Related renvoie la liste des pages dont, selon Google, le thème est proche de celui de l’URL saisie. Concurrence : nombre de pages référencées par les moteurs de recherche pour un (couple de) mot(s)-clé(s). Alliée à une analyse qualitative des pages placées en première position des résultats des moteurs de recherche sur vos requêtes, elle détermine la faisabilité d’un positionnement : plus la concurrence est grande et plus le PageRank™ du "leader" est élevé, plus le positionnement est difficile. Chaque moteur affiche la concurrence associée à la requête saisie, en tête de ses pages de résultats. Chacun d’entre eux ayant sa propre manière d’indexer les pages web, la concurrence pour une même requête est variable d’un moteur à l’autre. (Couple de) mot(s)-clé(s) : (combinaison de) terme(s) saisi(es) par les internautes représentatif(ves) du contenu attendu par ces derniers dans les résultats affichés par les moteurs de recherche. Coût par clic (CPC) : voir « Positionnement publicitaire ». Crawler : voir « Robot (d’indexation) ». Deep Crawl : indexation massive du web par Googlebot au cours de laquelle il analyse en profondeur toutes les pages des sites, et répertorie en particulier tous les liens. En général, elle démarre juste après une Google Dance et sert de base à la Google Dance qui suit. Densité : répétition d’un (couple de) mot(s)-clé(s) donné par rapport au nombre total de mots présents dans une page. DMOZ.org : Nom de l'annuaire du projet ODP (Open Directory Project), le plus grand et le plus complet des répertoires du web édités par des êtres humains. Il est développé et maintenu par une vaste communauté mondiale d'éditeurs bénévoles. Google se sert de sa méthode de classification pour indexer les sites présents sur la toile. Echange de liens : voir « Backlink (BL) ». Effet Sandbox : voir « Sandbox ». Flux RSS : voir « RSS ». Fresh crawl : examen quotidien du web par GoogleBot, spécialisé sur les pages récemment publiées. Suivant divers critères, une page sera visitée à une fréquence variant entre 12 heures et 1 mois environ. Google AdSense : programme d’affiliation publicitaire de Google permettant de générer des revenus à partir des pages d’un site Internet sur lesquels Google AdSense diffuse des annonces textuelles et illustrées en rapport direct avec le contenu du site web. Google AdWords : voir « Positionnement publicitaire ». Google APIs : La Google API (Application Program Interface) est un kit de développement logiciel disponible librement, qui permet de créer de nouvelles applications utilisant directement la base de données des pages indexées par Google, par le biais d'un service web. Google bombing : technique de référencement visant à influencer le classement d'une page dans les résultats du moteur de recherche Google. Cette technique exploite une caractéristique du moteur PageRank™ qui accorde un certain poids au texte comportant un lien hypertexte vers une page. Ce poids peut varier en fonction de l'algorithme utilisé par Google. Si plusieurs sites utilisent le même texte pour pointer sur la même cible, Google additionne ce poids et il devient possible de faire apparaître la page-cible dans les résultats d'une recherche sur le texte contenu dans les liens pointant vers elle. Googlebot : nom du robot d’indexation des pages web de Google. Google dance : période durant laquelle Google met à jour les valeurs de PageRank™ et la liste des backlinks des pages indexées dans sa base. Google data centers (DC) : les data centers (centres de données) de Google sont les endroits où sont situés les serveurs du moteur de recherche. Il y en a à plusieurs endroits répartis sur la planète (pour l'instant aux Etats-Unis et en Europe). Google toolbar : barre d’outils située en haut du navigateur Internet permettant notamment la saisie de mots-clés dans le cadre d'une recherche, le blocage de fenêtres pop-ups, un surligneur de mots-clés, ou encore l’affichage du PageRank™ de la page visitée, via le checksum Google. A télécharger ici. Indexation : voir « Référencement ». Lien hypertexte : Méthode permettant de relier un mot, une expression ou une image d'un document à une ressource |