Google Search Console vous permet de regarder votre site Web à travers les yeux de Google.
Vous obtenez des informations sur les performances de votre site Web et des détails sur l’expérience de la page, les problèmes de sécurité, l’exploration ou l’indexation.
La partie Exclue du rapport Couverture de l’index google search console fournit des informations sur l’état d’indexation des pages de votre site Web.
Découvrez pourquoi certaines pages de votre site Web atterrissent dans le rapport Exclus de Google Search Console et comment y remédier.
Qu’est-ce que le rapport sur la couverture de l’indice?
Le Rapport de couverture de google Search Console affiche des informations détaillées sur l’état de l’index des pages Web de votre site Web.
Vos pages Web peuvent aller dans l’un des quatre compartiments suivants :
- Erreur: Les pages que Google ne peut pas indexer. Vous devriez consulter ce rapport car Google pense que vous souhaitez peut-être que ces pages soient indexées.
- Valide avec avertissements: Les pages que Google indexe, mais il y a quelques problèmes que vous devriez résoudre.
- Valable: Les pages indexées par Google.
- Exclu: Les pages qui sont exclues de l’index.
Que sont les pages exclues ?
Google n’indexe pas les pages dans les compartiments Erreur et Exclusion.
La principale différence entre les deux est:
- Google pense que les pages dans Erreur doivent être indexées mais ne peuvent pas en raison d’une erreur que vous devriez examiner. Par exemple, les pages non indexables soumises via un sitemap XML relèvent de la rubrique Erreur.
- Google pense que les pages du compartiment Exclus devraient en effet être exclues, et c’est votre intention. Par exemple, les pages non indexables non soumises à Google apparaîtront dans le rapport Exclus.
Cependant, Google ne fait pas toujours les choses correctement et les pages qui devraient être indexées vont parfois à Exclu.
Heureusement Console de recherche Google fournit la raison pour laquelle les pages sont placées dans un compartiment spécifique.
C’est pourquoi il est recommandé d’examiner attentivement les pages des quatre compartiments.
Plongeons maintenant dans le compartiment Exclus.
Raisons possibles des pages exclues
Il y a 15 raisons possibles pour lesquelles vos pages Web sont dans le groupe Exclus. Examinons de plus près chacun d’eux.
Exclu par la balise « noindex »
Ce sont les URL qui ont une balise « noindex ».
Google pense que vous souhaitez réellement exclure ces pages de l’indexation parce que vous ne les répertoriez pas dans le Plan du site XML.
Il peut s’agir, par exemple, de pages de connexion, de pages utilisateur ou de pages de résultats de recherche.
Mesures suggérées :
- Passez en revue ces URL pour être sûr que vous veulent les exclure de l’index de Google.
- Vérifiez si une balise « noindex » est toujours/réellement présente sur ces URL.
Analysé – Actuellement non indexé
Google a exploré ces pages et ne les a toujours pas indexées.
Comme le dit Google dans son documentation, l’URL dans ce compartiment « peut ou non être indexée à l’avenir ; pas besoin de soumettre à nouveau cette URL pour l’exploration. »
De nombreux professionnels du référencement ont remarqué qu’un site peut avoir de graves problèmes de qualité si de nombreuses pages normales et indexables passent sous Crawled – actuellement non indexées.
Cela pourrait signifier que Google a exploré ces pages et ne pense pas qu’elles fournissent suffisamment de valeur pour être indexées.
Mesures suggérées :
- Examinez votre site Web en termes de qualité et E-A-T.
Découvert – Actuellement non indexé
Comme le dit la documentation de Google, la page sous Découvert – actuellement non indexée « a été trouvée par Google, mais pas encore explorée ».
Google n’a pas exploré la page pour ne pas surcharger le serveur. Un grand nombre de pages sous ce compartiment peut signifier que votre site a budget d’analyse Questions.
Mesures suggérées :
- Vérifiez l’intégrité de votre serveur.
Introuvable (404)
Il s’agit des pages qui ont renvoyé le code d’état 404 (Introuvable) à la demande de Google.
Il ne s’agit pas d’URL soumises à Google (c.-à-d. dans un Plan du site XML), mais au lieu de cela, Google a découvert ces pages (c’est-à-dire via un autre site Web lié à une ancienne page supprimée il y a longtemps.
Mesures suggérées :
- Passez en revue ces pages et décider d’implémenter ou non une redirection 301 vers une page de travail.
Souple 404
Souple 404, dans la plupart des cas, est une page d’erreur qui renvoie le code d’état OK (200).
Alternativement, il peut également s’agir d’une page mince qui contient peu ou pas de contenu et utilise des mots comme « désolé », « erreur », « introuvable », etc.
Mesures suggérées :
- Dans le cas d’une page d’erreur, assurez-vous de retourner le code d’état 404.
- Pour les pages à contenu fin, ajouter du contenu unique pour aider Google à reconnaître cette URL en tant que page autonome.
Page avec redirection
Toutes les pages redirigées sur votre site Web iront dans le compartiment Exclus, où vous pourrez voir toutes les pages redirigées que Google a détectées sur votre site Web.
Mesures suggérées :
- Examiner les pages redirigées pour s’assurer que les redirections ont été implémentées intentionnellement.
- Certains plugins WordPress créent automatiquement des redirections lorsque vous modifiez l’URL, vous pouvez donc les consulter occasionnellement.
Dupliquer sans canonique sélectionné par l’utilisateur
Google pense que ces URL sont des doublons d’autres URL sur votre site Web et, par conséquent, ne doivent pas être indexées.
Vous n’avez pas défini de balise canonique pour ces URL et Google a sélectionné la balise canonique en fonction d’autres signaux.
Mesures suggérées :
- Inspectez ces URL pour vérifier quelles URL canoniques Google a sélectionné pour ces pages.
Dupliquer, Google a choisi différent canonique que l’utilisateur
Dans ce cas, vous avez déclaré un URL canonique pour la page, mais même ainsi, Google a sélectionné une URL différente comme canonique. Par conséquent, le canonique sélectionné par Google est indexé et celui sélectionné par l’utilisateur ne l’est pas.
Actions possibles :
- Inspectez l’URL pour vérifier ce qui est canonique Google sélectionné.
- Analyser les signaux possibles qui ont fait choisir Google un canonique différent (c.-à-d. des liens externes).
DUPLIQUER, URL soumise non sélectionnée comme canonique
La différence entre le statut ci-dessus et ce statut est que dans le cas de ce dernier, vous avez soumis une URL à Google pour indexation sans déclarer son adresse canonique, et Google pense qu’une URL différente ferait une meilleure canonique.
Par conséquent, le canonique sélectionné par Google est indexé plutôt que l’URL soumise.
Mesures suggérées :
- Inspectez l’URL pour vérifier ce qui est canonique Google a sélectionné.
Page alternative avec la balise canonique appropriée
Ce sont simplement les doublons des pages que Google reconnaît comme des URL canoniques.
Ces pages ont les adresses canoniques qui pointent vers l’URL canonique correcte.
Mesures suggérées :
- Dans la plupart des cas, aucune action n’est requise.
Bloqué par des robots.txt
Ce sont les pages qui robots.txt ont bloqué.
Lors de l’analyse de ce compartiment, gardez à l’esprit que Google peut toujours indexer ces pages (et les afficher de manière « altérée ») si Google trouve une référence à elles sur, par exemple, d’autres sites Web.
Mesures suggérées :
- Vérifiez si ces pages sont bloquées en utilisant le testeur .txt robots.
- Ajoutez une balise « noindex » et supprimez les pages des robots.txt si vous souhaitez les supprimer de l’index.
Bloqué par l’outil de suppression de page
Ce rapport répertorie les pages dont la suppression a été demandée par le Outil de suppression.
Gardez à l’esprit que cet outil ne supprime les pages des résultats de recherche que temporairement (90 jours) et ne les supprime pas de l’index.
Mesures suggérées :
- Vérifier si les pages soumises via l’outil Suppressions doit être temporairement supprimé ou avoir une balise ‘noindex’.
Bloqué en raison d’une demande non autorisée (401)
Dans le cas de ces URL, Googlebot n’a pas pu accéder aux pages en raison d’une demande d’autorisation (code d’état 401).
À moins que ces pages ne soient disponibles sans autorisation, vous n’avez rien à faire.
Google vous informe simplement de ce qu’il a rencontré.
Mesures suggérées :
- Vérifiez si ces pages doivent réellement nécessiter une autorisation.
Bloqué en raison d’un accès interdit (403)
Ceci code d’état est généralement le résultat d’une erreur de serveur.
403 est renvoyé lorsque les informations d’identification fournies ne sont pas correctes et que l’accès à la page n’a pas pu être accordé.
Comme Documentation Google États:
« Googlebot ne fournit jamais d’informations d’identification, votre serveur renvoie donc cette erreur de manière incorrecte. Cette erreur doit soit être corrigée, soit la page doit être bloquée par des robots.txt ou noindex.
Que pouvez-vous apprendre des pages exclues?
Des pics soudains et énormes dans un compartiment spécifique de pages exclues peuvent indiquer de graves problèmes de site.
Voici trois exemples de pics qui peuvent indiquer de graves problèmes avec votre site Web:
- Un énorme pic dans les pages Introuvables (404) peut indiquer un échec migration où les URL ont été modifiées, mais les redirections vers de nouvelles adresses n’ont pas été implémentées. Cela peut également se produire après, par exemple, qu’une personne inexpérimentée a changé la limace des articles de blog et, par conséquent, a changé les URL de tous les blogs.
- Un énorme pic dans le Découvert – actuellement non indexé ou exploré – actuellement non indexé peut indiquer que votre site a été piraté. Assurez-vous de consulter les pages d’exemple pour vérifier s’il s’agit bien de vos pages ou si elles ont été créées à la suite d’un piratage (c’est-à-dire des pages avec des caractères chinois).
- Un énorme pic dans la balise Exclu par ‘noindex’ peut également indiquer un lancement et une migration infructueux. Cela se produit souvent lorsqu’un nouveau site passe en production avec des balises « noindex » du site intermédiaire.
Le récapitulatif
Vous pouvez en apprendre beaucoup sur votre site Web et sur la façon dont Googlebot interagit avec lui, grâce à la section Exclus du rapport sur la couverture de GSC.
Si vous êtes un nouveau SEO ou avez déjà quelques années d’expérience, faites-en votre habitude quotidienne de vérifier Google Search Console.
Cela peut vous aider à détecter divers problèmes techniques de référencement avant qu’ils ne se transforment en véritables catastrophes.
Plus de ressources :
Image en vedette: Milan1983 / Shutterstock