

Si vous voyez «découvert – actuellement non indexé» dans la console de recherche Google, cela signifie que Google est conscient de l’URL, mais ne l’a pas encore rampé et indexé.
Cela ne signifie pas nécessairement que la page ne sera jamais traitée. Comme le dit leur documentation, ils peuvent y revenir plus tard sans aucun effort supplémentaire de votre part.
Mais d’autres facteurs pourraient empêcher Google de ramper et d’indexer la page, notamment:
- Les problèmes de serveur et les problèmes techniques sur place sont de restreindre ou de prévenir la capacité de chapelure de Google.
- Problèmes relatifs à la page elle-même, comme la qualité.
Vous pouvez également utiliser l’API d’inspection de console de recherche Google pour faire la queue d’URL pour leur coverageState
statut (ainsi que d’autres points de données utiles) en masse.
Demande d’indexation via la console de recherche Google
Il s’agit d’une résolution évidente et, pour la majorité des cas, cela résoudra le problème.
Parfois, Google est tout simplement lent à ramper de nouvelles URL. Ça arrive. Mais les problèmes sous-jacents sont les coupables d’autres fois.
Lorsque vous demandez l’indexation, l’une des deux choses peut se produire:
- L’URL devient «rampée – actuellement non indexée».
- Indexation temporaire.
Les deux sont des symptômes de problèmes sous-jacents.
La seconde se produit car la demande d’indexation donne parfois à votre URL un «boost de fraîcheur» temporaire qui peut prendre l’URL au-dessus du seuil de qualité requis et, à son tour, conduire à une indexation temporaire.
Demandez aux spécialistes du marketing de recherche de newsletter.
Voir les termes.
Problèmes de qualité de la page
C’est là que le vocabulaire peut devenir déroutant. On m’a demandé: « Comment Google peut-il déterminer la qualité de la page s’il n’a pas encore été rampé? »
C’est une bonne question. La réponse est qu’elle ne peut pas.
Google suppose la qualité de la page en fonction des autres pages du domaine. Leurs classifications sont également basées sur les modèles d’URL et l’architecture de site Web.
En conséquence, le déplacement de ces pages de la «sensibilisation» à la file d’attente de rampe peut être déprécié en fonction du manque de qualité qu’ils ont trouvé sur des pages similaires.
Il est possible que les pages sur des modèles d’URL similaires ou celles situées dans des zones similaires de l’architecture du site aient une proposition de faible valeur par rapport à d’autres éléments de contenu ciblant les mêmes intentions et mots clés de l’utilisateur.
Les causes possibles comprennent:
- La principale profondeur de contenu.
- Présentation.
- Niveau de soutien au contenu.
- Unicité du contenu et des perspectives offerts.
- Ou encore plus de problèmes de manipulation (c’est-à-dire le contenu est de faible qualité et généré automatiquement, filé ou double directement du contenu déjà établi).
Travailler sur l’amélioration de la qualité du contenu au sein du cluster de site et les pages spécifiques peuvent avoir un impact positif sur l’intérêt de Google à ramper votre contenu avec un objectif plus important.
Vous pouvez également noter les autres pages sur le site Web que vous reconnaissez ne sont pas de la plus haute qualité pour améliorer le rapport des pages de bonne qualité aux pages de mauvaise qualité sur le site.
Budget et efficacité de rampe
Le budget de rampe est un mécanisme souvent mal compris dans le référencement.
La majorité des sites Web n’ont pas à s’en soucier.
Gary Illyes de Google a affirmé le dossier en affirmant que 90% des sites Web n’ont probablement pas besoin de penser au budget de la fraternité. Il est souvent considéré comme un problème pour les sites Web d’entreprise.
L’efficacité de la rampe, en revanche, peut affecter les sites Web de toutes tailles. Négligé, cela peut entraîner des problèmes sur la façon dont Google explore et traite le site Web.
Pour illustrer, si votre site Web:
- Duplique les URL avec des paramètres.
- Se résout avec et sans barrer des barres obliques.
- Est disponible sur HTTP et HTTPS.
- Sert du contenu à partir de plusieurs sous-domaines (par exemple, https://website.com et https://www.website.com).
… Ensuite, vous pourriez avoir des problèmes de duplication qui ont un impact sur les hypothèses de Google sur la priorité de la crawl en fonction des hypothèses de site plus larges.
Vous pourriez zapper le budget de rampe de Google avec des URL et des demandes inutiles.
Étant donné que Googlebot explore les sites Web en portions, cela peut conduire les ressources de Google à ne pas s’étirer assez loin pour découvrir toutes les URL nouvellement publiées aussi vite que vous le souhaitez.
Vous souhaitez ramper régulièrement votre site Web et vous assurer que:
- Les pages se résolvent en un seul sous-domaine (comme souhaité).
- Les pages se résolvent en un seul protocole HTTP.
- Les URL avec des paramètres sont canoniques à la racine (comme souhaité).
- Les liens internes n’utilisent pas les redirections inutilement.
Si votre site Web utilise des paramètres, tels que les filtres de produits de commerce électronique, vous pouvez limiter le rampage de ces chemins URI en les interalisant dans le fichier robots.txt.
Votre serveur peut également être important dans la façon dont Google alloue le budget pour ramper votre site Web.
Si votre serveur est surchargé et répond trop lentement, des problèmes rampants peuvent survenir.
Dans ce cas, Googlebot ne pourra pas accéder à la page, ce qui entraîne une partie de votre contenu qui ne se fait pas ramper.
Par conséquent, Google essaiera probablement de revenir plus tard pour indexer le site Web, ce qui entraînera sans aucun doute un retard dans l’ensemble du processus.
La relation entre ramper et indexation
Depuis plusieurs années, nous avons cru qu’il existe une relation quantifiable entre ramper et indexation.
Au fil des ans, nous avons vu que les URL ont tendance à «tomber de l’indice» s’ils n’ont pas été rampés au moins une fois tous les 75 à 140 jours.

La variance dépend probablement de la façon dont «populaire» et «en demande» est ou a été «populaire» et «à la demande».
Le graphique ci-dessus, que j’ai partagé lors du Sommet Tech SEO en avril, montre la courbe d’indexation de l’URL sur des sites Web d’URL de plusieurs millions et sa corrélation avec la dernière date d’exploration.
De nouvelles données partagées dans l’industrie du référencement ont défini «130 jours» comme étant l’indice de référence, et cela s’aligne sur le récit que nous avons vu au fil des ans.
Lien interne
Lorsque vous avez un site Web, il est important d’avoir des liens internes d’une page à une autre.
Google accorde généralement moins d’attention aux URL qui n’ont pas de liens internes ou suffisants – et peuvent même les exclure de son indice.
Vous pouvez vérifier le nombre de liens internes vers des pages à travers des robots de rampe comme la grenouille hurlante et le site de site.
L’optimisation de votre site Web nécessite une structure de site Web organisée et logique avec des liens internes.
Mais si vous avez des problèmes avec cela, une façon de vous assurer que toutes vos pages internes sont connectées est de «pirater» la profondeur de la rampe à l’aide de sitemaps HTML.
Ceux-ci sont conçus pour les utilisateurs, pas les machines. Bien qu’ils puissent être considérés comme des reliques maintenant, ils peuvent toujours être utiles.
De plus, si votre site Web a de nombreuses URL, il est sage de les diviser entre plusieurs pages. Vous ne voulez pas qu’ils soient tous liés à partir d’une seule page.
Les liens internes doivent également utiliser le <a>
Tag pour les liens internes au lieu de compter sur des fonctions JavaScript telles que onClick()
.
Si vous utilisez un cadre JAMSTACK ou JavaScript, étudiez comment il ou toute bibliothèque connexe gère les liens internes. Ceux-ci doivent être présentés sous forme de balises .