Gérer la pagination d’un site, c’est un peu comme organiser une bibliothèque : si les rayons ne sont pas bien étiquetés, personne ne trouve ce qu’il cherche. Et contrairement à ce qu’on pourrait croire, mal paginer coûte cher : pages qui disparaissent des résultats, budget de crawl gaspillé, autorité de lien éparpillée,etc..
Ce que Google voit quand il crawle vos pages paginées
Du côté utilisateur, la pagination semble banale : page 1, page 2, page 3, et ainsi de suite. Du côté de Googlebot, c’est une autre histoire. Le robot doit comprendre que ces pages forment une série, identifier celle qui mérite d’être mise en avant dans les résultats, et décider comment répartir l’autorité entre elles. Sans signaux clairs, il se retrouve face à des pages qui se ressemblent sans être identiques, et il prend des décisions seul, pas forcément dans votre sens.
Les erreurs qu’on voit trop souvent
Avant de parler de solutions, voici ce qui pose problème sur la majorité des sites audités. Les balises title et meta description copiées-collées sur toutes les pages d’une série créent du contenu dupliqué au niveau des métadonnées. Les liens internes souvent distribués équitablement entre toutes les pages paginées, sans hiérarchie, font que la page 1 ne ressort pas clairement comme référence. Les pages 2, 3, 4 indexées par défaut ne font que consommer du budget de crawl sans avoir aucune chance de ranker seules. Enfin, les paramètres d’URL non gérés (?page=2, ?offset=20) génèrent des doublons sans canonical, un problème silencieux mais réel.
Balise canonical
Quand Google a officiellement abandonné la prise en charge de rel= »next/prev » en 2019, beaucoup de webmasters ont paniqué. À tort, dans une certaine mesure. Chaque page paginée doit avoir une canonical self-referencing, c’est-à-dire pointer vers elle-même. C’est la base. Il ne faut pas non plus canonicaliser systématiquement les pages 2 et 3 vers la page 1 : ça paraît logique, mais en pratique vous signalez à Google que ces URLs n’ont aucun intérêt propre, ce qui peut bloquer leur indexation de façon non désirée.
Utilisez également des URLs propres et stables : /blog/page/2/ est infiniment plus lisible que ?p=2&offset=20. En résumé, traitez chaque page paginée comme une URL à part entière, avec son propre titre et sa propre description, et laissez Google trancher sur ce qui mérite de ranker.
Crawl budget
Pour un petit blog, le crawl budget n’est pas vraiment un sujet.
Pour un site e-commerce avec des milliers de fiches produits et des dizaines de filtres, c’est critique.
Bloquez via robots.txt les URLs issues de combinaisons de filtres sans valeur SEO (tri par prix, taille + couleur + marque). Utilisez noindex sur les pages paginées de faible valeur ajoutée, tout en gardant les liens actifs pour permettre la circulation du PageRank. Et surtout, n’utilisez jamais robots.txt et noindex simultanément sur la même URL : si Google ne peut pas accéder à la page, il ne lit pas la balise noindex. C’est l’une des erreurs les plus répandues, et pourtant l’une des plus simples à éviter.
Maillage interne et navigation
La page 1 d’une série capte naturellement plus de liens entrants. Les pages suivantes se retrouvent souvent dans l’ombre, pas parce qu’elles sont inutiles, mais parce que le maillage interne n’est pas pensé pour les mettre en valeur. Les liens « page précédente / page suivante » doivent impérativement être dans le HTML brut, pas uniquement gérés en JavaScript. Vos sitemaps XML doivent inclure les pages paginées importantes, pas seulement la page 1. Et évitez de mettre des attributs nofollow sur les liens de navigation paginée : vous bloquez inutilement la transmission du PageRank.
Un audit régulier de votre structure de liens internes permet de détecter ces problèmes avant qu’ils n’impactent vos positions. Des outils comme InkySEO facilitent ce travail : la plateforme propose notamment un module d’audit technique SEO qui analyse en profondeur les problèmes de pagination, d’indexation et de crawlabilité, utile notamment sur les sites à grande échelle.
UX et pagination : le lien souvent sous-estimé
Google mesure comment les utilisateurs se comportent sur vos pages. Une pagination confuse, c’est un taux de rebond qui grimpe et un temps passé sur le site qui chute, deux signaux qui n’arrangent pas votre SEO. Indiquez clairement le numéro de page dans le titre (Blog – Page 3 | Nom du site). Si vous utilisez un système « voir plus », conservez quand même les URLs paginées pour les moteurs, les deux approches sont compatibles. Évitez également le scroll infini sans ancres ni URLs distinctes : Googlebot ne le voit tout simplement pas. Enfin, trouvez le bon équilibre sur le nombre d’éléments par page, trop peu multiplie les URLs inutilement, trop d’éléments ralentit le chargement.
Ce que vous devez retenir de tout ça
- Balises title et meta description uniques sur chaque page paginée
- Canonical self-referencing en place, URLs propres sans paramètres redondants
- Navigation paginée codée en HTML, pas uniquement en JavaScript
- Pages de faible valeur traitées avec noindex ou exclusion robots.txt, pas les deux
- Sitemaps XML incluant les pages importantes, audit des erreurs de crawl réalisé récemment
La pagination est un de ces sujets où les détails font toute la différence. Bien structurée, elle aide Google à explorer votre site et à comprendre votre contenu. Mal gérée, elle crée du bruit, dilue votre autorité et peut faire disparaître des pages qui mériteraient d’être visibles. Autant prendre le temps de le faire proprement.
