WordPress
time_read37mn de lecture

Le fichier robots.txt WordPress : créer et gérer le fichier robots.txt

14 octobre 2022

Le fichier robots.txt WordPress : créer et gérer le fichier robots.txt

Le fichier robots.txt permet de bloquer l’accès aux robots des moteur de recherche à certaines parties de votre site. Vous voudrez par exemple demander à Bingbot de ne pas indexer une page x ou un fichier y, dans les résultats de recherche. Vous devez alors vous servir du fichier robots.txt. La plupart de sites web ont un fichier robots.txt qui masque certains contenus.🧐 Les sites web créés avec WordPress ont leur propre fichier robots.txt qui est généré automatiquement lors de l’installation de ce logiciel open source. 😇

Objectif

Dans ce tutoriel, vous apprenez à accéder au fichier robots.txt de WordPress et à le modifier en utilisant trois méthodes. En lisant minutieusement cet article, vous pouvez créer et modifier le fichier robots.txt de votre site sans qu’il soit nécessaire de faire appel à un développeur.😊

Prérequis

Tout ce dont vous avez besoin pour interagir avec le fichier robots.txt de votre site WordPress est d’un accès de niveau administrateur à votre site.

Besoin d’un hébergement WordPress rapide et de qualité ?

LWS vous conseille sa formule d’hébergement WordPress en promotion à -20% (offre à partir de 3,99€ par mois au lieu de 4,99 €). Non seulement les performances sont au rendez-vous mais vous profitez en plus d’un support exceptionnel.

Découvrir l’offre

Qu’est-ce que le fichier robots.txt WordPress ?

fichier robots.txt WordPressChaque contenu que vous publiez en ligne est exploré par les moteurs de recherche afin d’être indexé et ensuite d’être référencé. Chaque page, article ou chaque image que vous créez, quelle que soit sa nature, passe par le même processus avant d’apparaître dans les résultats des moteurs de recherche.

Pour explorer les milliers de pages web qui sont publiées en ligne, les moteurs de recherche utilisent les robots appelés également « bots ». Chaque moteur de recherche a ses propres robots d’indexation et ses règles de fonctionnement. Logiquement, toute page web qui peut être explorée sur votre site, peut être indexée puis référencée.

Certaines pages ne doivent cependant pas être référencées : par exemple, la page de connexion à votre tableau de bord WordPress. Il peut en être de même pour certaines images. Pour empêcher les moteurs de recherche de les affichier dans les résultats de recherche, il convient d’utiliser le fichier robots.txt.

Le fichier robots.txt contient des instructions qui indiquent aux bots de moteurs de recherche d’exclure certains contenus de votre site (pages, fichier… ). Vous pouvez utiliser ce fichier pour rendre certaines pages de votre site privées.

 

Dans WordPress, le fichier robots.txt est créé automatiquement lorsque vous installez l’application sur votre espace d’hébergement.

Le fichier robots.txt WordPress est virtuel. Vous ne pouvez pas donc y accéder directement sur votre serveur et y apporter des modifications comme vous le ferez par exemple avec le fichier .htaccess de votre installation😮‍💨. Si vous êtes débutant, les instructions contenues dans le fichier robots.txt par défaut devraient être largement suffisantes pour gérer votre site.

 

Vous pouvez accéder au contenu de votre fichier robots.txt sans la possibilité de le modifier depuis n’importe quel navigateur web. Il suffit d’ajouter l’attribut /robots.txt à votre nom de domaine dans la barre du navigateur.👇accéder au fichier robots.txt depuis le navigateurComme, vous pouvez le voir dans l’image ci-dessus, notre fichier ne contient que quelques instructions. Nous allons voir comment vous pouvez modifier ce contenu.

Quelle est l’importance du fichier robots.txt ?

importance du fichier robots.txtLe fichier robots.txt permet d’ajouter des règles d’exclusion et d’inclusion de certaines parties de votre site lors de l’exploration et de l’indexation par les robots de moteurs de recherche. Vous pouvez donc vous en servir pour instruire aux moteurs de recherche d’explorer et d’afficher uniquement les pages de grande valeur dans les résultats organiques.

Ce fichier peut aussi vous aider à bloquer l’exploration de votre site par certains robots malveillants. Vous pouvez ainsi bloquer un nombre assez considérable de robots tiers qui peuvent parcourir et encombrer inutilement votre site avec un risque de le ralentir.

Où trouver le fichier robots.txt et quelles sont ses composantes ?

où trouver le fichier robots.txtLe fichier robots.txt est accessible à la racine de votre site. Vous devez en conséquence accéder au dossier public_html ou www (selon les hébergeurs) pour trouver le vôtre. Et comme nous le disions plus tôt, ce fichier est virtuel. Si vous envisagez de le modifier, vous devez créer un nouveau fichier nommé robots.txt puis le placer à la racine de votre site.

Mais avant cela, voyons quelles sont les composantes d’un fichier robots.txt. Et pour répondre à cette question, nous allons voir un exemple typique :

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Comme vous le voyez dans l’exemple ci-dessus👆, le fichier robots.txt classique de WordPress inclut généralement trois instructions :

  • User-agent : cette ligne universelle permet de bloquer n’importe quel robot de moteurs de recherche. Le symbole (*) représente tous les robots. Mais par exemple, si vous souhaitez bloquer uniquement le robot de Yandex, il vous suffit de remplacer l’astérisque par YandexBot.
  • Disallow : c’est la commande qui permet d’interdire aux robots d’accéder à des parties spécifiques de votre site. Dans l’exemple ci-dessus, tous les robots ont l’ordre de ne pas indexer la partie /wp-admin de notre site.
  • Allow : indique aux bots d’indexer la partie spécifique de votre site que vous avez défini.

Avec ces trois lignes de commandes, vous avez des possibilités presque infinies quand il faut ou non indexer une partie spécifique de votre site.

Certains bots peuvent ignorer ces règles malgré votre configuration. D’ailleurs, selon Google, si une page est exclue à l’aide d’un fichier robots.txt et qu’un lien pointe vers cette dernière, Googlebot peut tout de même l’explorer et même l’indexer dans les résultats organiques.

 

Si vous tenez strictement à empêcher les moteurs de recherche à indexer une partie spécifique de votre site, la meilleure façon de le faire consiste à utiliser des balises noindex. Pour agir efficacement, la ressource avec la balise noindex ne doit pas être bloquée également avec le fichier robots.txt.

Comment créer un fichier robots.txt dans WordPress ?

Vous pouvez créer un fichier robots.txt si vous souhaitez ajouter des règles supplémentaires au fichier virtuel de WordPress. Dans ce cas, le fichier créé va remplacer le robots.txt par défaut. Pour ce faire, vous pouvez utiliser trois méthodes :

Méthode 1 : créer le fichier robots.txt avec le plugin All In One SEO

All In One SEO est connu comme un des plus populaires plugins de référencement naturel dans WordPress. Il peut être utilisé gratuitement et contient des nombreuses fonctionnalités qui le placent en tête des concurrents.

Pour ce faire, connectez-vous à l’espace d’administration de votre site et accédez à la section « Extensions › ajouter ». Ensuite, recherchez l’extension All In One SEO dans le répertoire officiel en utilisant la barre de recherche.

Cliquez sur le bouton « Installer maintenant », une fois que l’avez trouvé.installer le plugin All In One SEO Après l’installation et l’activation de ce plugin, rendez-vous dans la section « All In One SEO › outils » depuis votre tableau de bord.All In One SEO/outilsPar la suite, vous serez redirigé vers une nouvelle interface. All In One SEO vous présente le fichier robots.txt par défaut de votre site. Vous pouvez également le prévisualiser dans votre navigateur en cliquant sur le bouton « Ouvrir Robots.txt ».prévisualiser le fichier robots.txt Ensuite, pour créer un nouveau fichier robots.txt, commencez par cocher l’option « Activer les robots.txt personnalisés ».activer l'éditeur de robots.txtVous pouvez créer votre fichier robots.txt à l’aide de trois champs présentés :

  • Agent utilisateur : ce champ permet d’ajouter votre agent utilisateur.
  • Règle : choisissez entre autres les deux options : autoriser (Allow) et interdire (Disallow).
  • Champ du répertoire : cette section vous permet d’ajouter des répertoires ou des dossiers que vous ne souhaitez pas indexer.

Cliquez sur le bouton « Ajouter une règle » pour ajouter une ou plusieurs règles.ajouter une règle Enregistrez vos modifications, et c’est tout ! 😁

Méthode 2 : utiliser le plugin Rank Math pour créer un fichier robots.txt

Rank Math est une autre extension que vous pouvez utiliser pour créer un fichier robots.txt. Tout d’abord, installez ce plugin sur votre site.

Ensuite, accédez à la section « Rank Math › réglages généraux ».Rank Math/réglages péripheriques Dans l’interface suivante, accédez à la section « Modifier le robots.txt ».accéder à la section robots.txtSi un fichier robots.txt est déjà disponible à la racine de votre site, vous ne pouvez pas ajouter un fichier robots.txt supplémentaire. Vous devez donc supprimer celui qui existe déjà afin d’avoir la possibilité de créer un nouveau.

Ensuite, ajoutez les règles nécessaires et définissez tous les dossiers que vous ne souhaitez pas que les moteurs de recherche indexent. Une fois que vous avez terminé, cliquez sur le bouton « Enregistrer les modifications ».

Méthode 3 : créer manuellement un fichier robots.txt

Si vous ne voulez pas créer votre fichier robots.txt en utilisant un plugin, alors vous pouvez le faire manuellement. Cette option vous permet d’ajouter un fichier robots.txt sur n’importe quel site. C’est aussi une charge de moins pour votre base de données, car vous n’aurez pas besoin d’installer un plugin le faire.

Pour utiliser cette méthode, vous devez avoir un éditeur de texte comme Notepad++. Ouvrez votre éditeur de texte et ajoutez toutes les règles nécessaires à votre fichier.créer un fichier robots.txt Ensuite, enregistrez votre fichier sous le nom de robots.txtenregistrer votre fichier sous le nom de robots.txtUne fois que vous avez créé votre fichier et l’enregistrer sur votre ordinateur, connectez-vous à votre site en utilisant un client FTP tel que FileZilla.

Trucs et astuces


Si vous hébergez votre site chez LWS, vous n’avez pas besoin d’installer un logiciel client FTP ! Utilisez le gestionnaire de fichiers cPanel ou le File Manager LWS Panel, selon la formule d’hébergement web choisie, pour télécharger votre fichier robots.txt sur le serveur.

Accédez à la racine de votre site et téléchargez le fichier robots.txt que vous avez créé.télécharger le fichier robots.txt à la racine de votre siteUne fois que vous avez terminé le téléchargement, c’est tout !

Quelques règles que vous pouvez utiliser avec le fichier robots.txt

Bloquer l’exploration de l’ensemble de votre site

Pour interdire à tous les robots de moteurs de recherche d’explorer votre site, vous pouvez ajouter les règles ci-dessous dans votre fichier robots.txt.

User-agent: *
Disallow: /

Le symbole / représente l’ensemble de dossiers de votre site.

Cette option est envisageable si votre site est en cours de développement. Si vous appliquez ces règles à un site en production, vous pouvez nuire fortement à votre référencement naturel.

 

Interdire l’exploration d’un site à un robot spécifique

Vous voudrez peut-être qu’un robot X n’explore votre site. Votre fichier robots.txt peut ressembler à celui-ci :

User-agent: Yandoxbot
Disallow: /

Comme vous pouvez le voir l’astérisque est remplacé par le robot Yandexbot. Une fois que vous enregistrez votre fichier, vous avez interdit l’exploration uniquement au robot de Yandex.

Trucs et astuces


Le site User Agent String.Com répertoire les noms de robots que vous pouvez utiliser dans votre fichier robots.txt.

Autoriser l’accès à un fichier spécifique dans un dossier non autorisé

Vous pouvez aussi bloquer un dossier entier et ensuite, permettre aux robots d’accéder à un fichier spécifique. Dans ce cas, votre fichier robots.txt peut ressembler à l’exemple ci-dessous :

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Dans ce fichier robots.txt, vous avez bloqué l’accès à l’ensemble de fichiers du répertoire /wp-admin sauf au fichier /wp-admin/admin-ajax.php.

Bloquer l’accès à un fichier spécifique à tous les robots de moteur de recherche

Vous voudrez peut-être bloquer l’indexation d’un fichier spécifique par tous les moteurs de recherche. Dans ce cas, vous pouvez créer un fichier robots.txt qui ressemble à celui-ci :

User-agent: *
Disallow: */feed/

Dans ce fichier, vous avez bloqué l’accès aux pages de flux RSS de votre site.

Créer des règles différentes pour différents bots dans le Robots.txt

Supposons que vous voudrez appliquer une règle à tous les bots de moteurs de recherche et une autre règle à un bot spécifique. Votre fichier robots.txt peut ressembler à celui-ci :

User-agent: *
Disallow: /wp-admin/
User-agent: Googlebot-Image
Disallow:/

Dans cet exemple, vous avez bloqué l’accès à tous les bots au répertoire /wp-admin. En plus, vous avez ordonné au robot Googlebot-image de ne pas explorer votre site.

Tester votre fichier robots.txt

Vous devez ensuite tester votre fichier afin de vous assurer qu’il fonctionne correctement. La manière la plus facile de procéder consiste à utiliser l’outil de vérification de Google Search Console de Search Console.

Rendez-vous sur la page d’accueil de l’outil et collez le contenu de votre fichier dans la zone d’édition prévue.

Une fois que vous avez terminé, l’outil va détecter les erreurs éventuelles et les afficher si elles existent.rechercher les érreurs du fichier robots.txtComme vous pouvez le voir, notre fichier ne contient aucune erreur. Ce qui traduit par le résultat « 0 erreurs et 0 avertissements ».

Cliquez ensuite sur le bouton « Envoyer » pour demander à Google de mettre à jour manuellement le fichier robots.txt de votre site.mettre à jour le fichier robots.txt

Conclusion

🥳Toutes félicitations d’avoir lu cet article. Le fichier robots.txt vous permet de bloquer l’exploration et l’indexation de certaines parties de votre site par certains bots de moteurs de recherche. Dans cet article, vous avez découvert ce qui est le fichier robots.txt, son importance et la façon de le créer sur votre site.

Avez-vous des questions sur la façon de gérer le fichier robots.txt WordPress ? Utilisez la section Commentaires pour nous écrire.

Avatar de l'auteur

Auteur de l'article

Joseph

Bonjour, je m'appelle Joseph. Je suis rédacteur spécialisé dans WordPress, PrestaShop et d'autres CMS. Fort d'une expertise approfondie en PHP et MySQL, je partage mes connaissances à travers des tutoriels simples et accessibles. Passionné par le développement et la transmission de savoir, j'aime expliquer et rendre les concepts techniques compréhensibles pour tous

Avis client de l'hébergeur LWS

Nos avis Trustpilot Nos avis Hostadvice Nos avis sur avis.lws.fr
Avis trustpilot 30/04/2022

LWS l'hébergeur par excellence !

LWS est pour moi l'hébergeur par excellence, que cela soit au niveau de l'hébergement qui est très performant, les mails qui sont d'une qualité professionnelle et de la gestion du domaine facile à comprendre.

PauseGreen

Avis hostadvice 27/04/2022

Super, au top !

Au top, prix attractif. Service très rapide et réactif. Je l'ai même personnellement recommandé à des proches. La vie est bien plus facile avec LWS

Masset Eliot

Avis avislws 26/04/2022

Support

Clair, efficace, rapide et à tarif abordable. J'ai maintenant un site superbe à mon image, puisque je le fais moi-même. L'équipe technique est au top, j'ai une réponse en 20 minutes, cela change d'autres hébergeurs pourtant plus connu.

Lady Whip

Avis hostadvice 24/04/2022

Bravo et merci

Bravo et merci aux équipes techniques pour leur réactivité et leur professionnalisme depuis plus de 10 ans chez eux et de nombreux sites !!! Merci

Olivier Delmas

Avis trustpilot 23/04/2022

Je suis très satisfait.

J'ai commandé un hébergement pour le site d'une association. Tout s'est passé très rapidement et sans la moindre embuche. La tarification est attractive et me parait très claire. Le panneau d'administration de l'hébergement est facile à utiliser et à comprendre. Je n'ai pas encore installé Wordpress car le contenu n'est pas prêt mais ce sera la prochaine étape et je suis très confiant. Merci !

Pierre-André Liné

Avis avislws 20/04/2022

Un service technique excellent

Je suis client chez LWS depuis 2011 avec une boutique OSCommerce qui tourne comme une horloge depuis cette date sur un hébergement mutualisé. La disponibilité de la boutique est très proche de 100%. Concernant les rares problèmes rencontrés en huit ans, j’ai eu à chaque fois un technicien compétent qui a résolu le problème très rapidement et efficacement. Je suis en train de migrer sur une plateforme Pretashop sur un VPS, avec l’offre LWS Debian 9 et Prestashop. Un technicien m’a grandement aidé pour finaliser l’installation de la boutique lors de la mise à jour vers la dernière version de Prestashop 1.7 qui posait problème. Je suis très satisfait de LWS, et ce sur la durée : réponses et réactions rapides et efficaces. Je recommande cet hébergeur et encore merci.

Alain

Avis trustpilot 16/04/2022

Une expérience jamais égalée !

Étant Développeur Web & Mobile Full-Stack depuis plus de 5 ans déjà, j'ai rarement eu un service client aussi rapide et efficace. Sans compter la qualité du service en ligne. Je recommande VIVEMENT LWS !

Chris KOUAKAM

Avis hostadvice 12/04/2022

Très bon hébergeur

J'ai un serveur VPS chez eux et je n'ai aucun problème, dès qu'il y a un problème le service technique est la pour vous aider et répond assez rapidement à votre demande. Je recommande vivement cet hébergeur.

Vanden Cruyce

Avis avislws 09/04/2022

Je suis ravie

Je suis ravie d'être avec LWS sur tous les plans, je remercie les Techniciens (Fabrice, Omar, Sandy-Mahitsison) depuis plus de 8 ans j'ai évolué avec LWS et toujours soutenue. Une véritable relation humaine même si les questions ou nos inquiétudes ne correspondent pas à leurs missions, ils sont là pour nous répondent et nous rassurent. Mon site c'est mon travail ma source de revenue donc il sont mes partenaires ! les travailleurs de l'ombre merci à eux ! Merci LWS

L'atelier-and-Co

Commentaires (0)

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.