Recommandations associées

Comment utiliser robots dans la construction d'un site web

Date de publication :2024-07-23
EasyStore
Nombre de vues :

L'utilisation d'un fichier robots.txt sur un site web est une méthode pour contrôler l'accès des robots d'exploration des moteurs de recherche au contenu du site. Voici les étapes détaillées et les précautions à prendre pour utiliser robots.txt sur un site web :

网站建设中如何在网站中使用robots.png

1. Création du fichier robots.txt

  1. Utilisation d'un éditeur de texte :Ouvrez un éditeur de texte (comme Notepad++, Sublime Text ou le simple Bloc-notes) et préparez-vous à écrire le contenu du fichier robots.txt.

  2. Rédaction des règles :En fonction des besoins du site, rédigez les règles correspondantes. Généralement, ces règles incluent la spécification des robots d'exploration (User-agent), l'autorisation (Allow) ou l'interdiction (Disallow) d'accès à certains chemins d'URL.

  3. Sauvegarde du fichier :Enregistrez le fichier sous le nom robots.txt, en veillant à ce que l'extension soit .txt et que le nom du fichier soit entièrement en minuscules. Assurez-vous également que l'encodage du fichier est en UTF-8 pour éviter les problèmes de caractères sur différents serveurs ou navigateurs.

2. Placement du fichier robots.txt

  1. Téléversement dans le répertoire racine du site :Utilisez un logiciel FTP ou l'interface d'administration du site pour téléverser le fichier robots.txt dans le répertoire racine du site. Par exemple, si votre domaine est www.example.com, le fichier robots.txt doit être accessible à l'adresse http://www.example.com/robots.txt.

  2. Une fois le site en ligne, le système générera automatiquement le fichier robots. L'URL du fichier robots est : domaine/robots.txt ;

    Si vous souhaitez personnaliser le fichier robots, vous pouvez le modifier dans l'interface d'administration CMS - Gestion SEO - Fichier robots. Si après personnalisation vous souhaitez revenir au fichier robots par défaut du système, cliquez sur le bouton d'initialisation à droite pour restaurer le contenu par défaut. Après modification, enregistrez et publiez.

        Si une page du site ne doit pas être indexée, par exemple une page avec l'URL https://www.abc.com/fuwutiaokuan.html, vous pouvez ajouter la partie après le domaine/ dans le contenu du fichier robots, comme illustré ci-dessous :

1721706500674219689547890688.png

3. Rédaction des règles du fichier robots.txt

Le contenu du fichier robots.txt est principalement composé d'une série d'agents utilisateurs (User-agent) et d'instructions (comme Disallow, Allow). Voici quelques règles de base et exemples :

  1. User-agent :Spécifie à quel robot d'exploration s'applique la règle. Par exemple, User-agent: * signifie que la règle s'applique à tous les robots ; User-agent: Googlebot signifie que la règle ne s'applique qu'au robot de Google.

  2. Disallow :Spécifie les chemins d'URL qui ne doivent pas être visités. Par exemple, Disallow: /admin/ interdit l'accès au répertoire /admin/ et à ses sous-répertoires et fichiers.

  3. Allow (optionnel) :Contrairement à Disallow, spécifie les chemins d'URL autorisés. Notez que tous les moteurs de recherche ne prennent pas en charge l'instruction Allow, et qu'elle est souvent utilisée en combinaison avec Disallow pour un contrôle plus précis.

4. Exemple

1721706138674218170412924928.png

Dans cet exemple :

  • Tous les robots sont interdits d'accès aux répertoires /admin/ et /cgi-bin/.

  • Googlebot est autorisé à accéder au répertoire /special-content/, mais interdit d'accéder au reste du site (note : ici, Disallow: / après Allow écrasera l'instruction Allow, sauf si le moteur de recherche prend en charge et traite correctement cette situation). Cependant, ceci n'est qu'un exemple et des ajustements peuvent être nécessaires pour éviter de tels conflits.

  • L'instruction Sitemap fournit l'URL du plan du site, aidant les moteurs de recherche à mieux comprendre la structure du site.

5. Précautions

  1. Vérifiez le nom et l'emplacement du fichier :Le fichier robots.txt doit être placé dans le répertoire racine du site et son nom doit être entièrement en minuscules.

  2. Rédigez les règles avec prudence :Des règles incorrectes peuvent entraîner l'ignorance ou la suppression de pages importantes par les moteurs de recherche, affectant le SEO du site.

  3. Vérifiez et mettez à jour régulièrement :À mesure que le contenu du site évolue, il peut être nécessaire de vérifier et de mettre à jour le fichier robots.txt pour s'assurer qu'il répond toujours aux besoins du site.

  4. Comprenez la prise en charge par les moteurs de recherche :Différents moteurs de recherche peuvent prendre en charge le fichier robots.txt à des degrés divers, tenez-en compte lors de la rédaction des règles.

  5. Utilisez des outils de vérification :Utilisez divers outils en ligne pour vérifier la syntaxe et la logique du fichier robots.txt, afin de vous assurer que les moteurs de recherche peuvent correctement comprendre et appliquer ces règles.

Si vous avez des questions concernant la construction ou l'exploitation d'un site web pour le commerce extérieur, n'hésitez pas à consulter le service client technique d'Eyingbao via WeChat : Ieyingbao18661939702, notre personnel se fera un plaisir de vous répondre !

20240103114403854.jpg


Les images proviennent d'Internet, en cas de violation de droits, veuillez contacter le 400-655-2477.


Demande de consultation immédiate

Articles connexes

Produits connexes