Рекомендуем

Как использовать роботов при создании веб-сайтов

Дата выхода:2024-07-23
Виды:

Использование файлов robots.txt на вашем сайте — это способ контролировать доступ поисковых роботов к контенту вашего сайта. Ниже приведены подробные шаги и меры предосторожности по использованию robots.txt на вашем сайте:

网站建设中如何在网站中使用robots.png

1. Создайте файл robots.txt

  1. Использование текстового редактора: Откройте текстовый редактор (например, Notepad++, Sublime Text или просто Блокнот) и приготовьтесь записать содержимое файла robots.txt.

  2. Напишите правила: Напишите соответствующие правила в соответствии с потребностями веб-сайта. Обычно эти правила включают указание того, каким поисковым роботам (User-agent) разрешено (Allow) или запрещено (Disallow) получать доступ к каким URL-путям.

  3. Сохраните файл: Сохраните файл как robots.txt, убедитесь, что расширение файла .txt, а имя файла полностью в нижнем регистре. Также убедитесь, что файл закодирован в UTF-8, чтобы избежать искажения символов на разных серверах или в разных браузерах.

2. Поместите файл robots.txt

  1. Загрузка в корневой каталог веб-сайта: используйте программное обеспечение FTP или интерфейс управления бэкэндом веб-сайта для загрузки файла robots.txt в корневой каталог веб-сайта. Например, если доменное имя вашего веб-сайта www.example.com, то файл robots.txt должен быть расположен по адресу http://www.example.com/robots.txt.

  2. После того, как сайт будет запущен, система автоматически сгенерирует файл robots. URL-адрес robots: domain name/robots.txt;

    Если вам нужно настроить файл robots, вы можете изменить его в бэкэнде управления CMS - SEO management - robots file. Если вы хотите вернуться к системному файлу robots по умолчанию после настройки, вы можете нажать кнопку инициализации справа, чтобы восстановить содержимое системного файла robots по умолчанию. После изменения сохраните и опубликуйте.

Если вы не хотите, чтобы страница вашего веб-сайта была включена, например, ссылка на страницу https://www.abc.com/fuwutiaokuan.html, если вы не хотите, чтобы страница была включена, вы можете добавить часть после имени домена / в содержимое файла robots, как показано ниже:

1721706500674219689547890688.png

3. Напишите правила robots.txt

Содержимое файла robots.txt в основном состоит из ряда пользовательских агентов и инструкций (таких как Disallow, Allow). Ниже приведены некоторые основные правила и примеры:

  1. User-agent: Указывает, к какому поисковому роботу применяется правило. Например, User-agent: * означает, что правило применяется ко всем роботам; User-agent: Googlebot означает, что правило применяется только к роботу Google.

  2. Disallow: Указывает URL-путь, к которому вы не хотите иметь доступ. Например, Disallow: /admin/ означает, что доступ к каталогу /admin/ и его подкаталогам и файлам в корневом каталоге веб-сайта запрещен.

  3. Allow (необязательно): Противоположность Disallow, указывает URL-путь, к которому разрешен доступ. Следует отметить, что не все поисковые системы поддерживают директиву Allow, и при использовании она обычно используется в сочетании с директивой Disallow для обеспечения более точного контроля.

Пример

1721706138674218170412924928.png

В этом примере:

  • Всем сканерам запрещен доступ к каталогам /admin/ и /cgi-bin/.

  • Googlebot имеет право доступа к каталогу /special-content/, но ему запрещен доступ к остальной части сайта (Примечание: Disallow: / здесь идет после Allow, что фактически переопределяет предыдущую директиву Allow, если только поисковая система не поддерживает директиву Allow и не обрабатывает эту ситуацию правильно). Однако это всего лишь пример, и фактическое использование может потребовать корректировки, чтобы избежать подобных конфликтов.

  • Директива Sitemap предоставляет URL-адрес карты сайта, чтобы помочь поисковым системам лучше понять структуру сайта.

5. Примечания

  1. Убедитесь, что имя файла и его местоположение указаны правильно: файл robots.txt должен находиться в корневом каталоге вашего веб-сайта, а имя файла должно быть полностью строчными буквами.

  2. Будьте внимательны при написании правил: неверные правила могут привести к игнорированию или удалению важных страниц поисковыми системами, что повлияет на SEO-эффект веб-сайта.

  3. Регулярный просмотр и обновления: поскольку содержимое вашего веб-сайта обновляется и изменяется, вам может потребоваться регулярно просматривать и обновлять файл robots.txt, чтобы убедиться, что он по-прежнему соответствует потребностям вашего веб-сайта.

  4. Изучите поддержку поисковых систем: разные поисковые системы могут иметь разный уровень поддержки файлов robots.txt, поэтому вам необходимо учитывать это при написании своих правил.

  5. Используйте инструменты обнаружения: вы можете использовать различные онлайн-инструменты для определения правильности синтаксиса и логики файла robots.txt, чтобы гарантировать, что поисковые системы смогут правильно понимать и применять эти правила.

Если у вас есть вопросы по созданию и работе сайтов внешней торговли, свяжитесь со службой технической поддержки клиентов Yiyingbao WeChat: Ieyingbao18661939702, и сотрудники ответят вам искренне!

20240103114403854.jpg


Ресурсы изображений взяты из Интернета. Если есть какие-либо нарушения, пожалуйста, свяжитесь с нами по телефону 400-655-2477.


Онлайн сообщение

Похожие рекомендации