Обсудим ваш проект?
15 лет опыта
70+
Комплексный интернет-маркетинг
15 лет опыта | 70+ специалистов
Отправить заявку

Руководство по созданию файла карты сайта – sitemap.xml

Дарья Иванова,
редактор
Наталья Штанюк,
руководитель отдела SEO-продвижения
Поделиться
Просмотров:
1186
Время на прочтение:
Статья обновлена:
7 мая 2021
Информация о статье
Просмотров: 1186
Время на прочтение:
Статья обновлена: 07.05.2021
Дарья Иванова, редактор
Наталья Штанюк, руководитель отдела SEO-продвижения
Поделиться

Файл карты сайта – sitemap.xml, призван упростить навигацию поисковым краулерам по страницам ресурса. Разберем основные способы создания этого файла и его настройки.

Директ Лайн
Кто мы
Крупнейшее агентство
интернет-маркетинга за МКАДом:
1200+ проектов
70 специалистов
15 лет на рынке
ТОП-10
лучших компаний интернет-продвижения России 2020
Коммерческое предложение

Предназначение sitemap.xml

Sitemap.xml – файл, созданный вручную или автоматически, предназначенный для поисковых краулеров и предоставляющий им информацию о структуре сайта. В нем содержатся URL-адреса страниц, а также дополнительные данные по ним:

  • Дата создания.
  • Дата изменения.
  • Приоритет на индексацию страницы.
  • Частота обновления.

К слову, перед началом сканирования, поисковый робот первым делом посещает файл robots.txt, а после sitemap.xml.

Сайтмап поможет в следующих ситуациях:

  • Сайт имеет сложную структуру, большое количество вложенных подкатегорий. В таком случае, робот может очень долго «добираться» до страниц низшего уровня.
  • Сайт имеет большое количество документов. На сканирование выделяется определенный краулинговый бюджет – лимит по количеству страниц, которое краулер индексирует за определенный временной промежуток. Если на сайте много URL-адресов, то часть из них может остаться «незамеченной» роботом. В этом случае, карта сайта позволяет выставить им приоритет индексации (если это нужно) относительно остальных документов, а также указать их адреса, в принципе.
  • У сайта нет четкой структуры, страницы при этом перелинкованы в хаотичном порядке.
  • Имеются страницы, на которые отсутствуют прямые ссылки с других документов. Подобное лучше не допускать, но если по каким-либо причинам такие страницы есть, и требуется их индексация, то указываем это в карте сайта.
  • Ускорение сканирования. В sitemap можно указать дату создания или изменения страницы, тем самым, у робота будет информация о тех документах, которые необходимо проиндексировать в первую очередь.
  • Созданные страницы регулярно обновляются.
  • Сайт недавно запустился.

Можно ли обойтись без sitemap.xml?

Наличие файла карты сайта носит рекомендательный характер. Так, в панели Яндекс.Вебмастера, при его отсутствии, появляется уведомление в разделе «возможные проблемы».

Конечно, если данный файл отсутствует, то в большинстве случаев, краулеры всеравно будут корректно индексировать сайт. Однако, если на ресурсе проводится комплексное SEO-продвижение, а от его успеха зависит коммерческая составляющая бизнеса, то рекомендуется все же создать и настроить sitemap.xml.

Способы создания карты сайта

А теперь рассмотрим основные способы создания sitemap.xml.

Создание вручную

Корректный Sitemap.xml представляет собой текстовый файл, структура которого заполнена с соблюдением определенного синтаксиса. Поэтому, если сайт небольшой и редко обновляется, то можно создать файл карты вручную, соблюдая правила – о синтаксисе речь пойдет ниже.

Данный способ нецелесообразно использовать на ресурсах с большим количеством страниц и частым их обновлением.

Создание файла в онлайн-сервисах и программах

Это также простой способ создания sitemap.xml: переходим на сервис, указываем URL сайта, запускаем генерацию и скачиваем готовый файл.

Для примера возьмем популярный генератор Xml-sitemaps.com. Вбиваем URL сайт, для которого генерируется карта. При этом сервис уведомляет о том, что в бесплатной версии будет просканировано не более 500 страниц. После запускаем процесс сканирования и создания файла.

Генератор карты сайта Xml-sitemaps.com
Генератор карты сайта Xml-sitemaps.com

По окончанию процесса, будет предложено скачать готовый файл.

Смотрим готовый файл
Смотрим готовый файл

Аналогичным способом создается файл в десктопных программах:

  • SiteMap XML Dynamic.
  • WonderWebWare.
  • Screaming Frog SEO Spider.

Минусом такого способа создания файла является то, что его постоянно придется обновлять вручную. Т.е., если на сайте появляются новые страницы, файл следует генерировать по новой, либо теряется смысл его использования. Это крайне неудобно, когда сайт активно развивается.

Использование плагинов для CMS

Большинство популярных CMS уже имеют готовые плагины, позволяющие создавать правильный файл sitemap.xml. Для Wordpress можно порекомендовать следующие:

  • Google XML Sitemaps. Бесплатный плагин с простыми настройками. Позволяет настраивать исключения для URL-адресов.
  • Yoast SEO включает в себя целый инструментарий для комплексного SEO-продвижения, в том числе и возможность автоматического создания карты сайта.
  • Rank Math.

В репозитории Вордпресса находятся десятки плагинов аналогичных перечисленным.

Для сайтов на 1С-Битрикс не требуется установки дополнительных компонентов, т.к. уже имеется встроенный инструмент. Доступен он в настройках: «Маркетинг – Настройка sitemap.xml».

Если сайт на Joomla, то стоит обратить внимание на плагины OSMap и jSitemap.

Главное преимущество данного способа создания карты является то, что она сгенерируется автоматически при появлении новых документов на сайте. Т.е., плагин настраивается один раз, а после все работает без участия вебмастера.

Синтаксис sitemap.xml

Синтаксис файла sitemap.xml содержит в себе следующие блоки:

  • Все содержимое файла должно находится в тегах <urlset> </urlset>.
  • Вся информация о странице, в том числе ее URL-адрес, должны находиться в блоке <url></url>.
  • При этом URL-адрес располагается в родительском теге <loc>.

А теперь разберем теги, которые могут быть в sitemap.xml.

Теги, которые должны присутствовать в файле обязательно:

  • <urlset> – содержит стандарт протокола.
  • <url> – блок, с информацией по URL-адресу.
  • <loc> – URL страницы, при этом он должен начинаться с указания протокола соединения HTTP. Ограничения по длине: 2048 символов.

Дополнительные теги:

  • <lastmod> – здесь указывается время последнего изменения страницы. При этом дата должна быть в формате W3C Datetime.
  • <changefreq> – если страница обновляется регулярно или не обновляется вовсе, то эта информация располагается здесь. Значение приблизительное, указывается в текстовом виде:
    • Always – обозначает то, что содержимое страницы обновляется при каждой загрузке.
    • Hourly – каждый час.
    • Daily – ежедневно.
    • Weekly – раз в неделю.
    • Monthly – ежемесячно.
    • Yearly – раз в год.
    • Never – никогда.

Это не прямая команда к действию, она выступает в роли подсказки для поискового краулера. К примеру, если в этом теге указано, что страница обновляется каждый день, робот может посещать ее чаще или реже. То же самое касается страниц, у которых в теге указано как «никогда», краулеры все же их могут периодически посещать.

  • <priority> – указывается приоритетность конкретной страницы относительно остальных. Значение может быть от 0.0 до 1.0 – чем выше, тем приоритетнее страница. По умолчанию, оно равно 0.5. Этот тег позволяет повысить вероятность индексации отдельно взятых страниц, но не влияет на их ранжирование в поисковых системах.

К этому тегу следует относиться как к инструменту, позволяющему определить очередность индексации страниц.

Требования к файлу

Кроме соблюдения правил синтаксиса, файл sitemap.xml должен соответствовать следующим техническим требованиям:

  • Должен быть сохранен в кодировке UTM-8.
  • Кириллица в URL-адресах может быть указана как в оригинальном виде, так и в зашифрованном.
  • В файле должно быть не более 50 тыс. URL-адресов. Если этого лимита не хватает, то создаются несколько файлов и передаются в объединяющий файл карты. При этом он имеет такое же ограничение на 50 тыс. ссылок на файлы карт.
  • Предельный размер файла – 50 МБ. При этом допускается дополнительное сжатие с применением технологии gzip. Не забываем про лимит в 50 тыс. URL-адресов.
  • Файл должен размещаться на том же домене, что и сайт.
  • При запросах к файлу, сервер должен возвращать код ответа 200.
  • Файл должен быть доступен для индексирования, обязательно следует проверять robots.txt на отсутствие подобного запрета.

При этом Яндекс поддерживает не только XML, но и TXT-формат. Однако, для Google эта функция недоступна. К тому же, формат TXT позволяет передавать исключительно URL-адреса страниц без дополнительных параметров.

Как сообщить о файле поисковикам?

Файл sitemap.xml находится в корне сайта, поисковый краулер способен самостоятельно его найти. Но рекомендуется указать его расположение в панелях Вебмастеров Яндекса и Google.

Указываем расположение sitemap.xml  в Яндекс.Вебмастере
Указываем расположение sitemap.xml в Яндекс.Вебмастере

Добавляем файл в Google Search Console
Добавляем файл в Google Search Console

Также указать расположение данного файла можно в robots.txt:

Sitemap: https://mysite.com/sitemap.xml

Яндекс Вебмастер позволяет проверить файл карты сайта на наличие/отсутствие ошибок. Инструмент расположен по адресу: «Инструменты – Анализ файлов sitemap.xml». В открывшееся окно можно загрузить файл, указать до него путь или скопировать его содержимое в инструмент.

В Google Search Console чтобы найти ошибки, необходимо загрузить файл, отправить его на проверку и после ознакомиться с результатами.

Пример sitemap.xml

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>http://www.musite.com/</loc>
      <lastmod>2021-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>1.0</priority>
   </url>
   <url>
      <loc>http://www.musite.com/1.html</loc>
      <lastmod>2021-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>
   <url>
      <loc>http://www.mysite.com/2.html</loc>
      <lastmod>2021-02-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.7</priority>
   </url>
</urlset>

Пример заполненного sitemap.xml с тремя URL-адресами, остальное содержимое заполняется по аналогии.


Комментарии
ДОБАВИТЬ КОММЕНТАРИЙ
Увеличим ваши продажи через интернет!
Разрабатываем и поддерживаем сайты. Приводим на сайт целевой трафик с помощью SEO и рекламы. Увеличиваем конверсию сайтов. Имеем успешные кейсы увеличения продаж интернет-магазинов, медицинских центров, производителей, застройщиков, автоцентров, интернет-сервисов и пр. В команде 33 специалиста.

в топ-10 в SEO глазами клиентов 2014, 2016, 2017

3 место
«SEO глазами клиентов»

19 место
В топ-100 perfomance-агентств России

9 место в Топ-100 SEO-компаний России

9 место
В топ-100 SEO-
компаний России

1 место
Рейтинг агентств контекстной рекламы Новосибирска

Золотая сотня
Российского Digital

Сертифицированное агентство Яндекс 2020

Работающие инструменты SEO, интернет–рекламы, UX от
60 профессионалов
Директ Лайн — агентство интернет–маркетинга с 15-летним опытом, 1200+ клиентами и 50+ специалистами. Мы сами ведем этот блог. Раз в месяц пришлём самые интересные и полезные материалы.
  • #SEO
  • #интернет-реклама
  • #email-рассылки
  • #юзабилити сайта
  • #веб–разработка на bitrix
  • #кейсы
60 профессионалов
Раз в месяц
Без спама и СМС