Обсудим ваш проект?
Комплексный интернет-маркетинг
15 лет опыта | 90+ специалистов
Отправить заявку

Руководство по созданию файла карты сайта – sitemap.xml

Обновлено: 07 мая 2021
Время на прочтение:
Просмотров: 4171
Дарья Иванова
редактор
Наталья Штанюк
технический директор
Редполитика
Мы прилагаем все усилия, чтобы наши обзоры были максимально честными, точными и объективными. Если вы посещаете ссылки в нашем контенте, мы можем получить комиссионное вознаграждение от ваших покупок, однако это не влияет на нашу редакционную политику и мы не станем рекомендовать продукты или сервисы, в которых не уверены.

Файл карты сайта – sitemap.xml, призван упростить навигацию поисковым краулерам по страницам ресурса. Разберем основные способы создания этого файла и его настройки.

Предназначение sitemap.xml

Sitemap.xml – файл, созданный вручную или автоматически, предназначенный для поисковых краулеров и предоставляющий им информацию о структуре сайта. В нем содержатся URL-адреса страниц, а также дополнительные данные по ним:

  • Дата создания.
  • Дата изменения.
  • Приоритет на индексацию страницы.
  • Частота обновления.

К слову, перед началом сканирования, поисковый робот первым делом посещает файл robots.txt, а после sitemap.xml.

Сайтмап поможет в следующих ситуациях:

  • Сайт имеет сложную структуру, большое количество вложенных подкатегорий. В таком случае, робот может очень долго «добираться» до страниц низшего уровня.
  • Сайт имеет большое количество документов. На сканирование выделяется определенный краулинговый бюджет – лимит по количеству страниц, которое краулер индексирует за определенный временной промежуток. Если на сайте много URL-адресов, то часть из них может остаться «незамеченной» роботом. В этом случае, карта сайта позволяет выставить им приоритет индексации (если это нужно) относительно остальных документов, а также указать их адреса, в принципе.
  • У сайта нет четкой структуры, страницы при этом перелинкованы в хаотичном порядке.
  • Имеются страницы, на которые отсутствуют прямые ссылки с других документов. Подобное лучше не допускать, но если по каким-либо причинам такие страницы есть, и требуется их индексация, то указываем это в карте сайта.
  • Ускорение сканирования. В sitemap можно указать дату создания или изменения страницы, тем самым, у робота будет информация о тех документах, которые необходимо проиндексировать в первую очередь.
  • Созданные страницы регулярно обновляются.
  • Сайт недавно запустился.
Нет времени разбираться?
Комплексное продвижение в онлайне
Разрабатываем стратегии продвижения бизнеса в онлайне с пошаговым планом действий, и обеспечиваем его реализацию. Проектируем, реализуем, поддерживаем и развиваем сайты, приводим на сайт целевой трафик (реклама, SEO, email-рассылки), расширяем присутствие компании на сторонних площадках, настраиваем аналитику и проводим постклик анализ.
Ваш сайт:

Можно ли обойтись без sitemap.xml?

Наличие файла карты сайта носит рекомендательный характер. Так, в панели Яндекс.Вебмастера, при его отсутствии, появляется уведомление в разделе «возможные проблемы».

Конечно, если данный файл отсутствует, то в большинстве случаев, краулеры всеравно будут корректно индексировать сайт. Однако, если на ресурсе проводится комплексное SEO-продвижение, а от его успеха зависит коммерческая составляющая бизнеса, то рекомендуется все же создать и настроить sitemap.xml.

Способы создания карты сайта

А теперь рассмотрим основные способы создания sitemap.xml.

Создание вручную

Корректный Sitemap.xml представляет собой текстовый файл, структура которого заполнена с соблюдением определенного синтаксиса. Поэтому, если сайт небольшой и редко обновляется, то можно создать файл карты вручную, соблюдая правила – о синтаксисе речь пойдет ниже.

Данный способ нецелесообразно использовать на ресурсах с большим количеством страниц и частым их обновлением.

Создание файла в онлайн-сервисах и программах

Это также простой способ создания sitemap.xml: переходим на сервис, указываем URL сайта, запускаем генерацию и скачиваем готовый файл.

Для примера возьмем популярный генератор Xml-sitemaps.com. Вбиваем URL сайт, для которого генерируется карта. При этом сервис уведомляет о том, что в бесплатной версии будет просканировано не более 500 страниц. После запускаем процесс сканирования и создания файла.

Привлекли 35.000.000 людей на 185 сайтов
Мы точно знаем, как увеличить онлайн–продажи
Применяем лучшие практики digital–продвижения как из вашей тематики, так и из смежных областей бизнеса. Именно это сделает вас на голову выше конкурентов и принесёт лиды и продажи.
Ваш сайт:

Генератор карты сайта Xml-sitemaps.com
Генератор карты сайта Xml-sitemaps.com

По окончанию процесса, будет предложено скачать готовый файл.

Смотрим готовый файл
Смотрим готовый файл

Аналогичным способом создается файл в десктопных программах:

  • SiteMap XML Dynamic.
  • WonderWebWare.
  • Screaming Frog SEO Spider.

Минусом такого способа создания файла является то, что его постоянно придется обновлять вручную. Т.е., если на сайте появляются новые страницы, файл следует генерировать по новой, либо теряется смысл его использования. Это крайне неудобно, когда сайт активно развивается.

Использование плагинов для CMS

Большинство популярных CMS уже имеют готовые плагины, позволяющие создавать правильный файл sitemap.xml. Для WordPress можно порекомендовать следующие:

  • Google XML Sitemaps. Бесплатный плагин с простыми настройками. Позволяет настраивать исключения для URL-адресов.
  • Yoast SEO включает в себя целый инструментарий для комплексного SEO-продвижения, в том числе и возможность автоматического создания карты сайта.
  • Rank Math.

В репозитории Вордпресса находятся десятки плагинов аналогичных перечисленным.

Для сайтов на 1С-Битрикс не требуется установки дополнительных компонентов, т.к. уже имеется встроенный инструмент. Доступен он в настройках: «Маркетинг – Настройка sitemap.xml».

Если сайт на Joomla, то стоит обратить внимание на плагины OSMap и jSitemap.

Главное преимущество данного способа создания карты является то, что она сгенерируется автоматически при появлении новых документов на сайте. Т.е., плагин настраивается один раз, а после все работает без участия вебмастера.

Синтаксис sitemap.xml

Синтаксис файла sitemap.xml содержит в себе следующие блоки:

  • Все содержимое файла должно находится в тегах <urlset> </urlset>.
  • Вся информация о странице, в том числе ее URL-адрес, должны находиться в блоке <url></url>.
  • При этом URL-адрес располагается в родительском теге <loc>.

А теперь разберем теги, которые могут быть в sitemap.xml.

Теги, которые должны присутствовать в файле обязательно:

  • <urlset> – содержит стандарт протокола.
  • <url> – блок, с информацией по URL-адресу.
  • <loc> – URL страницы, при этом он должен начинаться с указания протокола соединения HTTP. Ограничения по длине: 2048 символов.

Дополнительные теги:

  • <lastmod> – здесь указывается время последнего изменения страницы. При этом дата должна быть в формате W3C Datetime.
  • <changefreq> – если страница обновляется регулярно или не обновляется вовсе, то эта информация располагается здесь. Значение приблизительное, указывается в текстовом виде:
    • Always – обозначает то, что содержимое страницы обновляется при каждой загрузке.
    • Hourly – каждый час.
    • Daily – ежедневно.
    • Weekly – раз в неделю.
    • Monthly – ежемесячно.
    • Yearly – раз в год.
    • Never – никогда.

Это не прямая команда к действию, она выступает в роли подсказки для поискового краулера. К примеру, если в этом теге указано, что страница обновляется каждый день, робот может посещать ее чаще или реже. То же самое касается страниц, у которых в теге указано как «никогда», краулеры все же их могут периодически посещать.

  • <priority> – указывается приоритетность конкретной страницы относительно остальных. Значение может быть от 0.0 до 1.0 – чем выше, тем приоритетнее страница. По умолчанию, оно равно 0.5. Этот тег позволяет повысить вероятность индексации отдельно взятых страниц, но не влияет на их ранжирование в поисковых системах.

К этому тегу следует относиться как к инструменту, позволяющему определить очередность индексации страниц.

Требования к файлу

Кроме соблюдения правил синтаксиса, файл sitemap.xml должен соответствовать следующим техническим требованиям:

  • Должен быть сохранен в кодировке UTM-8.
  • Кириллица в URL-адресах может быть указана как в оригинальном виде, так и в зашифрованном.
  • В файле должно быть не более 50 тыс. URL-адресов. Если этого лимита не хватает, то создаются несколько файлов и передаются в объединяющий файл карты. При этом он имеет такое же ограничение на 50 тыс. ссылок на файлы карт.
  • Предельный размер файла – 50 МБ. При этом допускается дополнительное сжатие с применением технологии gzip. Не забываем про лимит в 50 тыс. URL-адресов.
  • Файл должен размещаться на том же домене, что и сайт.
  • При запросах к файлу, сервер должен возвращать код ответа 200.
  • Файл должен быть доступен для индексирования, обязательно следует проверять robots.txt на отсутствие подобного запрета.

При этом Яндекс поддерживает не только XML, но и TXT-формат. Однако, для Google эта функция недоступна. К тому же, формат TXT позволяет передавать исключительно URL-адреса страниц без дополнительных параметров.

Как сообщить о файле поисковикам?

Файл sitemap.xml находится в корне сайта, поисковый краулер способен самостоятельно его найти. Но рекомендуется указать его расположение в панелях Вебмастеров Яндекса и Google.

Указываем расположение sitemap.xml  в Яндекс.Вебмастере
Указываем расположение sitemap.xml в Яндекс.Вебмастере

Добавляем файл в Google Search Console
Добавляем файл в Google Search Console

Также указать расположение данного файла можно в robots.txt:

Sitemap: https://mysite.com/sitemap.xml

Яндекс Вебмастер позволяет проверить файл карты сайта на наличие/отсутствие ошибок. Инструмент расположен по адресу: «Инструменты – Анализ файлов sitemap.xml». В открывшееся окно можно загрузить файл, указать до него путь или скопировать его содержимое в инструмент.

В Google Search Console чтобы найти ошибки, необходимо загрузить файл, отправить его на проверку и после ознакомиться с результатами.

Пример sitemap.xml

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>http://www.musite.com/</loc>
      <lastmod>2021-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>1.0</priority>
   </url>
   <url>
      <loc>http://www.musite.com/1.html</loc>
      <lastmod>2021-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>
   <url>
      <loc>http://www.mysite.com/2.html</loc>
      <lastmod>2021-02-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.7</priority>
   </url>
</urlset>

Пример заполненного sitemap.xml с тремя URL-адресами, остальное содержимое заполняется по аналогии.

Методология выбора
Кто мы
Директ Лайн
Крупнейшее региональное интернет-агентство России. ТОП-10 в рейтинге Рунета.
1200 +
проектов
90
экспертов
16лет
на рынке
Наша методология
Статьи в блоге Директ Лайн - это всегда оригинальный, проверенный и объективный контент. Все обзоры и рейтинги честно отражают наше мнение и опыт взаимодействия с каждым инструментом.
Содержание
Комментарии

Комплекс услуг для вашего бизнеса

Проанализируем ваши бизнес-цели, ваш бизнес, продукт и текущие продажи, и подберем варианты онлайн-продвижения, которые дадут лучший эффект. Опираемся на наш опыт в самых разных тематиках, т.к. наилучшее решение часто лежит в иной тематики, но которая решает схожую бизнес-задачу. Наша стратегия - готовый пошаговый план по внедрению, с деталями и референсами.

Кейсы и статьи

Бесплатный аудит SEO
и рекламного трафика
Покажем точки роста вашего проекта,
если по нему уже ведутся работы