Появление дублей страниц создает дополнительные сложности при SEO-продвижении сайта. Чтобы этого избежать, рекомендуется использовать атрибут rel=”canonical”, который указывает поисковику URL-адрес приоритетной страницы. Рассказываем, что такое канонические ссылки и как их правильно использовать.
Что такое rel=”canonical” и случаи его использования?
Работа некоторых движков или специфика самих ресурсов приводят к тому, что появляются страницы по разным URL-адресам, но со схожим (или одинаковым) контентом. По факту, это разные страницы, но поисковиком воспринимаются как дубли, и ему нет смысла их все добавлять в органическую выдачу. Поэтому алгоритмы ранжирования пробуют самостоятельно определить каноническую (основную/приоритетную) страницу и делают это не всегда верно.
Чтобы указать каноническую страницу, используют специальный атрибут canonical, в котором содержится ссылка на нее.
Примеры из практики, в которых определенно требуется указание канонических ссылок:
- Если по какой-то причине происходит добавление параметров в конец URL и у страниц при этом одинаковое (максимально схожее) содержимое.
- Страница доступна из разных частей сайта и у нее меняется URL-адрес. Например, ей присвоены две (или более) категории, архивы, поиск по сайту и прочее. Часто такую проблему пытаются решить с помощью 301-редиректа, однако наиболее логичным вариантом будет обозначить канонический адрес страницы.
- При использовании фильтров, сортировок и т.д. Этим грешат интернет-магазины, когда один и тот же товар, но с разными характеристиками имеет разные страницы. Та же история с фильтрами, когда каждый из них имеет свой уникальный URL.
- Страницы пагинации на блогах часто содержат в себе дублированный контент. Иногда их пытаются принудительно закрыть от индексации, но это в корне не верно. Лучше применить атрибут canonical, определив приоритетной страницей ту, на которой содержится весь список товаров/постов.
- Если на страницах схожий или одинаковый контент.
Способы применения rel=”canonical”
Существуют несколько основных вариантов применения тега canonical.
HTML-код
К примеру, имеется два URL-адреса страницы: page1.html?cat=1 и /cat1/page1.html. Если адрес «/cat1/page1.html» является каноническим, то в код первой страницы необходимо прописать следующую строчку:
<link rel="canonical" href="https://URL.ru/cat1/page1.html "/>
Отсюда следует, что страница, имеющая в своем HTML-коде атрибут rel=»canonical» (если при этом ссылка ведет не на саму себя), является неканонической. Рекомендуется использовать абсолютные ссылки, указывая домен.
HTTP-заголовок
Вариант подходит для определения первоисточника какого-либо файла (не HTML страниц). Для примера возьмем сайт с документом .DOCX, который доступен по адресу: /cat1/DOC.docs и /cat2/DOC.docs, в роли канонического выступает первый. Далее необходимо настроить сервер таким образом, чтобы передавался в HTTP-заголовок неканонической страницы данный тег:
Link: <http://URL.ru/cat2/DOC.docs>; rel=»canonical»
Плагины для CMS
Практически все популярные CMS имеют готовые плагины, автоматически проставляющие атрибут canonical на страницы дублей. Для WordPress таких плагинов существует много, к примеру, Yoast SEO. Joomla 3+ эту функцию имеет «из коробки», достаточно включить SEF в настройках.
Проанализируйте sitemap.xml
Для Google факт наличия страницы в карте сайта является признаком каноничности. Поэтому важно позаботиться о том, чтобы туда добавлялись исключительно страницы, участвующие в поисковой выдаче.
Проверка правильности настройки канонического адреса
Сделать это можно двумя способами: ручным и через программу Screaming Frog SEO Spider.
Ручной
Достаточно открыть интересующую страницу и посмотреть в ее HTML-коде наличие тега canonical.
Просмотр кода страницы
Ищем в HTML-коде
Screaming Frog SEO Spider
Ручной способ не подходит, если нужно проверить сайт с большим количеством страниц. Для этого воспользуемся программой Screaming Frog SEO Spider, она покажет страницы с атрибутом rel=”canonical”, на какие страницы ведут канонические ссылки и страницы без данного атрибута.
1. Делаем предварительные настройки краулера – включаем опцию сканирования канонических страниц.
Настройки Screaming Frog SEO Spider
Включаем сканирование канонических страниц
2. Запускаем сканирование сайта.
Сканирование сайта
3. В разделе «Canonicals» отображается список URL-адресов сайта (столбец Address) и указанные их Canonical-страниц (Canonical Link Element 1). К слову, столбцы можно перемещать.
Получаем список URL-адресов сайта
Часто встречающиеся ошибки при использовании rel=“canonical”
- Каноническая страница должна быть доступна, адрес не должен отдавать 4xx или 5xx-ошибку, либо атрибут игнорируется.
- Разрешается указывать относительный URL, однако так проще допустить критичную ошибку.
- Каноническая страница не должна быть закрытой от индексации.
- Не прописывайте атрибут каноникал со внутренних страниц пагинации на первую.
- Ошибочное расположение атрибута, например, в блоке <body>. Напомним, данный атрибут должен прописываться в <HEAD>.
- Регистр имеет значение, рекомендуется использовать нижний.
- Запрещается указывать более одной канонической ссылки на странице. В противном случае, они все игнорируются.
- Не добавляйте в карту сайта неканонические URL-адреса (особенно актуально для Google).
- Допустима схема, когда дубликаты имеют каноническую ссылку на страницу-первоисточник. Нельзя при этом выстраивать цепочку, когда страница-первоисточник ссылается на другую через атрибут canonical.
- Следует понимать разницу между принципами работы canonical и 301-редиректом. Заключается она в том, что при использовании canonical, поисковику указывается URL-первоисточник, при этом работа дубликата не нарушается. А при 301 редиректе происходит физическое перенаправление (как пользователей, так и ботов) на другую страницу, говоря о том, что страница-первоисточник уже неактуальна.
- Т.к. атрибут носит рекомендательный характер, то при существенной разнице в содержимом между страницами, поисковик может проигнорировать указание на канонический адрес и проиндексировать их все.
- При использовании с тегом noindex могут возникнуть проблемы. Нужно помнить, что в таком случае будет учитываться только canonical.
- Недопустимо перенаправление с канонической страницы на другую. Иными словами, канонический адрес должен быть конечен.
Как вернуть неканоническую страницу в поиск?
Возникают ситуации, когда страница признается неканонической и удаляется из поисковой выдачи. Скорее всего, она имеет прописанный атрибут rel=»canonical» в котором указан канонический адрес. Для возврата подобной страницы в органическую выдачу, достаточно удалить данный атрибут и при следующем обновлении поисковой выдачи она там появится.
Увидеть список неканонических страниц можно в панели Яндекс.Вебмастер: «Индексирование – Страницы в поиске – Исключенные».
Просмотр неканонических страниц в панели Яндекс.Вебмастера
В общем списке исключенных страниц будут представлены и неканонические, с соответствующим примечанием.
* Meta Platforms Inc. (и принадлежащие ей соц.сети Instagram, Facebook) признана экстремистской организацией, ее деятельность в России запрещена.