SEO

Подробное руководство по rel=”canonical”

# техническое SEO

7314

Появление дублей страниц создает дополнительные сложности при SEO-продвижении сайта. Чтобы этого избежать, рекомендуется использовать атрибут rel=”canonical”, который указывает поисковику URL-адрес приоритетной страницы. Рассказываем, что такое канонические ссылки и как их правильно использовать.

Что такое rel=”canonical” и случаи его использования?
Способы применения rel=”canonical”
Проверка правильности настройки канонического адреса
- Ручной
- Screaming Frog SEO Spider
Часто встречающиеся ошибки при использовании rel=“canonical”
Как вернуть неканоническую страницу в поиск?

Что такое rel=”canonical” и случаи его использования?

Работа некоторых движков или специфика самих ресурсов приводят к тому, что появляются страницы по разным URL-адресам, но со схожим (или одинаковым) контентом. По факту, это разные страницы, но поисковиком воспринимаются как дубли, и ему нет смысла их все добавлять в органическую выдачу. Поэтому алгоритмы ранжирования пробуют самостоятельно определить каноническую (основную/приоритетную) страницу и делают это не всегда верно.

Чтобы указать каноническую страницу, используют специальный атрибут canonical, в котором содержится ссылка на нее.

Примеры из практики, в которых определенно требуется указание канонических ссылок:

Если по какой-то причине происходит добавление параметров в конец URL и у страниц при этом одинаковое (максимально схожее) содержимое.
Страница доступна из разных частей сайта и у нее меняется URL-адрес. Например, ей присвоены две (или более) категории, архивы, поиск по сайту и прочее. Часто такую проблему пытаются решить с помощью 301-редиректа, однако наиболее логичным вариантом будет обозначить канонический адрес страницы.
При использовании фильтров, сортировок и т.д. Этим грешат интернет-магазины, когда один и тот же товар, но с разными характеристиками имеет разные страницы. Та же история с фильтрами, когда каждый из них имеет свой уникальный URL.
Страницы пагинации на блогах часто содержат в себе дублированный контент. Иногда их пытаются принудительно закрыть от индексации, но это в корне не верно. Лучше применить атрибут canonical, определив приоритетной страницей ту, на которой содержится весь список товаров/постов.
Если на страницах схожий или одинаковый контент.

Способы применения rel=”canonical”

Существуют несколько основных вариантов применения тега canonical.

HTML-код

К примеру, имеется два URL-адреса страницы: page1.html?cat=1 и /cat1/page1.html. Если адрес «/cat1/page1.html» является каноническим, то в код первой страницы необходимо прописать следующую строчку:

<link rel="canonical" href="https://URL.ru/cat1/page1.html "/>

Отсюда следует, что страница, имеющая в своем HTML-коде атрибут rel=»canonical» (если при этом ссылка ведет не на саму себя), является неканонической. Рекомендуется использовать абсолютные ссылки, указывая домен.

HTTP-заголовок

Вариант подходит для определения первоисточника какого-либо файла (не HTML страниц). Для примера возьмем сайт с документом .DOCX, который доступен по адресу: /cat1/DOC.docs и /cat2/DOC.docs, в роли канонического выступает первый. Далее необходимо настроить сервер таким образом, чтобы передавался в HTTP-заголовок неканонической страницы данный тег:

Link: <http://URL.ru/cat2/DOC.docs>; rel=»canonical»

Плагины для CMS

Практически все популярные CMS имеют готовые плагины, автоматически проставляющие атрибут canonical на страницы дублей. Для WordPress таких плагинов существует много, к примеру, Yoast SEO. Joomla 3+ эту функцию имеет «из коробки», достаточно включить SEF в настройках.

Проанализируйте sitemap.xml

Для Google факт наличия страницы в карте сайта является признаком каноничности. Поэтому важно позаботиться о том, чтобы туда добавлялись исключительно страницы, участвующие в поисковой выдаче.

Проверка правильности настройки канонического адреса

Сделать это можно двумя способами: ручным и через программу Screaming Frog SEO Spider.

Ручной

Достаточно открыть интересующую страницу и посмотреть в ее HTML-коде наличие тега canonical.

Просмотр кода страницы

Ищем в HTML-коде

Screaming Frog SEO Spider

Ручной способ не подходит, если нужно проверить сайт с большим количеством страниц. Для этого воспользуемся программой Screaming Frog SEO Spider, она покажет страницы с атрибутом rel=”canonical”, на какие страницы ведут канонические ссылки и страницы без данного атрибута.

1. Делаем предварительные настройки краулера – включаем опцию сканирования канонических страниц.

Настройки Screaming Frog SEO Spider

Включаем сканирование канонических страниц

2. Запускаем сканирование сайта.

Сканирование сайта

3. В разделе «Canonicals» отображается список URL-адресов сайта (столбец Address) и указанные их Canonical-страниц (Canonical Link Element 1). К слову, столбцы можно перемещать.

Получаем список URL-адресов сайта

Часто встречающиеся ошибки при использовании rel=“canonical”

Каноническая страница должна быть доступна, адрес не должен отдавать 4xx или 5xx-ошибку, либо атрибут игнорируется.
Разрешается указывать относительный URL, однако так проще допустить критичную ошибку.
Каноническая страница не должна быть закрытой от индексации.
Не прописывайте атрибут каноникал со внутренних страниц пагинации на первую.
Ошибочное расположение атрибута, например, в блоке <body>. Напомним, данный атрибут должен прописываться в <HEAD>.
Регистр имеет значение, рекомендуется использовать нижний.
Запрещается указывать более одной канонической ссылки на странице. В противном случае, они все игнорируются.
Не добавляйте в карту сайта неканонические URL-адреса (особенно актуально для Google).
Допустима схема, когда дубликаты имеют каноническую ссылку на страницу-первоисточник. Нельзя при этом выстраивать цепочку, когда страница-первоисточник ссылается на другую через атрибут canonical.
Следует понимать разницу между принципами работы canonical и 301-редиректом. Заключается она в том, что при использовании canonical, поисковику указывается URL-первоисточник, при этом работа дубликата не нарушается. А при 301 редиректе происходит физическое перенаправление (как пользователей, так и ботов) на другую страницу, говоря о том, что страница-первоисточник уже неактуальна.
Т.к. атрибут носит рекомендательный характер, то при существенной разнице в содержимом между страницами, поисковик может проигнорировать указание на канонический адрес и проиндексировать их все.
При использовании с тегом noindex могут возникнуть проблемы. Нужно помнить, что в таком случае будет учитываться только canonical.
Недопустимо перенаправление с канонической страницы на другую. Иными словами, канонический адрес должен быть конечен.

Как вернуть неканоническую страницу в поиск?

Возникают ситуации, когда страница признается неканонической и удаляется из поисковой выдачи. Скорее всего, она имеет прописанный атрибут rel=»canonical» в котором указан канонический адрес. Для возврата подобной страницы в органическую выдачу, достаточно удалить данный атрибут и при следующем обновлении поисковой выдачи она там появится.

Увидеть список неканонических страниц можно в панели Яндекс.Вебмастер: «Индексирование – Страницы в поиске – Исключенные».

Просмотр неканонических страниц в панели Яндекс.Вебмастера

В общем списке исключенных страниц будут представлены и неканонические, с соответствующим примечанием.

Правильное использование атрибута rel=»canonical», позволяет помочь в SEO-специалисту с продвижением сайта, улучшив качество его индексации. А игнорирование этого инструмента, напротив может привести к тому, что в индексе появятся схожие по содержанию страницы, как итог, ни одна из них не займет ТОП выдачи.

* Meta Platforms Inc. (и принадлежащие ей соц.сети Instagram, Facebook) признана экстремистской организацией, ее деятельность в России запрещена.

Оставить комментарий