Обсудим ваш проект?
Комплексный интернет-маркетинг
17 лет опыта | 90+ специалистов
Отправить заявку

Алгоритм Яндекса Yati

Обновлено: 26 января 2021
Время на прочтение:
Просмотров: 2378
Дарья Иванова
редактор
Наталья Штанюк
технический директор
Редполитика
Мы прилагаем все усилия, чтобы наши обзоры были максимально честными, точными и объективными. Если вы посещаете ссылки в нашем контенте, мы можем получить комиссионное вознаграждение от ваших покупок, однако это не влияет на нашу редакционную политику и мы не станем рекомендовать продукты или сервисы, в которых не уверены.

На конференции YaC 2020 был анонсирован новый алгоритм Яндекса Yati, позволяющий устанавливать смысловые связи между поисковыми запросами и содержимым веб-страницы. Что готовит данное обновления для SEO-специалистов и почему оно считается революционным, ответим на эти вопросы в рамках данной статьи.

Алгоритм Яндекса Yati, что это?

Yati (Yet Another Transformer with Improvements), представляет собой алгоритм, который «понимает» смысл поискового запроса пользователя и содержимого документа сайта. Подобный подход уже реализован в Google в его алгоритме BERT.

Предыдущие версии поисковых алгоритмов Яндекса работали по принципу сопоставления поисковой фразы и ее наличию в тексте веб-документа. Т.е. релевантность страницы определялась по количеству и схожести слов на ней с запросом от пользователя (крайне упрощенный пример, на деле алгоритмы оснащаются большим количеством факторов влияния и рядом математических формул для расчета релевантности).

Начиная с 2016 года появились два новых алгоритма ранжирования:

  • Палех – который, позволял отвечать на сложные запросы, самообучался и находил сложные взаимосвязи между массивами текстовых данных.
  • Королев – доработанная версия Палеха, способная отличать скрытый смысл в тексте, анализируя не только его заголовки, но и весь документ. Содержит обновленный набор индексов и базы формул.
Нет времени разбираться?
SEO-продвижение под ключ
Проанализируем конкурентов, подберем запросы с низкой конкуренцией, проведем поисковую оптимизацию сайта, организуем внешнюю ссылочную массу, проработаем карточки компании на онлайн картах, проведем базовую UX-аналитику сайта. Над каждым проектом работает от 6 до 10 специалистов. Собственные разработчики для доработки сайта при необходимости. От вас — сайт, от нас — позиции в Яндекс/Google и трафик.
Ваш сайт:

Особенности алгоритма

В отличии от предыдущих алгоритмов, основой работы Yati выступают нейронные сети, прошедшие серьезное обучение на реальных ключевых фразах пользователей и открываемых ими страниц. Кроме самообучения, результаты проверяются и дополняются асессорами – специалистами, которые проводят экспертную оценку качества ранжирования текстов.

Алгоритм учится разбивать текстовый документ на зоны, отличающиеся между собой важностью в контексте введенного пользователем запроса. Также для ранжирования отбираются фрагменты текстов из наиболее важных зон, а зоны с наименьшей важностью игнорируются и не оказывают влияние на позиционирование сайта в поисковой выдаче. В случае, если страница содержит малое количество текста, то он весь будет влиять на ранжирование документа.

По заявлениям представителей Yandex, Yati первоначально «обращает внимание» на заголовки документа – они должны быть релевантными определённым пользовательским запросам. Только после того, как это подтвердится, документ целиком начинает учувствовать в ранжировании.

Как и прежде, Яндекс обращает вниманием на количество кликов по сниппету документа в поисковой выдаче. Чем выше CTR, тем вероятнее всего попасть в ТОП по определенному пулу запросов. Однако, значительно улучшилось качество отслеживания накрученных кликов, за данное действие возможны санкции.

Что такое трансформер Yati?

Трансформерами называют сложные и большие нейросети, работа которых направлена на решение задач по обработке и генерации текстов. Это новый виток развития нейросетей, открывающие огромные возможности для различных сфер, в частности, для построения алгоритмов ранжирования поисковых систем.

Теперь поисковый алгоритм может сегментировать элементы текста на части по различным признакам и обрабатывать их по отдельности. В роли элемента выступает слово, знаки пунктуации и прочие последовательности символов. Как отмечалось выше, Yati имеет механизм внимания, благодаря которому отделяются фрагменты входного текста и обрабатываются по отдельности. Например, это позволит понять, какая именно часть текста является действительно важной для пользователей, и включить ее в факторы ранжирования, исключая при этом остальные, малозначительные части. Это позволит существенно очистить поисковую выдачу от документов с низкокачественным содержимым.

Привлекли 35.000.000 людей на 185 сайтов
Мы точно знаем, как увеличить онлайн–продажи
Применяем лучшие практики digital–продвижения как из вашей тематики, так и из смежных областей бизнеса. Именно это сделает вас на голову выше конкурентов и принесёт лиды и продажи.
Ваш сайт:

Последовательность обучения алгоритма:

  1. На основе задач и особенностей ранжирования, сеть учится правилам языка по принципу маскированной языковой модели (Masked Language Model – изначально применялась в алгоритме BERT от Google). Вводными данными выступают пользовательский запрос и заголовок документа, цель подхода – научить алгоритм предсказывать вероятность перехода к документу из поисковой выдачи по заданному ключевому слову.
  2. Следующим этапом выступает дополнительное обучение алгоритма с помощью асессоров. Вначале данные изучают пользователи из сервиса Яндекс Толока. Как можно понять, это низкокачественная оценка релевантности запроса к документу. Для улучшения этих показателей, после пользователей Толока, данные перепроверяются уже специалистами самого Яндекса. В результате этих действий, данные получают определенные оценки релевантности.
  3. После, полученная аналитика и сами данные отправляются на обработку, с целью объединения их в сегменты по определенным признакам. Благодаря сбору конечных метрик, алгоритмом оценивается уровень релевантности документа и пользовательского запроса.

Для расширения семантики документа, Яндексом собираются дополнительные тексты, называемые стримами. Другими словами, стрим страницы – релевантные запросы пользователей, а также анкоры входящих ссылок. Благодаря стримам упрощается эвристический анализ текста, т.к. первоначально не требуется загружать весь текст документа.

При анализе поискового запроса и подготовки органической выдачи в режиме реального времени, для реализации Yati требуется слишком большие вычислительные мощности. Поэтому Яндекс упростил задачу – данные обрабатываются и подготавливаются в оффлайне. От этого незначительно падает качество выдачи, но это не критично в сравнении с прошлыми алгоритмами обработки текстов и ранжирования документов.

Чего ждать от Yati?

По заявлению Яндекса, после внедрения алгоритма, качество ранжирования значительно выросло, Yati является самым значимым нововведением за последнее десятилетие.

Алгоритм научился корректно осуществлять поиск не только по коротким ключевым фразам, но и по целым фрагментам текста. При этом учитываются не только порядок и форма слов, но и контекст введенного запроса, который сопоставляется с изучаемым документом. Такое улучшение позволит алгоритму «понимать» естественность языка, лучше находить семантические связи между словами и т.д.

Поэтому, если смотреть со стороны пользователей поисковика Яндекс, Yati позволит значительно улучшить качество выдачи, теперь сайты будут ранжироваться с максимальным соответствием по смыслу.

Если говорить про SEO-оптимизаторов, то им придется учитывать все тонкости работы алгоритма, в противном случае будет упущена львиная доля поискового трафика.

Советы по SEO-оптимизации под Yati

Первое, что нужно понять, алгоритм довольно-таки хорошо «научился» определять качество текста. Т.е. при подготовке контента, необходимо будет уделить пристальное внимание его качеству и полезности для пользователя. Это говорит о том, что теперь нецелесообразно экономить на копирайтерах, а выбирая их, следует отдавать предпочтения тем, которые досконально разбираются в теме.

Если говорить непосредственно про оптимизацию, то рекомендуется готовить страницы таким образом, чтобы каждая из них отвечала на широкий пул запросов, которые можно взять из различных источников:

  • Из поисковой базы, например, из сервиса Вордстат.
  • Изучив системы аналитики, в частности Яндекс.Метрику, выгрузить оттуда поисковые фразы, по которым на сайт уже приходил трафик.
  • Если на сайте развит внутренний поиск и пользователи активно им пользуются, рекомендуется собирать все запросы из него, они отлично подойдут для расширения семантического ядра.
  • Семантику можно собирать не только из Вордстата, но и обязательно проверив поисковые подсказки.

В целом, приветствуется расширение семантического ядра НЧ-запросами.

Возвращаясь к вопросу качества контента, не забывайте, что алгоритм активно обучается с помощью асессоров. Если текст не отвечает или отвечает слабо поисковому запросу, то документ получит соответствующую оценку и, скорее всего, потеряет позиции.

Если тематика сайта позволяет, то рекомендуется готовить длинные тексты, которые полностью раскрывают суть вопроса, особенно это относится к информационным ресурсам. Помните, Яндекс «любит» лонгриды.

Подготовка заголовков

Как отмечалось выше, Yati особое внимание уделяет заголовкам, точнее перед отправкой документа на изучение, первоначально проверяется релевантность его заголовка с пользовательским запросом. Другими словами, если заголовок не относится по смыслу к ключевой фразе, то документ не учувствует в ранжировании по нему.

Желательно, чтобы основной заголовок содержал в себе ключ (в принципе, так было и раньше), но также важно помнить, что алгоритм «умеет» понимать смысл. Поэтому приветствуется использование синонимов или альтернативных вхождений.

Заголовки и подзаголовки должны быть максимально информативными. Крайне не рекомендуется использовать вхождения ключей в неестественном виде, это однозначно негативно повлияет на ранжирование документа.

Борьба с переспамом

Проверьте страницы сайта на переспам, те из них, которые имеют большое количество вхождений поисковых фраз (предварительно более 3%), будут понижены в результатах выдачи. Этот параметр следует строго отслеживать.

Для проверки переспама можно использовать сервис Advego
Для проверки переспама можно использовать сервис Advego

Те ключевые фразы, которые используются, должны иметь естественный вид.

Оформление контента

Текст должен быть визуально поделен на составляющие, иметь заголовки и подзаголовки, списки, таблицы и т.д. Следует использовать все то, что позволит структурировать его и облегчит восприятие информации пользователем. Особенно это относится к лонгридам – вряд ли длинная неструктурированная «простыня» попадет в ТОП выдачи.

Если говорить про организацию структуры документа, старайтесь использовать блоки (блок – подзаголовок + текст, относящийся к нему) средней длины, до 12-15 предложений.

Сниппеты

Не забываем про заполнение мета-тега title, часто именно он берется для сниппета
Не забываем про заполнение мета-тега title, часто именно он берется для сниппета

Поведенческие факторы и раньше имели серьезное значение на качество ранжирования, но теперь это выходит на новый уровень. Первое знакомство пользователя с ресурсом начинается со сниппета. Алгоритм отслеживает на сколько он привлекателен, оценивает его CTR.

Заголовок сниппета часто берется из мета-тега title. Желательно, чтобы он был не более 60 символов длиной, уникальным (в рамках одного сайта) и отличался бы от заголовка H1. В некоторых случаях в качестве заголовка сниппета выбирается другая часть контента на странице – все зависит от того, что именно алгоритм посчитает релевантным. Помимо title, в роли заголовка может выступить тег H1.

Аналитика конкурентов

Обязательно просматривайте поисковую выдачу и изучайте конкурентов, цель – найти причины, по которым они находятся выше вас. В качестве точек изучения могут быть: количество и общий вид ключевых вхождений в тексте, структура документа, охват семантического ядра и т.д. Также не стоит забывать про ссылочную массу, качество доноров и прочее.

Главная рекомендация

Если с технической частью страницы порядок (имеется релевантный запросам, и при этом информативный, заголовок, текст хорошо структурирован, написан без ошибок и содержит в себе исключительно качественную и полезную информацию), то обязательно загляните в список рекомендаций для асессоров. Найти их можно на сайте Яндекс.Толока. Это позволит по-иному взглянуть на оптимизацию сайта, понять все нюансы продвижения и оценки его качества специалистами сервиса.

Алгоритм Yati однозначно внесет существенные коррективы в организацию поисковой выдачи, и сферы SEO-оптимизации в целом. Продвигать сайты станет гораздо сложнее, «выживут» исключительно качественные ресурсы, помогающие решать пользовательские задачи.

Методология выбора
Кто мы
Директ Лайн
Крупнейшее региональное интернет-агентство России. ТОП-10 в рейтинге Рунета.
1200 +
проектов
90
экспертов
17лет
на рынке
Наша методология
Статьи в блоге Директ Лайн — это всегда оригинальный, проверенный и объективный контент. Все обзоры и рейтинги честно отражают наше мнение и опыт взаимодействия с каждым инструментом.
Содержание
Комментарии

Комплекс услуг для вашего бизнеса

Проанализируем ваши бизнес-цели, ваш бизнес, продукт и текущие продажи, и подберем варианты онлайн-продвижения, которые дадут лучший эффект. Опираемся на наш опыт в самых разных тематиках, т.к. наилучшее решение часто лежит в иной тематики, но которая решает схожую бизнес-задачу. Наша стратегия - готовый пошаговый план по внедрению, с деталями и референсами.

Кейсы и статьи

Бесплатный аудит SEO
и рекламного трафика
Покажем точки роста вашего проекта,
если по нему уже ведутся работы