Анализ текста YATI Яндекс: новая технология и обновление поискового алгоритма
Крупнейший русскоязычный поисковик начал полноценно интегрировать новую технологию, позволяющую более точно соотнести запрос с содержимым документов, а также контентом на страницах сайта. Анализ текста YATI Яндекс построен на работе усовершенствованных нейросетей, функционирующих на основе так называемых трансформеров. С технической частью пока не совсем понятно, как индексация будет происходить на практике; не названы также точные даты полного внедрения методики (ориентировочно – первая половина 2021 года). Тем не менее, с учетом официальной презентации генеральным директором Яндекс Тиграном Худавердяном сего действа на прошедшей совсем недавно конференции YaC 2020 предлагаю более подробно познакомиться с механизмом. Информация является адаптацией различных разрозненных сведений в сети, окажется полезной копирайтерам, seo-специалистам, владельцам сайтов и всем тем, кто интересуется проблематикой подготовки текстов для сайтов.
Что за “трансформеры”? Суть технологии YATI
YATI – это аббревиатура, которая расшифровывается следующим образом: “Yet another transformer with Improvements”. Трансформируемой является методика расшифровки, определения и предугадывания слов. Вариантов в основном применяется два. В первом (классическом) собирается совершенно неструктурированный тематический текст и нейросети предлагается замаскированные внутри ключевые слова. Но это “прошлый век”. Применительно к YATI это практикоориетированный и более точный аналог, когда при обучении алгоритма используются реальные запросы пользователей Яндекс, а также документы и контент на страницах сайта, на которые они переходили и которые их удовлетворяли (судя по окончанию поиска и прочим поведенческим факторам). Предварительно специалисты вручную, а также при помощи специальных асессоров, определяли сложность и релевантность документов, затем обозначали его в специальный формат и разметку (нескольких категорий и сложностей). Интеграция реальных ключевых слов внутрь документа позволяла более качественно обучать нейросеть, которая максимально точно в последующем стала соотносить запрос с документом. В расчет принимается огромный массив данных Яндекс, благодаря которому осуществляется дополнительное обучение алгоритма.
Если конкретизировать информацию о Yati, то это:
- масштабная трансформированная нейросеть;
- самая актуальная методика индексации текста поисковой системой Яндекс (по состоянию на ноябрь 2020 г.);
- значительно более ускоренная методика анализа, обработки контента и обучения алгоритма;
- задача – соотносить запросы с максимально релевантным документом и контентом;
- соотнесение запросов и результатов не только по названию, но и по смыслу (то есть “предугадывание” контекста и намерений пользователя);
- суть – качественный анализ естественного языка (с распознанием машинописного и сгенерированного текста) с последующей выдачей результатов при ранжировании.
Сферы применения YATI
Данное обновление поисковых алгоритмов, по словам, официальных представителей Яндекс, является самым крупным за последние 10 лет. Причем, описываемая технология закладывает фундамент и возможность последующих значимых улучшений на годы вперед. Поэтому если вести речь про масштаб использования, то по сути это фактически весь поиск; только более углубленный и масштабный. Специалисты приводят простой пример для понимания. Ранее обучение нейросети по конкретным групповым запросам и результатам выдачи осуществлялось на одном графическом ускорителе (в течение примерно одного часа), методика была также иной. Если же актуализацию и обновление проводить со сложной нейросетью-трансформером с учетом новых механизмов, в таком случае потребовалось бы не менее десяти лет на схожие процессы. Теперь же найден выход значительно сократить этот временной промежуток до месяца в плане комплексного обучения.
Такие трансформированные и более технологически совершенные нейросети в сравнении с тем же Королевым демонстрируют значительно более качественные результаты соотнесения запросов с документами и иным текстовым контентом. Еще одна важная особенность технологии заключается в том, что если предыдущие версии алгоритмов главным образом работали с короткими запросами, то в данном случае речь идет и про более объемный текст.
Почему важен контекст написанного, или не используйте поисковые ключи в точном значении!
Поисковые запросы пишутся пользователями совершенно по-разному. Порядок слов, наличие предлогов, окончания, синонимы, однокоренные варианты – могут трактоваться иначе. С этим и стараются “бороться” ведущие поисковики. Если раньше алгоритмы были вынуждены соотносить запрос в точном его написании с результатом, то трансформированные нейронные сети отходят от этого; умеют по контексту определять смысл запроса и то, что имел в виду пользователь. Это к слову о том, что в очередной раз Google и Яндекс напоминают о недопустимости использования в текстах ключей вроде “диван кровать купить недорого”. То есть пользователи продолжат писать запросы именно так, но поисковики выдадут в результате страницу и сайт с действительно полезным, структурированным, грамотным описанием, в котором ни разу не будет встречаться даже приблизительно похожий встроенный неестественный ключ.
Если вам до сих пор не совсем понятна суть, приведу несколько простых примеров. Вы давно читали роман. Примерно помните о чем там шла речь, но совершенно не помните ни названия, ни автора. Так вот, если вы напишите в 2-3 предложения то, что помните, с большой долей вероятности поисковый алгоритм с интегрированной технологией анализа текстового контента YATI сможет найти этот самый роман и автора. То же касается, музыки, фильмов, игр и многого другого. В таком расширенном формате определение контекста в его последующем соотнесении с запросом крайне практично; может применяться в всевозможных вариациях и различных сферах. Очень солидный шаг в обучении нейросетей и небольшой шажок в сторону создания настоящего искусственного интеллекта.
YATI и копирайтинг: какова связь?
Технология YATI и тексты как таковые связаны напрямую. Поисковые роботы осуществляют ранжирование результатов в основном по текстовому контенту. В случае указанного обновления речь идет в том числе и про контекст и написанного. Теперь неумело вставить несколько ключевых запросов в SEO-текст недостаточно. Значительно “поумневшие” нейронные сети на раз распознают эти манипуляции и пессимизируют в результате выдачи такой источник. Хотел бы обратить особое внимание специалистов на присутствующий в YATI “механизм внимания” алгоритма. Если очень упростить, то трансформированная нейронная сеть научилась из контекста написанного очень точно определять смысл написанного (как в документе, так и на странице сайта), после чего соотносить результат с запросом. Теперь система способна быстро сориентироваться, проанализировать контент и сосредоточиться на главном. Это ей помогает сделать методика, которая в последнее время была значительно расширена. В расчет принимаются второстепенные повествовательные и уточняющие предложения, развернутые словосочетания, синонимы и аналогии, многое другое. Все это делается для того, чтобы поисковые алгоритмы могли с большей точностью “понимать” естественный человеческий язык и максимально дистанцироваться от искусственного машинописного.
Специалисты уже давно пришли к выводу, что наиболее естественный текст (контент в целом) лучше всего соотносится с запросом пользователя. А он может быть разным: найти ответ на свой вопрос, сравнить товары, выбрать исполнителя оказываемой услуги. Гуглят и ищут в поисковиках сегодня буквально все. Задача копирайтера – написать тематический и подходящий под конкретный формат текст, который выделит заказчика. Вне зависимости от его направленности и формата. Однако в любом случае – делать это нужно в естественной форме; с учетом всех особенностей и нюансов постоянно обновляемых и совершенствуемых поисковых алгоритмов. Анализ текста YATI Яндекс позволяет осуществлять поисковикам смысловую связь между содержанием документов и контентом страниц сайта с запросами пользователей. Задача опытного копирайтера – подготовить текст таким образом, чтобы поисковые системы соотносили ее с соответствующим запросом.
Готов вам помочь основательно разбираться в функционировании поисковых систем и их алгоритмах. Рекомендую вам записаться на начальный либо иной подходящий курс в онлайн школе.
Внимание! Важная информация: Перед тем как скопировать и незаконно использовать данный текст, ознакомьтесь с правилами пользования материалами сайта Berezovski.by.