Тексты и поисковый алгоритм BERT Google
В ноябре 2018 года крупнейший мировой поисковик Google анонсировал алгоритм BERT, основанный на двунаправленной кодировке (анализе) нейросетью запросов пользователей. Практически год осуществлялась отладка, доработка нового метода. 25 октября 2019 года компания заявила о начале внедрения алгоритма. Сперва для англоязычных пользователей в США, затем по всему миру (в том числе и в отношение русскоязычного сегмента – по планам в декабре 2019 года). Для копирайтеров и SEO-специалистов этот вопрос примечателен, поскольку вносятся существенные правки в метод анализа поисковых запросов. Это в том числе означает обновленный механизм индексации текстового контента и его естественной выдачи пользователям, которые ввели поисковый запрос в том или ином виде. Это своего рода попытка еще более комплексно обучить нейросеть понимать контекстное значение фраз с целью более точного предложения результатов. В материале разъясняю, каким образом связаны тексты и алгоритм BERT Google. Чего ожидать от серьезного апдейта, к чему готовиться, по каким правилам и требованиям готовить тексты для оптимальной оптимизации.
Что такое алгоритм BERT, и как он соотносится с текстами?
Аббревиатура BERT расшифровывается следующим образом – “Bidirectional Encoder Representations from Transformers”. В переводе на русский звучит так – “Двунаправленная нейросеть-кодировщик”. Суть обновленной нейронной сети – понимание естественных поисковых запросов. Google уже много лет совершенствует свой механизм, предлагая более точные результаты поиска, однако контекст написанного (вне зависимости от конкретного языка) остается для “машины” самым сложным аспектом. Примерную аналогию можно провести с автоматизированным переводом с одного языка на другой. Несмотря на значительно улучшившийся в последние годы результат ввиду многочисленных особенностей языка, контекстных значений фраз, в сложных выражениях перевод все еще далек от идеального. Описываемый момент, по заверению представителей крупнейшей мировой поисковой системы, является самым значимым нововведением за последние 5, а также серьезным “прорывом” за всю историю поисковика. На начальном этапе после внедрения программного обеспечения в дата-центрах компании в новом виде будет обрабатываться каждый десятый запрос американских пользователей на английском языке.
Как это работает? Сперва нейросеть обучается обрабатывать сложные естественные запросы в зависимости от формулировки и контента написанного. В расчет принимается комплексный учет написанного (всей фразы как целиком, так и по ее отдельным составляющим). Предварительная тренировка позволяет задавать определенные значения, которые в дальнейшем могут автоматически использоваться без участия человека. Языковые нюансы довольно разнообразны, поэтому с целью выдачи более релевантных результатов необходимы вводные данные и корректировки. Важность новой методики состоит в том, что вне зависимости от того, каким образом пользователь комбинирует фразы и выражения (в том числе используя для этого разнообразные местоимения, частицы, предлоги и дополнительные слова), ему предлагается наиболее точный результат.
Для более точного понимания в официальном блоге Google помимо общего описания приводятся несколько конкретных примеров того, как работает новый алгоритм BERT применительно к анализу поискового запроса. Есть две исходные фразы: “2019 brazil traveler usa need a visa” и “2019 brazil traveler to usa need a visa”. Разница в отсутствии и наличии предлога “to”. Если ранее для поисковика никакой принципиальной разницы в двух выражениях не было, то теперь новый механизм нейронной сети позволяет установить разницу. Дело в том, что в первом случае из контекста написанного предполагается путешествие американцев в Бразилию; во втором – ровным счетом наоборот. Написание схожее, но наличие предлога полностью переиначивает содержание. Приведу пример, адаптированный под русский язык. Сравните два выражения: “купить билеты на самолет россия” и “купить билеты на самолет в россию”. Смысл и контекст написанного совершенно разный: в первом случае предполагается покупка авиабилетов в России по стране либо за рубеж; во втором – именно полет в эту страну. Сейчас результаты выдачи практически идентичны. После внедрения нового алгоритма ситуация существенно изменится.
Главные новшества алгоритма BERT
Традиционные механизмы индексации все больше уходят в прошлое. Новые нейросети, функционирующие на основе “умного” машинного обучения, применяют принципиально иные методики на основе нового программного обеспечения. Потребовалось не только перестроение системы, но и увеличение производственных мощностей (в особенности миллиардов ежедневных запросов). Вот лишь часть нововведений, предложенных новым алгоритмом БЕРТ Гугл применительно к текстам:
- Анализ не только основных, но и вспомогательных слов (местоимения, предлоги, частицы).
- Помимо наличия вспомогательных слов учет их месторасположения (до, внутри либо после ключевой фразы).
- Ранжирование длинных диалоговых запросов (развернутых с точки зрения осложнения оборотами и пунктуацией предложений).
- Обработка расширенных сниппетов (соотнесение краткого текстового описания страницы с ее содержанием).
- Переосмысление низкочастотных запросов (большая часть из них станет нерелевантными).
Почему алгоритм BERT Google важен для текстов?
Ранжирование страниц сайта осуществляется в зависимости от размещенного на них контента (главным образом текстового). Именно при вводе пользователем поисковой фразы в том или ином контексте ему предлагается результат естественной выдачи. SEO-тексты нового формата далеки от сходства с версиями, которые посредством внедрения многочисленных ключей позволяли манипулировать результатами. Теперь в расчет принимается контекст написанного, учитывается качество и польза материала. Поисковые нейронные сети научились определять, насколько конкретные страницы соответствуют запросу пользователя. Русский язык сложен и разнообразен. К примеру, в нем немало омонимов (слов с одинаковым написанием, но разным значением: среда, график, стан) и омографов (слов с одинаковым написанием, но разным звучанием – иным ударением: мукА и мУка, оргАн и Орган). Поисковая система без вспомогательных слов, предлогов, частиц во многих случаях не может верно интерпретировать поисковый запрос. Именно поэтому задачей копирайтера является подготовка правильно составленного и написанного SEO-текста с учетом перечисленных новшеств. Благодаря специальным актуальным методикам квалифицированный исполнитель сможет изложить суть написанного и напрямую соотнести его с ключевыми запросами – помочь поисковым системам верно интерпретировать контекст и включить страницу в сайта в список предлагаемых нейронной машинной сетью. Подразумевается грамотная работа с поисковыми ключами и иные моменты.
Если сравнивать с главным русскоязычным конкурентом – Яндекс (Yandex), то использование нейросетей, работа которых основана на машинном обучении, опередило главного американского конкурента. Так, первые признаки методологии присутствовали в алгоритмах Палех, Баден-Баден, Королев, Андромеда, начиная с 2016 года.
Готовьте тексты с учетом изменений поисковой системы Google
Один из наиболее частых вопросов при “выкате” обновленных механизмов индексации поисковых систем звучит следующим образом – как теперь готовить и писать тексты для сайтов? Копирайтерам и SEO-специалистам следует знать: проводить технически сложные манипуляции либо иным образом пытаться манипулировать выдачей не следует. Специалисты Google и Яндекс развивают и обучают свои нейросети таким образом, чтобы они могли максимально точно понимать естественный язык и запросы пользователей. Именно поэтому сотрудник Google Дэнни Салливан и прочие профильные эксперты-инсайдеры подтверждают необходимость создания текстового контента и его оптимизации именно “для людей”, а не алгоритма BERT и иже с ними. Основные принципы ранжирования остаются неизменными.
Только правильно написанные, структурно составленные, полезные и содержательные тексты попадут на высокие позиции естественной поисковой выдачи. Поэтому принципиально важно поручать их написание только тому копирайтеру, который в курсе самых последних изменений и новшеств. Тексты и алгоритм БЕРТ Google напрямую пересекаются. Находиться в стороне от перечисленных в материале моментов невозможно. Заказывайте качественные тексты с учетом изменений поисковой системы Google и оставайтесь в тренде со своими ресурсами.
Готов вам помочь основательно разбираться в функционировании поисковых систем и их алгоритмах. Рекомендую вам записаться на продвинутый либо иной подходящий курс в онлайн школе.
Внимание! Важная информация: Перед тем как скопировать и незаконно использовать данный текст, ознакомьтесь с правилами пользования материалами сайта Berezovski.by.