Спам в текстах: Google Spam Update и прочие особенности
Поисковые системы постоянно повышают требования, связанные с качеством контента. На этот раз речь пойдет про спам и заспамленность текстов на сайте. Если вы о спаме слышали и воспринимаете его лишь как навязчивые письма в e-mail рассылке, то это совсем не про то. Алгоритм Google Spam Update мировая поисковая система начала “выкатывать” ровно года назад, но как это часто бывает – после всех изменений и адаптаций о результатах и анализе можно вести речь спустя определенное время. В статье рассказываем, какие тексты считаются спамом, и почему такой контент опасен для сайтов.
Автоматизированные поисковые системы научились с точностью определять и распознавать заспамленные и переоптимизированные тексты. Про этот аспект мы готовили тематический материал еще 5 лет назад. Уже тогда поисковые системы (Google, Яндекс, Bing, иные) уделили внимание спаму контента. Весьма серьезная проблема, которую старались решить поисковые системы. По большей части путем ручной настройки – постепенно приближая процесс к его полной автоматизиции. Теперь же алгоритмы, нейронные сети и применяемые технологии значительно усовершенствовались. Официальные представители Google сообщают об использовании ИИ и фирменном системы защиты от спама SpamBrain. Другие поисковики используют аналогичные собственные наработки.
Какие тексты считается спамом?
Особенность работы системы SpamBrain и алгоритма Google Spam Update состоит в обнаружении спама (как контента, так и ссылок на соответствующие ресурсы) среди результатов органической выдачи. Под спамом (веб-спамом) Google понимает сайты с некачественным, специально созданным для фишинга и прочих запрещенных действий, посредством которых злоумышленники обманывают пользователей, заставляя их предоставлять личную информацию или устанавливать вредоносные программы. Вторым моментом спама являются сайты, которые посредством текстового контента и соответствующей манипуляции пытаются занять место в результатах поиска, выдавая себя за высокорелевантные страницы. Спамным считается также контент, который нецелевой либо малополезный (не соответствующий запросам пользователей, не содержащей полезной информации, создан для того, чтобы быть); к такому текстовому контенту, в частности, относится сгенерированный при помощи соответствующих сервисов (к примеру, ChatGPT).
К спаму могут быть причислены определенные “приемы и тактики”, осуществление которых может привести к ухудшению позиций страниц сайта в органике либо к полному удалению сайта (бану). При этом сайт с полезным контентом занимают более высокие места в результатах поисковой выдачи и в приоритетном порядке анализируются роботами. Как с этим всем связан текстовый контент? Напрямую. В руководстве Google упомянуты:
- веб-страницы
- новостной контент
- другие материалы, которые Google находит в интернете (с недавнего времени к ним добавлен контент соц.сетей, многое другое)
- дополнительно (изображения, видео) – в этом контенте также присутствует текстовый контент; в иной форме
В упомянутой документации содержатся тематические разделы, посвященные спамному контенту. Если вы занимаетесь чем-то из нижеследующего, в срочном порядке пересмотрите свой подход:
- маскировка (разное отображение контента для посетителей сайта и поисковых систем)
- дорвеи (множество идентичны страниц, целью которых является направление пользователя на один ресурс)
- взломанный контент (преодоление злоумышленниками системы безопасности сайта и его взлом с последующими видоизменениями: переадресация, внедрение кода, внедрение контента, снедрение страниц)
- скрытый текст и ссылки (цветом, тегами, прочими приемами)
- избыточное количество ключевых слов (переоптимизация)
- ссылочный спам (покупка и продажа ссылок, чрезмерная ссылочная масса)
- машинный трафик и вредоносное ПО
- скопированный контент
- бесполезные партнерские сайты
- спам, созданный пользователями (форумы, блоги, файлообменники, соц.сети – чаще всего взломанные либо немодерируемые)
- автоматически созданный спам (материалы, создаваемые при помощи программ и сервисов; в том числе сгенерированный лингвистическими моделями – чаще всего искусственно созданный с целью манипуляции поисковых систем)
Несколько комментариев по последнему пункту; или почему нельзя использовать сгенерированные тексты без доработки и корректировки. К нему для простоты понимания отнесем и автоматизированный перевод – через онлайн переводчики. Такой контент считается чаще всего бессмысленным текстом – в том числе и потому, что нейронные лингвистические генераторы работают по одним принципам и механизмам (независимо от тематики и промтов – запросов пользователя). Сгенерированный при помощи ChatGPT и аналогичных сервисов – как есть (без доработки и редактирования) – Google считает “текстом, созданным с помощью автоматических средств без оглядки на качество или удобство для пользователей“. Это официальная позиция и цитата.
Если что-либо из перечисленного есть у вас на сайте, Google рекомендует, как минимум и вскорости, закрыть его для индексирования поисковыми системами. А впоследствии удалить с сайта. Более подробно с особенностями вы можете ознакомиться самостоятельно в официальной документации Google.
Что будет, если не следовать обязательным требованиям (отсутствие спама в текстах)?
- значительная пессимизация (снижение результатов сайта в органике или полное “выпадение”)
- проблемы с последующим восстановлением (долгое время на возврат позиций)
- ручной анализ специалистами (повышенное внимание и доп.проверка – ее результаты чаще всего негативные для сайта)
Если ваш сайт подвергся пессимизации (значительному понижению результатов в органической выдаче поисковых систем), настоятельная рекомендация – провести анализ на предмет присутствия перечисленных в материале моментов, касающихся веб-спама. Помните о том, что текстовый контент мало того что должен быть уникальным, к нему предъявляются требования относительно полезности, качества, содержательности и актуальности. В Berezovski.by вам помогут провести анализ контента на сайте, а также подготовить тексты, соответствующие требованиям поисковых систем.
Внимание! Важная информация: Перед тем как скопировать и незаконно использовать данный текст, ознакомьтесь с правилами пользования материалами сайта Berezovski.by.