Опасность текстов, сгенерированных нейросетями ChatGPT, Gemini, Claude и другими
Врут ли нейросети?
Конечно. Причем, постоянно. Если для вас это новость, то спешу разочаровать. Текущие лингвистические модели и “прикрученные” к ним технологии не позволяют с высокой долей достоверности создавать полностью корректный и правдивый контент. Разница в том, что в одном случае степень этого вранья оборачивается в безобидную выдумку и умалчиванием, в другом – в откровенном и намеренном вранье, искажении фактов. И хотя разработчики конкретных LLM (лингвистических моделей) уверяют в отсутствии злого умысла, порой выходит совсем небезобидно; что приводит в большим скандалам.
Приведу несколько распространенных и типичных ситуаций, связанных с ошибочностью или неточностью текстов, сгенерированных нейросетями:
1. Ошибки из-за недостаточности или искажения данных
Нейросети обучаются на огромных объёмах данных. Если данные, на которых они обучались, неполные или искажённые, это может привести к неправильным выводам.
Пример:
- Нейросеть, обученная на текстах, содержащих неточные или устаревшие данные (например, научные статьи, которые со временем стали устаревшими), может выдать информацию, которая больше не актуальна. Например, нейросеть может утверждать об актуальности определенной технологии или версии оборудования, хотя это не так. Еще в большей степени это значимо в отношении здоровья, медикаментозных препаратов, рекомендаций. Крайне важна версия лингвистической модели.
2. Проблемы с интерпретацией контекста
Нейросети часто с большим трудом “понимают” контекст или нюансы речи. Если запрос (promt) неточен или не совсем понятно прописан, это приводит к ошибочным ответам.
3. Моделирование ошибок на основе предыдущего контекста
Частые ошибки происходят, когда нейросеть пытается «подогнать» ответ под конкретную ситуацию или тренды, даже если это приводит к введению в заблуждение.
Пример:
- В случае с генеративными нейросетями, такими как GPT, они могут создавать текст, который выглядит правдоподобно, но на самом деле является вымышленным. Например, при запросе информации о несуществующем научном исследовании или событии, нейросеть может «сгенерировать» подробности, которые выглядят как реальная информация, но на самом деле не имеют под собой фактической основы. Очень часто происходит так, что нейросеть просто выдумывает персонажей, также с легкостью генерирует и приписывает якобы реалистичные цитаты. Посмотрите на приведенные скриншоты. ChatGPT выдумал копирайтера, а при прямом уточнении сам подтвердил откровенное вранье. Тоже самое фактически сотворила и нейросеть Claude. Подтверждение на третьем скрине. Просто выдуманный факт. Как и выдуманные фамилии несуществующих копирайтеров, что легко проверяется и подтверждается в Google.
4. Прочие ошибки и неточности
Нейросети не могут полноценно интерпретировать задачу или разницу между фактами и предположениями. Сравнительный анализ выходит неточным. Встречаются постоянные логические ошибки и заблуждения. Никакие аналитические материалы подготовить невозможно. Выводы оказываются неверными, неподтвержденными, предвзятыми. В процессе адаптации и перевода контента допускаются ошибки в текстах, содержащих специфическую терминологию. Когда задача объемная, часто происходит перегрузка и выходит ошибочный или совсем неточный ответ. Привожу пример, когда нейросети при генерации текста выдумывают факты, особенно когда они пытаются комбинировать информацию или заполнять пробелы.
Почему так происходит, несмотря на то, что в ряде случаев нейросетям прямо запрещено манипулировать информацией или искажать ее, предоставляя неточные или даже выдуманные сведения? Ученые Массачусетского университета, детально изучающие различные модели, пришли к выводу, что основная причина в том самом огромном массиве данных. Это террабайты текстов, информации. “Скармливающие” их модели разработчики просто не в состоянии отфильтровать правду от истины, случайное или намеренное искажение фактов – во всех 100% случаев. Поэтому в базу попадает много сомнительного и откровенно низкосортного контента, нередко и ошибочного. На основе всего этого и генерируются тексты.
Вдумайтесь в суть технологии – генерация текстов. В них нет ровным счетом никакой уникальности. Они создаются на основе многочисленных других текстов (“огромного массива данных” – как утверждают сами нейросети и их создатели).
В чем, собственно, проблема сгенерированных текстов?
Они банально опасны. В большинстве случаев бесполезны. Вы бы хотели смотреть один и тот же сериал с несколько измененным сценарием и некоторой сменой декораций и актеров – но об одном же и том же (сценарий, сеттинг, нюансы)? Почему же владельцы бизнеса, проектов предлагают контент ровно такого же качества своим клиентам – остается большим вопросом. Стоит ли наполнять ими сайты, аккаунты соцсетей, использовать в полиграфических материалах, статьях корпоративных блогов, презентациях и многих других вариациях – однозначный ответ: нет.
Лишь неуважающие свою аудиторию станут предлагать ей сгенерированные тексты. Это база.
Нейросети, хотя и могут генерировать текст или информацию, которая кажется правдоподобной, очень часто допускают ошибки по многим причинам: недостаток данных, предвзятости в “обучении” со стороны разработчиков, сложности с интерпретацией контекста, логики и так далее. Важно понимать и соответствующим образом относиться к тому, что их выводы далеко не всегда точны и требуют обязательной проверки и уточнения при помощи других источников. Генеративные нейросети совершенно точно нельзя отнести к создателям качественного текстового контента. Важно к результатам генерации текстов относиться критически, особенно в вопросах, связанных с фактами и точностью.
С учетом приведенной в материале информации и подтверждений просто удивительно, как можно всерьез рассматривать сгенерированные тексты для проектов и бизнеса. Не более чем баловство без серьезных намерений и применения. Тексты для сайта должен готовить опытный специалист. Если такой сотрудник отсутствует в штате, либо нет времени, доверьте эту задачу профессиональному копирайтеру – будем рады помочь в студии Berezovski.by. Если же успели сгенерировать и наполнить сайт таким контентом, его нужно перепроверять и адаптировать; в обязательном порядке.
Внимание! Важная информация: Перед тем как скопировать и незаконно использовать данный текст, ознакомьтесь с правилами пользования материалами сайта Berezovski.by.