Г

Галлюцинация модели

Галлюцинация модели — это когда языковая модель уверенно выдаёт ложную, выдуманную или несуществующую информацию, представляя её как факт.

Что это

Галлюцинация модели — это феномен, при котором большая языковая модель (LLM) генерирует текст, содержащий фактически неверную, выдуманную или не подкреплённую источниками информацию, при этом подавая её уверенно и грамматически корректно. Модель не «знает», что ошибается: у неё нет механизма проверки истинности — она предсказывает следующий токен, а не обращается к базе фактов. Именно поэтому галлюцинации особенно опасны: текст выглядит убедительно, но содержит ложь.

Зачем это знать

Термин стал широко известен после массового выхода ChatGPT в конце 2022 года, когда пользователи начали замечать, что модель цитирует несуществующие научные статьи, придумывает биографии реальных людей и ссылается на законы, которых нет. В 2023 году адвокат в США использовал ChatGPT для подготовки судебного иска — модель выдумала шесть несуществующих прецедентов, что привело к скандалу и штрафу. Понимание галлюцинаций критично для всех, кто использует ИИ в работе: журналистов, разработчиков, аналитиков, юристов.

Как это работает

Языковая модель обучается предсказывать следующий токен на основе контекста и статистических паттернов из обучающих данных. Она не хранит факты как базу данных — она «знает», какие слова часто стоят рядом. Если модель не встречала точного ответа в обучающих данных или запрос выходит за пределы её знаний, она всё равно генерирует правдоподобный текст, экстраполируя из похожих паттернов. Галлюцинации чаще возникают в нескольких ситуациях:

  • Запрос касается редких, узкоспециализированных или слабо представленных в обучающих данных тем
  • Модель просят назвать конкретные цифры, даты, имена или ссылки — она «достраивает» их по аналогии
  • Пользователь задаёт наводящий вопрос, который подталкивает модель к определённому ответу
  • Запрос выходит за дату среза обучения (cutoff date) — модель не знает актуальных событий, но может их выдумать

Примеры

  • Модель называет несуществующую книгу конкретного автора с реальным названием, годом издания и кратким содержанием
  • На вопрос о научной статье GPT-4 генерирует правдоподобный DOI, название журнала и имена авторов — всё выдумано
  • При запросе биографии малоизвестного человека модель смешивает детали нескольких реальных людей и добавляет несуществующие факты
  • Модель уверенно описывает функцию несуществующего метода в библиотеке Python, включая синтаксис и примеры кода
  • ChatGPT в ранних версиях мог «вспомнить» события, произошедшие после его даты среза, придумывая детали

Связанные понятия

  • RAG (Retrieval-Augmented Generation) — техника подключения внешней базы знаний к модели, снижающая галлюцинации
  • Температура модели — параметр случайности генерации; высокая температура увеличивает риск галлюцинаций
  • Grounding — «заземление» модели на конкретный источник или контекст для повышения точности
  • Токен — минимальная единица текста, которую обрабатывает модель
  • Cutoff date — дата среза обучающих данных, после которой модель не имеет актуальной информации

Частые мифы

Распространённое заблуждение — что галлюцинации возникают только у «слабых» или устаревших моделей. На практике даже самые мощные модели — GPT-4, Claude 3, Gemini Ultra — галлюцинируют, просто реже и в менее очевидных местах. Ещё один миф: если модель отвечает уверенно и развёрнуто, значит, она права. Уверенность тона никак не коррелирует с точностью ответа. Единственный способ снизить риск — верифицировать критически важные факты по первичным источникам, использовать RAG-архитектуры или модели с доступом к поиску.

Другие термины на букву «Г»

Государственная итоговая аттестация
Государственная итоговая аттестация (ГИА) — обязательная форма проверки знаний учащихся по завершени...
Государственный кадастр недвижимости
Государственный кадастр недвижимости (ГКН) — федеральная информационная система, в которой хранятся...
Геодезическая съёмка
Геодезическая съёмка — комплекс полевых измерений, позволяющих определить точное положение объектов...
Геодезическая сеть
Геодезическая сеть — система закреплённых на местности точек с точно известными координатами, котора...
Геодезический репер
Геодезический репер — постоянный знак с точно известной высотой над уровнем моря, который служит опо...
Глубокое обучение
Глубокое обучение — подраздел машинного обучения, в котором модели строятся на многослойных нейронны...
Генеративный искусственный интеллект
Генеративный ИИ — класс моделей искусственного интеллекта, которые создают новый контент: текст, изо...
Государственные элементные сметные нормы (ГЭСН)
ГЭСН — государственные элементные сметные нормы, устанавливающие нормативный расход ресурсов (труда,...