Термин · Глоссарий B2B-ПО

Hallucination (Hallucination)

Явление, при котором языковая модель уверенно генерирует фактически неверную, выдуманную или противоречивую информацию, которая звучит правдоподобно. Фундаментальное свойство авторегрессионных LLM: модель максимизирует правдоподобие текста, а не достоверность утверждений.

Буква «H» В категориях: 3 Платформ: 6+

Введение

Hallucination (галлюцинация LLM) – явление, при котором языковая модель генерирует информацию, которая звучит правдоподобно и уверенно, но является фактически ошибочной, выдуманной или не подкреплённой источниками. Термин заимствован из психологии, где галлюцинация – это восприятие несуществующего стимула. Для LLM это системная проблема: авторегрессионная модель максимизирует вероятность связного текста, а не достоверность утверждений.

Это одна из ключевых проблем безопасного внедрения LLM в промышленные системы, особенно критичная в медицине, юриспруденции и финансах.

История и контекст

Проблема галлюцинаций была зафиксирована ещё в нейронных машинных переводчиках (Raunak et al., 2021). С распространением ChatGPT в 2022–2023 годах она вышла на первый план в AI Safety. Бенчмарк TruthfulQA (Lin et al., 2022) показал, что большинство коммерческих моделей галлюцинируют в 20–50% случаев на вопросах с распространёнными заблуждениями. Отдельная область исследований – «hallucination mitigation»: методы снижения частоты галлюцинаций, включая RAG, RLHF, Chain-of-Thought и верификацию через внешние инструменты.

Как это работает

Галлюцинации классифицируются по источнику и характеру:

  • Intrinsic hallucination – сгенерированный текст противоречит переданному в промпте контексту. Например, в суммаризации документа модель указывает неверные цифры, прямо противоречащие исходному тексту.
  • Extrinsic hallucination – модель добавляет информацию, которую нельзя ни подтвердить, ни опровергнуть по исходному контексту. Часто включает выдуманные факты, несуществующих авторов, ложные ссылки на законы.
  • Factuality hallucination – вывод противоречит реальным фактам реального мира: «Столица Канады – Торонто» вместо «Оттава».
  • Faithfulness hallucination – ответ нарушает логическую согласованность с инструкцией или контекстом.

Причины галлюцинаций: статистическое предсказание следующего токена без проверки фактов; редкие знания плохо представлены в обучающих данных; RLHF-обучение стимулирует уверенный стиль ответов, маскирующий незнание; «snowball effect» в длинных ответах – ошибки накапливаются.

Где применяется

  • Аудит юридических AI-инструментов – верификация ссылок на нормы права и судебную практику.
  • Контроль качества медицинских ассистентов – проверка диагностических рекомендаций.
  • Верификация финансовых отчётов, генерируемых LLM.
  • Оценка RAG-систем – корректность ответов относительно исходных документов.
  • Мониторинг чат-ботов поддержки на предмет ложных обещаний и некорректных инструкций.

Преимущества и ограничения

Методы снижения галлюцинаций:

  • RAG (Retrieval-Augmented Generation) – привязка ответов к конкретным верифицированным документам.
  • Chain-of-Thought – пошаговая проверка логики снижает частоту ошибок.
  • Self-consistency – голосование по нескольким независимым генерациям.
  • Grounding – верификация утверждений через поисковые системы или knowledge base.
  • Fine-tuning на верифицированных данных – обучение «не придумывать» через RLHF.

Полностью устранить галлюцинации невозможно – они являются фундаментальным свойством авторегрессионных языковых моделей на текущем уровне развития технологии.

Связь с другими понятиями

Галлюцинации – основная мотивация для Evaluation (МО): системы необходимо проверять перед выпуском в production. Chain-of-Thought снижает их частоту, делая рассуждения прозрачными. Перплексия частично коррелирует с качеством: модели с низкой перплексией на домене задачи галлюцинируют реже. Few-shot ограничивает пространство допустимых ответов примерами. Мониторинг модели в production должен включать автоматическое детектирование галлюцинаций через NLI-модели или LLM-as-a-judge.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «Hallucination».

Платформы класса «Hallucination»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

CU

CAILA Ultimate 2.0

Данные и аналитика
CAILA Ultimate 2.0 — NLP-платформа компании Just AI для создания и эксплуатации решений в области обработки ес...
Цена по запросу
Подробнее →
G/

GigaCode / JARVIS

Данные и аналитика
GigaCode / JARVIS — AI-ассистент для разработчиков от Сбербанка. Предоставляет автодополнение кода, поддержива...
Цена по запросу
Подробнее →
GI

GigaChat

Чат-боты и виртуальные ассистенты
GigaChat от компании Сбер — российский программный продукт из реестра отечественного ПО, включённый в топ-анал...
Цена по запросу
★ 2.9
Подробнее →
БАРС.Мониторинг-ЖКХ

БАРС.Мониторинг-ЖКХ

Данные и аналитика
Информационно-аналитическая система для мониторинга и управления жилищно-коммунальным хозяйством на региональн...
Цена по запросу
★ 5.0
Подробнее →
Tarantool Data Grid

Tarantool Data Grid

Данные и аналитика
Tarantool — высокопроизводительная СУБД с поддержкой in-memory и дискового хранения данных, обеспечивающая ACI...
Цена по запросу
★ 4.8
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «Hallucination».

Где применяется

Отрасли, в которых «Hallucination» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про Hallucination

Почему языковые модели галлюцинируют?

Авторегрессионная LLM предсказывает следующий токен по максимуму правдоподобия – не по истинности. Нет внутреннего механизма проверки фактов, поэтому статистически правдоподобный, но неверный текст вполне вероятен.

В чём разница между intrinsic и extrinsic галлюцинацией?

Intrinsic – ответ противоречит переданному в промпте контексту (напр., неверные цифры из документа). Extrinsic – добавлена информация, которую нельзя проверить по контексту (выдуманные ссылки, несуществующие факты).

Как снизить галлюцинации в production?

Основные методы: RAG (ответы из верифицированных документов), Chain-of-Thought, верификация через поиск, ограничение области задачи, fine-tuning на верифицированных данных.

Можно ли полностью избавиться от галлюцинаций?

На сегодняшний день нет. Это фундаментальное свойство авторегрессионных LLM. Можно существенно снизить частоту, но не до нуля.

Как измерить уровень галлюцинаций?

Используют бенчмарки TruthfulQA, HaluEval; автоматические детекторы на основе NLI; FActScore для длинных текстов; LLM-as-a-judge пайплайны.