Термин · Глоссарий B2B-ПО

Chain-of-Thought (Chain-of-Thought)

Техника промптинга LLM, при которой модель явно формирует цепочку промежуточных рассуждений перед финальным ответом. Предложена Wei et al. (Google Brain, 2022). На бенчмарке GSM8K PaLM 540B с 8 CoT-примерами достиг 56,9% – против 17,9% без рассуждений.

Буква «C» В категориях: 3 Платформ: 6+

Введение

Chain-of-Thought (CoT) – техника промптинга, при которой языковая модель явно формирует последовательность промежуточных рассуждений («мыслей») перед финальным ответом. Вместо того чтобы немедленно выдать результат, модель «думает вслух»: раскладывает задачу на шаги, проверяет промежуточные утверждения и только затем формулирует итоговый вывод. Это значительно повышает точность на задачах, требующих нескольких логических переходов.

История и контекст

Метод систематически исследован в статье «Chain-of-Thought Prompting Elicits Reasoning in Large Language Models» (Wei et al., 2022, Google Brain). Авторы показали, что добавление примеров с явными рассуждениями (тройки «задача → рассуждение → ответ») кратно повышает точность. На математическом бенчмарке GSM8K модель PaLM 540B с восемью CoT-примерами достигла 56,9% точности – против 17,9% при стандартном few-shot (рост в 3,2 раза).

Параллельно Kojima et al. (2022) открыли zero-shot CoT: добавление фразы «Let's think step by step» активирует цепочку рассуждений даже без примеров. Это открытие сделало CoT практически применимым без специальной подготовки промптов. Сегодня цепочки рассуждений встроены в системные промпты многих коммерческих AI-продуктов.

Важная граница применимости: CoT является эмерджентной способностью и эффективен только для моделей примерно от 100 млрд параметров. Для меньших моделей добавление CoT-примеров может ухудшить результат.

Как это работает

Существуют две основные формы Chain-of-Thought:

  • Few-shot CoT – в промпт включаются 2–8 примеров, каждый содержит тройку «задача → развёрнутое рассуждение → ответ». Модель воспроизводит паттерн рассуждений для новой задачи.
  • Zero-shot CoT – к запросу добавляется инструкция «Рассуждай пошагово» или «Думай шаг за шагом». Модель строит цепочку самостоятельно.

Расширенные вариации

  • Self-Consistency CoT – генерация нескольких независимых цепочек рассуждений, финальный ответ выбирается большинством голосов. Повышает надёжность через усреднение.
  • Tree-of-Thought (ToT) – исследование дерева альтернативных путей рассуждений с откатами. Для особо сложных многошаговых задач.
  • Program-of-Thought – рассуждение через написание и исполнение кода вместо текстовых шагов. Снижает арифметические ошибки.

Где применяется

  • Математика и расчёты – пошаговое решение уравнений, финансовые вычисления, статистические задачи.
  • Юридический анализ – квалификация ситуации по нормам права, построение правовой аргументации.
  • Медицинская диагностика – дифференциальная диагностика по симптомам с аргументацией для каждого шага.
  • Логистика и планирование – оптимизация маршрутов, планирование с ограничениями.
  • Отладка кода – пошаговый разбор причин ошибки перед генерацией исправленного кода.

Преимущества и ограничения

Преимущества: значительный прирост точности на многошаговых задачах; интерпретируемость – пользователь видит ход рассуждений и может проверить логику; снижение галлюцинаций за счёт самопроверки промежуточных шагов; не требует дообучения.

Ограничения: цепочка рассуждений потребляет дополнительные токены и увеличивает стоимость запроса; малые модели не способны поддерживать связную цепочку и CoT ухудшает их результаты; модель может ошибиться на промежуточном шаге и уверенно прийти к неверному итогу.

Связь с другими понятиями

CoT – расширение техники few-shot с добавлением явных рассуждений к примерам. В zero-shot режиме реализуется одной фразой-инструкцией. Hallucination снижается при CoT, поскольку промежуточные шаги создают внутренние ограничения на допустимые выводы. Evaluation (МО) CoT-систем включает оценку корректности не только финального ответа, но и качества промежуточных рассуждений. Токен (LLM) – единица стоимости: CoT увеличивает потребление токенов, что важно учитывать при проектировании production-систем.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «Chain-of-Thought».

Платформы класса «Chain-of-Thought»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

CU

CAILA Ultimate 2.0

Данные и аналитика
CAILA Ultimate 2.0 — NLP-платформа компании Just AI для создания и эксплуатации решений в области обработки ес...
Цена по запросу
Подробнее →
G/

GigaCode / JARVIS

Данные и аналитика
GigaCode / JARVIS — AI-ассистент для разработчиков от Сбербанка. Предоставляет автодополнение кода, поддержива...
Цена по запросу
Подробнее →
GI

GigaChat

Чат-боты и виртуальные ассистенты
GigaChat от компании Сбер — российский программный продукт из реестра отечественного ПО, включённый в топ-анал...
Цена по запросу
★ 2.9
Подробнее →
БАРС.Мониторинг-ЖКХ

БАРС.Мониторинг-ЖКХ

Данные и аналитика
Информационно-аналитическая система для мониторинга и управления жилищно-коммунальным хозяйством на региональн...
Цена по запросу
★ 5.0
Подробнее →
Tarantool Data Grid

Tarantool Data Grid

Данные и аналитика
Tarantool — высокопроизводительная СУБД с поддержкой in-memory и дискового хранения данных, обеспечивающая ACI...
Цена по запросу
★ 4.8
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «Chain-of-Thought».

Где применяется

Отрасли, в которых «Chain-of-Thought» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про Chain-of-Thought

Всегда ли CoT улучшает точность?

Нет. На простых задачах CoT не даёт прироста. Наибольший эффект на многошаговой математике, логике, юридическом анализе. Для малых моделей CoT может ухудшить результат.

Для каких размеров моделей работает CoT?

Эффективен для моделей примерно от 100 млрд параметров (Wei et al., 2022). Это эмерджентная способность – у малых моделей CoT не возникает.

Что такое Self-Consistency CoT?

Генерация нескольких цепочек рассуждений с последующим голосованием за ответ большинства. Повышает надёжность за счёт усреднения независимых рассуждений.

Нужны ли примеры для Chain-of-Thought?

Не обязательно. Zero-shot CoT работает при добавлении «Думай пошагово» к запросу (Kojima et al., 2022). Few-shot CoT с примерами даёт больший прирост на специализированных задачах.

Как CoT влияет на стоимость запроса?

Увеличивает число токенов – как в входе (примеры с рассуждениями), так и в выходе (цепочка мыслей). Для production-систем нужно балансировать между качеством и стоимостью.

Применим ли CoT в русскоязычных LLM?

Да. Модели GigaChat, YandexGPT и другие поддерживают CoT на русском языке при явном указании в промпте.