Термин · Глоссарий B2B-ПО

Few-shot (Few-shot)

Метод адаптации языковой модели к задаче через включение нескольких (2–10) демонстрационных примеров «вход → выход» непосредственно в текст запроса. Модель не обновляет веса – она обучается внутри контекстного окна (in-context learning), что делает few-shot быстрым способом кастомизации LLM без GPU.

Буква «F» В категориях: 3 Платформ: 6+

Введение

Few-shot (буквально «несколько выстрелов») – режим работы языковой модели, при котором задача задаётся несколькими демонстрационными парами «входной текст – ожидаемый выход», включёнными непосредственно в промпт. Модель не обновляет веса через градиентный спуск; вся «адаптация» происходит внутри контекстного окна. Этот механизм называют in-context learning – обучение в контексте.

Концепция была систематизирована в статье OpenAI «Language Models are Few-Shot Learners» (Brown et al., 2020, NeurIPS), посвящённой GPT-3 – модели с 175 млрд параметров. Авторы показали, что масштабные модели способны адаптироваться к новым задачам по нескольким примерам в промпте без каких-либо gradient updates.

История и контекст

До GPT-3 few-shot learning в классическом ML означало обучение на малых датасетах (методы мета-обучения MAML, Prototypical Networks). В контексте LLM термин приобрёл принципиально иной смысл: GPT-3 впервые продемонстрировал, что 175-миллиардная модель способна «понять» задачу из нескольких примеров в тексте запроса. На бенчмарке TriviaQA few-shot GPT-3 достиг 71,2% точности, вплотную приблизившись к fine-tuned SOTA (75,4%) – без единого обновления параметров.

Это открытие изменило парадигму работы с языковыми моделями: вместо сбора датасетов и многодневного обучения разработчики получили возможность прототипировать NLP-решения за минуты. Сегодня few-shot промптинг – стандартный инструмент в арсенале ML-инженеров и prompt engineer'ов.

Как это работает

Структура few-shot промпта: несколько пар «входной текст → выход» (демонстрации), разделённых разделителем, после которых следует новый входной текст без выхода. Модель продолжает последовательность по выученному паттерну.

  • 1-shot – один пример; достаточно для демонстрации формата, но нестабилен.
  • 2–5 shot – оптимальный диапазон для большинства задач, хороший баланс качества и затрат токенов.
  • 10–32 shot – применяется на сложных задачах в рамках контекстного окна; GPT-3 тестировался с K до 32 примеров.

Исследования показали удивительный факт: даже если метки в примерах случайны или неверны, прирост качества от few-shot сохраняется – важнее демонстрация формата ответа, а не правильность меток. Ключевые параметры: выбор репрезентативных примеров, порядок следования и близость к целевой задаче.

Few-shot vs. fine-tuning

Fine-tuning обновляет веса модели через тысячи примеров и градиентный спуск – занимает часы и требует GPU. Few-shot не трогает веса, работает через API за секунды. Компромисс: при наличии тысяч размеченных примеров fine-tuning обычно превосходит few-shot по точности.

Где применяется

  • Извлечение информации – разметка именованных сущностей, атрибутов продуктов из неструктурированного текста.
  • Классификация текста – тональный анализ, рубрикация обращений в поддержку по 2–3 примерам на категорию.
  • Генерация кода – демонстрация желаемого стиля или API-паттерна через примеры функций.
  • Форматирование данных – конвертация свободного текста в JSON/CSV по образцу структуры.
  • Машинный перевод со специализированной терминологией – адаптация к отраслевому словарю через примеры.
  • Оценка документов – классификация договоров, заявок, медицинских записей по критериям.

Преимущества и ограничения

Преимущества: нет необходимости в GPU и датасете; мгновенное итерирование; работает с любыми проприетарными API; низкий порог входа.

Ограничения: качество зависит от выбора примеров; ограничен размером контекстного окна; каждый пример потребляет токены и увеличивает стоимость; уступает fine-tuning при наличии больших размеченных корпусов. Эффективен прежде всего для крупных моделей – малые модели плохо улавливают паттерн.

Связь с другими понятиями

Few-shot – частный случай в-контекстного обучения (in-context learning): модель учится из контекста без обновления весов. Противоположный полюс – zero-shot (вообще без примеров). Chain-of-Thought комбинируется с few-shot: примеры содержат не только ответ, но и пошаговые рассуждения, что резко повышает точность на математических и логических задачах (Wei et al., 2022). Качество few-shot адаптации оценивается стандартными метриками: F1, Precision, Recall. Hallucination снижается при наличии хорошо подобранных примеров, ограничивающих область допустимых ответов.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «Few-shot».

Платформы класса «Few-shot»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

CU

CAILA Ultimate 2.0

Данные и аналитика
CAILA Ultimate 2.0 — NLP-платформа компании Just AI для создания и эксплуатации решений в области обработки ес...
Цена по запросу
Подробнее →
G/

GigaCode / JARVIS

Данные и аналитика
GigaCode / JARVIS — AI-ассистент для разработчиков от Сбербанка. Предоставляет автодополнение кода, поддержива...
Цена по запросу
Подробнее →
GI

GigaChat

Чат-боты и виртуальные ассистенты
GigaChat от компании Сбер — российский программный продукт из реестра отечественного ПО, включённый в топ-анал...
Цена по запросу
★ 2.9
Подробнее →
БАРС.Мониторинг-ЖКХ

БАРС.Мониторинг-ЖКХ

Данные и аналитика
Информационно-аналитическая система для мониторинга и управления жилищно-коммунальным хозяйством на региональн...
Цена по запросу
★ 5.0
Подробнее →
Tarantool Data Grid

Tarantool Data Grid

Данные и аналитика
Tarantool — высокопроизводительная СУБД с поддержкой in-memory и дискового хранения данных, обеспечивающая ACI...
Цена по запросу
★ 4.8
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «Few-shot».

Где применяется

Отрасли, в которых «Few-shot» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про Few-shot

Сколько примеров оптимально для few-shot?

Обычно 2–5. Больше 10 редко даёт значимый прирост, а размер контекстного окна ограничивает максимум. GPT-3 тестировался с K до 32.

Чем few-shot отличается от fine-tuning?

Few-shot не обновляет веса модели – примеры подаются в тексте запроса. Fine-tuning меняет параметры модели через градиентный спуск и требует GPU и датасета из сотен-тысяч примеров.

Важен ли порядок примеров в промпте?

Да, порядок влияет на результат. Исследования показывают: наиболее релевантный пример ближе к запросу обычно улучшает качество.

Работает ли few-shot с малыми языковыми моделями?

Слабо. In-context learning – эмерджентное свойство, проявляющееся преимущественно у крупных моделей от нескольких миллиардов параметров.

Можно ли использовать few-shot для структурирования вывода (JSON)?

Да, это одно из ключевых применений: 1–3 примера желаемой JSON-схемы значительно повышают соответствие вывода структуре.