Термин · Глоссарий B2B-ПО

Генеративные модели

Генеративные модели – класс алгоритмов машинного обучения, обучающихся моделировать распределение обучающих данных для генерации новых реалистичных примеров: текстов, изображений, аудио, видео и молекул. В отличие от дискриминативных моделей, генеративные учатся воспроизводить структуру данных, а не только разделять классы.

Буква «Г» В категориях: 3 Платформ: 6+

Что такое генеративные модели

Генеративные модели – это класс алгоритмов машинного обучения, задача которых состоит в изучении скрытого статистического распределения обучающих данных с целью синтеза новых примеров, неотличимых от оригинальных. Концептуально они противопоставляются дискриминативным моделям: если дискриминативная модель учится проводить границу между классами P(Y|X), то генеративная моделирует полное совместное распределение P(X, Y) или просто P(X) в случае обучения без учителя.

В 2020-е годы генеративные модели стали главным двигателем AI-революции. Такие системы, как GPT-4, Stable Diffusion, Midjourney, DALL-E и Sora, демонстрируют возможности, ещё недавно казавшиеся фантастикой: создание профессиональных текстов, реалистичных изображений и видеороликов из текстового описания.

История и контекст развития

Корни генеративного моделирования уходят к байесовским вероятностным моделям и скрытым марковским моделям 1970–80-х годов. Ключевые вехи современной эпохи:

  • 2013 – Variational Autoencoder (VAE): Кингма и Уэллинг предложили архитектуру, сжимающую данные в латентное пространство и обучающуюся генерировать новые примеры через вариационный нижний предел ELBO.
  • 2014 – GAN (Generative Adversarial Network): Ян Гудфеллоу с соавторами опубликовали статью, предложив обучать генератор и дискриминатор в состязательном режиме. Это произвело революцию в синтезе изображений.
  • 2015–2020 – трансформеры: Архитектура Transformer (Vaswani et al., 2017) заменила рекуррентные сети, дав толчок языковым генеративным моделям – GPT, BERT, T5.
  • 2020–2022 – диффузионные модели: DDPM (Ho et al., 2020) и Stable Diffusion обогнали GAN по качеству генерации изображений, породив волну text-to-image сервисов.
  • 2023–2025 – мультимодальные генеративные системы: GPT-4V, Gemini, Sora расширили возможности до изображений, аудио и видео в едином LLM.

Основные архитектуры генеративных моделей

Современный ландшафт делится на несколько семейств:

  • GAN (Generative Adversarial Networks): Состязательная архитектура генератора и дискриминатора. Генератор преобразует случайный шум в данные, дискриминатор пытается отличить фейк от реального. Сильны в генерации изображений высокого разрешения.
  • VAE (Variational Autoencoder): Энкодер сжимает вход в нормальное распределение в латентном пространстве, декодер восстанавливает из выборки. Обеспечивает интерполируемое латентное пространство.
  • Диффузионные модели: Итеративно удаляют шум из зашумлённых данных, воспроизводя обратный процесс диффузии. DALL-E 2, Stable Diffusion, Midjourney основаны на этом принципе.
  • Авторегрессионные LLM: GPT-серия генерирует токен за токеном, оценивая вероятность P(xₜ|x₁...xₜ₋₁). Крупнейшие модели (GPT-4, Claude 3.5) содержат сотни миллиардов параметров.
  • Flow-based модели: Invertible normalizing flows (Glow, RealNVP) учат обратимое преобразование данных для точного вычисления плотности.

Где применяются генеративные модели

  • Медиа и дизайн: генерация иллюстраций, логотипов, шрифтов, редактирование фото и видео.
  • Разработка ПО: автодополнение кода (GitHub Copilot, Cursor), генерация тестов, документирование.
  • Маркетинг и реклама: автоматическое создание рекламных текстов, email-рассылок, SEO-контента.
  • Наука: AlphaFold 2 предсказывает структуры белков, генеративные модели синтезируют химические молекулы с заданными свойствами (drug discovery).
  • Игры и метавселенные: процедурная генерация локаций, персонажей, диалогов NPC.
  • Промышленность: синтез дефектных примеров для data augmentation в системах контроля качества.

Преимущества и ограничения

Преимущества: способность синтезировать неограниченное количество реалистичных данных, снижение стоимости контентного производства, обнаружение скрытых структур в данных, применение в областях с нехваткой размеченных данных.

Ограничения: нестабильность обучения GAN (mode collapse), высокие требования к вычислительным ресурсам, риск генерации дипфейков и дезинформации, галлюцинации в LLM, сложность оценки качества (нет единой метрики), авторские права на обучающие данные.

Связь с другими понятиями

Генеративные модели – надкатегория для GAN, диффузионных моделей и трансформеров. Они тесно связаны с механизмом attention, позволяющим модели фокусироваться на релевантных частях контекста. Качество генерации оценивается через перплексию (для текста), FID-score (для изображений) и другие метрики. В продуктивных системах требуют мониторинга модели для контроля дрейфа и деградации.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «Генеративные модели».

Платформы класса «Генеративные модели»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

Синтелли — российская SaaS-платформа хемоинформатики на базе ИИ от компании (ИНН 9731018049). Содержит базу да...
Цена по запросу
Подробнее →
СА

Сайбокс

Машинное обучение
ML / MLOps-платформа полного цикла от Т1 для разработки, обучения, развёртывания и мониторинга моделей машинно...
Цена по запросу
★ 4.7
Подробнее →
Программное обеспечение системы выявления инцидентов на дорогах с использованием технологий компьютерного зрен...
Цена по запросу
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «Генеративные модели».

Где применяется

Отрасли, в которых «Генеративные модели» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про Генеративные модели

Чем генеративные модели отличаются от дискриминативных?

Дискриминативные модели учатся разделять классы P(Y|X), генеративные – моделируют полное распределение данных P(X) и способны создавать новые примеры.

Какие бывают виды генеративных моделей?

GAN, VAE (вариационные автокодировщики), диффузионные модели, авторегрессионные LLM, normalizing flows – каждый вид имеет свои архитектурные особенности.

Что такое mode collapse в GAN?

Mode collapse – явление, когда генератор GAN начинает выдавать однообразные примеры, игнорируя разнообразие реальных данных.

Как оценить качество генеративной модели?

Для изображений – FID (Fréchet Inception Distance), IS (Inception Score); для текста – перплексия, BLEU, ROUGE; для молекул – validity и novelty.

Можно ли использовать генеративные модели без GPU?

Инференс небольших моделей (≤7B параметров) возможен на CPU, но обучение требует GPU или TPU – от 1 до тысяч устройств.

В каких отраслях генеративные модели применяются больше всего?

Медиа и дизайн, разработка ПО, маркетинг, фармацевтика (drug discovery), игровая индустрия и образование.