Термин · Глоссарий B2B-ПО

Генеративные модели

Генеративные модели – класс алгоритмов машинного обучения, обучающихся моделировать распределение обучающих данных для генерации новых реалистичных примеров: текстов, изображений, аудио, видео и молекул. В отличие от дискриминативных моделей, генеративные учатся воспроизводить структуру данных, а не только разделять классы.

Буква «Г» В категориях: 3 Платформ: 6+

Что такое генеративные модели

Генеративные модели – это класс алгоритмов машинного обучения, задача которых состоит в изучении скрытого статистического распределения обучающих данных с целью синтеза новых примеров, неотличимых от оригинальных. Концептуально они противопоставляются дискриминативным моделям: если дискриминативная модель учится проводить границу между классами P(Y|X), то генеративная моделирует полное совместное распределение P(X, Y) или просто P(X) в случае обучения без учителя.

В 2020-е годы генеративные модели стали главным двигателем AI-революции. Такие системы, как GPT-4, Stable Diffusion, Midjourney, DALL-E и Sora, демонстрируют возможности, ещё недавно казавшиеся фантастикой: создание профессиональных текстов, реалистичных изображений и видеороликов из текстового описания.

История и контекст развития

Корни генеративного моделирования уходят к байесовским вероятностным моделям и скрытым марковским моделям 1970–80-х годов. Ключевые вехи современной эпохи:

2013 – Variational Autoencoder (VAE): Кингма и Уэллинг предложили архитектуру, сжимающую данные в латентное пространство и обучающуюся генерировать новые примеры через вариационный нижний предел ELBO.
2014 – GAN (Generative Adversarial Network): Ян Гудфеллоу с соавторами опубликовали статью, предложив обучать генератор и дискриминатор в состязательном режиме. Это произвело революцию в синтезе изображений.
2015–2020 – трансформеры: Архитектура Transformer (Vaswani et al., 2017) заменила рекуррентные сети, дав толчок языковым генеративным моделям – GPT, BERT, T5.
2020–2022 – диффузионные модели: DDPM (Ho et al., 2020) и Stable Diffusion обогнали GAN по качеству генерации изображений, породив волну text-to-image сервисов.
2023–2025 – мультимодальные генеративные системы: GPT-4V, Gemini, Sora расширили возможности до изображений, аудио и видео в едином LLM.

Основные архитектуры генеративных моделей

Современный ландшафт делится на несколько семейств:

GAN (Generative Adversarial Networks): Состязательная архитектура генератора и дискриминатора. Генератор преобразует случайный шум в данные, дискриминатор пытается отличить фейк от реального. Сильны в генерации изображений высокого разрешения.
VAE (Variational Autoencoder): Энкодер сжимает вход в нормальное распределение в латентном пространстве, декодер восстанавливает из выборки. Обеспечивает интерполируемое латентное пространство.
Диффузионные модели: Итеративно удаляют шум из зашумлённых данных, воспроизводя обратный процесс диффузии. DALL-E 2, Stable Diffusion, Midjourney основаны на этом принципе.
Авторегрессионные LLM: GPT-серия генерирует токен за токеном, оценивая вероятность P(xₜ|x₁...xₜ₋₁). Крупнейшие модели (GPT-4, Claude 3.5) содержат сотни миллиардов параметров.
Flow-based модели: Invertible normalizing flows (Glow, RealNVP) учат обратимое преобразование данных для точного вычисления плотности.

Где применяются генеративные модели

Медиа и дизайн: генерация иллюстраций, логотипов, шрифтов, редактирование фото и видео.
Разработка ПО: автодополнение кода (GitHub Copilot, Cursor), генерация тестов, документирование.
Маркетинг и реклама: автоматическое создание рекламных текстов, email-рассылок, SEO-контента.
Наука: AlphaFold 2 предсказывает структуры белков, генеративные модели синтезируют химические молекулы с заданными свойствами (drug discovery).
Игры и метавселенные: процедурная генерация локаций, персонажей, диалогов NPC.
Промышленность: синтез дефектных примеров для data augmentation в системах контроля качества.

Преимущества и ограничения

Преимущества: способность синтезировать неограниченное количество реалистичных данных, снижение стоимости контентного производства, обнаружение скрытых структур в данных, применение в областях с нехваткой размеченных данных.

Ограничения: нестабильность обучения GAN (mode collapse), высокие требования к вычислительным ресурсам, риск генерации дипфейков и дезинформации, галлюцинации в LLM, сложность оценки качества (нет единой метрики), авторские права на обучающие данные.

Связь с другими понятиями

Генеративные модели – надкатегория для GAN, диффузионных моделей и трансформеров. Они тесно связаны с механизмом attention, позволяющим модели фокусироваться на релевантных частях контекста. Качество генерации оценивается через перплексию (для текста), FID-score (для изображений) и другие метрики. В продуктивных системах требуют мониторинга модели для контроля дрейфа и деградации.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «Генеративные модели».

Платформы класса «Генеративные модели»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

Автоматизированная система обеспечения надежности и качества аппаратуры (АСОНИКА)

Система АСОНИКА предназначена для анализа и обеспечения стойкости радиоэлектронных средств (РЭС) к комплексным...

Цена по запросу

Подробнее →

С-

Синтелли - программный комплекс хемоинформатики на базе искусственного интеллекта для решения задач органической и медицинской химии

ML-платформы

Синтелли — российская SaaS-платформа хемоинформатики на базе ИИ от компании (ИНН 9731018049). Содержит базу да...

Цена по запросу

Подробнее →

СА

Сайбокс

Машинное обучение

ML / MLOps-платформа полного цикла от Т1 для разработки, обучения, развёртывания и мониторинга моделей машинно...

Цена по запросу

★ 4.7

Подробнее →

Контейнер для создания дополнительных приложений "ALIOTH DPFS"

АЛИОТ осуществляет полный цикл производства пластиковых карт от разработки дизайна до непосредственного выпуск...

Цена по запросу

★ 4.3

Подробнее →

ПО

Программное обеспечение Система выявления инцидентов на основе технологий компьютерного зрения (Computer vision traffic incident system)

Машинное обучение

Программное обеспечение системы выявления инцидентов на дорогах с использованием технологий компьютерного зрен...

Цена по запросу

Подробнее →

ПК

Программный комплекс интеллектуального видеомониторинга и уведомлений "VIDEOfor"

Машинное обучение

ПК интеллектуального видеомониторинга на основе AI: детекция людей, транспорта, нарушений, голосовое оповещени...

Цена по запросу

★ 4.7

Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «Генеративные модели».

Машинное обучение Платформы ИИ/GenAI Большие языковые модели (LLM)

Где применяется

Отрасли, в которых «Генеративные модели» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Цифровые услуги (B2C, e-commerce, онлайн-сервисы)

Медиа, искусство и развлечения

Маркетинг и реклама

Наука и НИИ

Частые вопросы про Генеративные модели

Чем генеративные модели отличаются от дискриминативных?

Дискриминативные модели учатся разделять классы P(Y|X), генеративные – моделируют полное распределение данных P(X) и способны создавать новые примеры.

Какие бывают виды генеративных моделей?

GAN, VAE (вариационные автокодировщики), диффузионные модели, авторегрессионные LLM, normalizing flows – каждый вид имеет свои архитектурные особенности.

Что такое mode collapse в GAN?

Mode collapse – явление, когда генератор GAN начинает выдавать однообразные примеры, игнорируя разнообразие реальных данных.

Как оценить качество генеративной модели?

Для изображений – FID (Fréchet Inception Distance), IS (Inception Score); для текста – перплексия, BLEU, ROUGE; для молекул – validity и novelty.

Можно ли использовать генеративные модели без GPU?

Инференс небольших моделей (≤7B параметров) возможен на CPU, но обучение требует GPU или TPU – от 1 до тысяч устройств.

В каких отраслях генеративные модели применяются больше всего?

Медиа и дизайн, разработка ПО, маркетинг, фармацевтика (drug discovery), игровая индустрия и образование.

Что такое генеративные модели

История и контекст развития

Основные архитектуры генеративных моделей

Где применяются генеративные модели

Преимущества и ограничения

Связь с другими понятиями

Связанные термины

Платформы класса «Генеративные модели»

Автоматизированная система обеспечения надежности и качества аппаратуры (АСОНИКА)

Синтелли - программный комплекс хемоинформатики на базе искусственного интеллекта для решения задач органической и медицинской химии

Сайбокс

Контейнер для создания дополнительных приложений "ALIOTH DPFS"

Программное обеспечение Система выявления инцидентов на основе технологий компьютерного зрения (Computer vision traffic incident system)

Программный комплекс интеллектуального видеомониторинга и уведомлений "VIDEOfor"

Категории каталога

Где применяется

Частые вопросы про Генеративные модели

Чем генеративные модели отличаются от дискриминативных?

Какие бывают виды генеративных моделей?

Что такое mode collapse в GAN?

Как оценить качество генеративной модели?

Можно ли использовать генеративные модели без GPU?

В каких отраслях генеративные модели применяются больше всего?

Yandex Browser

Регистрация посещения объекта общественного питания для подписки на уведомления о возможном контакте с заболевшим новой коронавирусной инфекцией

Контур Маркет + ОФД — интегрированная платформа для розничной торговли