Введение
GigaChat – семейство больших языковых моделей, разработанных Сбером (SberDevices / Лаборатория ИИ). Первая публичная версия была представлена в апреле 2023 года. В марте 2025 года выпущена линейка GigaChat 2 с тремя моделями – Lite, Pro и Max, – все с контекстным окном 128 000 токенов.
GigaChat позиционируется как суверенная российская альтернатива ChatGPT: все данные обрабатываются на серверах в РФ, что соответствует требованиям 152-ФЗ о локализации персональных данных. Модель доступна через REST API на developers.sber.ru с авторизацией OAuth 2.0.
История и контекст
Разработка началась в 2022 году в SberAI, входящем в экосистему SberDevices. Параллельно Сбер развивал открытую модель ruGPT и экспериментировал с fine-tuning LLaMA на русских данных (Saiga). GigaChat создавался как полностью проприетарная разработка с RLHF-выравниванием под предпочтения русскоязычных пользователей.
На конференции SberAI Day 2023 была представлена первая публичная версия. К 2025 году вышел GigaChat 2 с принципиальными улучшениями: качество на бенчмарке ru_llm_arena для GigaChat 2 Max достигло 82,5 баллов (против 72,5 у предыдущего поколения), а на arena_hard_ru – 83,5 баллов.
Как это работает
GigaChat построен на архитектуре трансформера с обучением по методологии RLHF. Ключевые технические возможности API:
- Контекстное окно 128K токенов для всех моделей GigaChat 2 – позволяет обрабатывать длинные документы и многошаговые диалоги.
- Function Calling: модель может вызывать внешние функции и сервисы, поддерживает множественные и контекстные вызовы в рамках одного запроса.
- Embeddings API: модели
Embeddings(512 токенов, 1024 dim) иEmbeddingsGigaR(4096 токенов, 2560 dim) для семантического поиска и RAG. - Vision: GigaChat 2 Pro и Max анализируют изображения (base64 или URL), до 10 изображений на диалог.
- Совместимость с OpenAI SDK: GigaChat API реализует OpenAI-совместимый интерфейс, позволяя легко мигрировать существующий код.
Где применяется
- Корпоративные ассистенты: внутренние чат-боты для ответов сотрудникам на вопросы о регламентах и процессах.
- RAG-системы: извлечение информации из корпоративных баз знаний с GigaChat Embeddings для индексирования.
- Генерация документов: составление деловых писем, отчётов, технических описаний на русском языке.
- Программирование: помощь разработчикам – генерация, объяснение и отладка кода.
- AI-агенты: построение агентных систем через GigaChain (форк LangChain) с поддержкой мультиагентных сценариев.
Преимущества и ограничения
Преимущества: российская юрисдикция, все данные в РФ; отличное качество на русском языке (обогнал GPT-4o на MERA); OpenAI-совместимый API; поддержка GigaChain (LangChain-fork); пакетный режим для асинхронной обработки.
Ограничения: закрытая модель – fine-tuning только через SberDevices по договорённости; ограничение: только 1 function call на запрос (в базовом API); ограничение изображений до 10 на диалог; зависимость от инфраструктуры Сбера.
Связь с другими понятиями
GigaChat – конкурент YandexGPT в сегменте российских LLM. Модели работают на нейросетевых платформах (PyTorch) и деплоятся в облачной инфраструктуре Сбера. Диалоговый ИИ и семантический поиск строятся поверх GigaChat API. Для RAG используются GigaChat Embeddings совместно с векторными базами данных (pgvector, Qdrant).