ИИ-пилот автоматического контроля качества статистических данных (Росстат)
Описание проекта
-
Федеральная служба государственной статистики (Росстат) в 2024–2025 годах ведёт пилотирование ИИ-технологий для автоматизации ключевых этапов обработки статистической отчётности. Пресс-служба Росстата подтвердила тестирование автоматического модельного поиска ошибок в заполняемых формах статистического наблюдения. Функционал включает:
-
автоматическое обнаружение ошибок в формах (выходящие за норму значения, логические противоречия);
-
автоматическое исправление очевидных ошибок;
-
оценку полноты данных (выявление незаполненных обязательных полей);
-
обработку и трансформацию данных;
-
формирование описательной статистики. Параллельно в рамках утверждённой в январе 2025 года Стратегии развития системы государственной статистики и Росстата до 2030 года (утв. Постановлением Правительства РФ, январь 2025) зафиксированы цели масштабного применения ИИ для оперативной обработки собираемых данных. Стратегию анонсировал председатель Правительства РФ Михаил Мишустин на оперативном совещании с вице-премьерами 20 января 2025 года. К 2030 году планируется:
-
снижение нагрузки на респондентов статнаблюдения на 50% (благодаря ИИ-автоматизации сбора и проверки данных);
-
предоставление 100% статистических показателей в электронном виде через единую цифровую аналитическую платформу;
-
повышение удовлетворённости пользователей официальной статистикой до 95%.
Задача
Ежегодно Росстат собирает отчётность от ~248 тыс. организаций по сотням форм статнаблюдения. Ручная проверка заполнения форм, поиск логических ошибок и противоречий — колоссальные трудозатраты. Ошибочные данные снижают качество государственной статистики и достоверность экономической аналитики. Требовался автоматизированный инструмент верификации данных.
Цели внедрения
-
Автоматизировать обнаружение и исправление ошибок в формах статнаблюдения
-
Снизить нагрузку на респондентов за счёт предиктивного заполнения и авто-верификации
-
Повысить достоверность и полноту официальной статистики
Результаты
-
Время
-
Автоматическая проверка формы — секунды против часов ручной обработки (предварительные оценки пилота) Качество и эффективность
-
Тестируется обнаружение аномальных значений и логических противоречий в формах, которые ранее пропускались при ручной проверке
-
Целевые показатели к 2030: нагрузка на респондентов снижена на 50%; 100% показателей — в цифровом формате Нагрузка и масштаб
-
Охват статнаблюдения: ~248 тыс. организаций; сотни форм (3-ИНФОРМ, П-1, ПМ и другие)
-
Пилот ведётся в рамках разработки цифровой аналитической платформы Росстата Импортозамещение и compliance
-
Реализуется на отечественной инфраструктуре; соответствие требованиям к обработке данных государственной статистики Качественный эффект: Стратегия Росстата до 2030 года закрепляет ИИ как базовую технологию государственной статистики. Пилот автоматического поиска ошибок создаёт основу для перехода от реактивной проверки (после сбора данных) к проактивной верификации в реальном времени. Это кардинально меняет архитектуру государственного статнаблюдения.