Норникель — MetalGPT-1: доменная языковая модель для металлургии и горнодобычи
Описание проекта
«Норникель» разработал MetalGPT-1 — первую в мире доменную языковую модель на 32 млрд параметров, специально оптимизированную для металлургии и горнодобывающей промышленности. Модель обучена на 10 ГБ профильных текстов (сопоставимо с половиной англоязычной Википедии) и более 1 миллиона закрытых внутренних документов: технологических протоколов, регламентов, патентов, НИОКР-отчётов, проектной документации. Дополнительно создано 500 000 вопросно-ответных пар на реальных производственных задачах. На базе MetalGPT-1 «Норникель» создаёт персональных ИИ-ассистентов и автономных агентов для инженерных, технологических и корпоративных задач. Модель и промышленный бенчмарк по металлургии опубликованы в открытом доступе на Hugging Face.
Задача
Универсальные LLM (GPT-4, Claude, Llama) плохо понимают специализированную металлургическую терминологию, сокращения и сложные технологические цепочки, что приводит к галлюцинациям и снижает качество ИИ-решений для производственных и инженерных задач.
Цели внедрения
-
Создать языковой слой для инженерных, технологических, производственных и корпоративных задач металлургии
-
Снизить уровень «галлюцинаций» ИИ в производственных сценариях
-
Обеспечить базу для создания ИИ-ассистентов и автономных агентов внутри компании
-
Поделиться моделью с отраслью (open source)
Результаты
-
Финансы
-
Прямой финансовый эффект от MetalGPT-1 не раскрыт (модель находится в начале пути к промышленному применению) Время
-
Разработка заняла ~1 год: 6 мес. — сбор и подготовка данных, 2 мес. — базовое обучение, 2 мес. — доменная адаптация и fine-tuning Качество и эффективность
-
На промышленном бенчмарке по металлургии MetalGPT-1 стабильно превосходит открытые универсальные модели
-
Первая в мире доменная LLM 32B параметров, специально оптимизированная под металлургию
-
Обучена на >1 млн документов, недоступных в открытых источниках Нагрузка и масштаб
-
Модель доступна всей индустрии через Hugging Face (open source)
-
Внутри «Норникеля» — база для ИИ-ассистентов во всех подразделениях Надёжность
-
Все обучающие данные прошли многоступенчатую очистку и анонимизацию для защиты коммерческой тайны Импортозамещение и compliance
-
Отечественная разработка, полностью независима от зарубежных LLM-сервисов
-
Данные обрабатываются внутри периметра «Норникеля» Качественный эффект: Стратегический актив — первый в России открытый промышленный LLM для горно-металлургической отрасли; создаёт инструменты для всей индустрии.