Термин · Глоссарий B2B-ПО

F1 (F1)

F1 – гармоническое среднее Precision и Recall: F1 = 2·(P·R)/(P+R). Сбалансированная метрика для оценки бинарных и мультиклассовых классификаторов. Достигает максимума 1 при идеальном классификаторе и равна нулю, если хотя бы одна из метрик нулевая.

Буква «F» В категориях: 3 Платформ: 6+

Введение

F1 – гармоническое среднее двух метрик качества классификатора: Precision (точности) и Recall (полноты). Формула:

F1 = 2 · (Precision · Recall) / (Precision + Recall)

Метрика принимает значения от 0 до 1, где 1 – идеальный классификатор (нет ни ложноположительных, ни ложноотрицательных предсказаний), 0 – если хотя бы одна из метрик равна нулю. F1 является одним из стандартных показателей оценки моделей машинного обучения, особенно при дисбалансе классов.

История и контекст

F-мера (F-measure, F-score) была введена Ван Ридсдорпом (1979) в контексте информационного поиска. В частном случае β=1 она называется F1 и даёт равный вес точности и полноте. В NLP F1 применяется как минимум с 1990-х годов для оценки задач именованных сущностей (NER), извлечения информации и машинного перевода. Сегодня F1 – одна из наиболее часто репортируемых метрик в ML-статьях и бенчмарках.

Как это работает

F1 строится на четырёх базовых величинах из матрицы ошибок:

  • TP (True Positive) – верно предсказанные положительные.
  • FP (False Positive) – ложноположительные (ошибочно отнесённые к положительному классу).
  • FN (False Negative) – ложноотрицательные (пропущенные положительные).
  • Precision = TP / (TP + FP); Recall = TP / (TP + FN).

Для мультиклассовых задач используются агрегации:

  • Macro F1 – среднее F1 по всем классам без взвешивания. Равномерно учитывает редкие классы.
  • Micro F1 – агрегирует TP, FP, FN по всем классам, затем вычисляет F1. Соответствует accuracy при сбалансированных классах.
  • Weighted F1 – среднее F1, взвешенное по числу примеров в классе.

Почему не accuracy?

При дисбалансе классов accuracy вводит в заблуждение: классификатор, предсказывающий всегда «отрицательный», достигает 99% accuracy при 1% положительных – но его F1 = 0. F1 учитывает оба вида ошибок.

Где применяется

  • NER и извлечение информации – стандартная метрика для оценки разметки именованных сущностей.
  • Классификация текста – тональный анализ, рубрикация, детектирование спама.
  • Антифрод – оценка детекторов мошенничества с крайне несбалансированными классами.
  • Медицинская диагностика – классификация патологий, где ложноотрицательные критичнее ложноположительных.
  • Информационный поиск – оценка точности и полноты поисковых систем.

Преимущества и ограничения

Преимущества: учитывает оба типа ошибок; устойчив при дисбалансе классов; интерпретируем; позволяет балансировать Precision и Recall через параметр β (F_β).

Ограничения: одинаково штрафует FP и FN – при необходимости приоритизировать один тип ошибок используют F_β (например, F2 при важности recall); не учитывает TP отрицательного класса (специфичность); при многоклассовой задаче выбор между Macro/Micro/Weighted влияет на интерпретацию.

Связь с другими понятиями

F1 – синтез Precision и Recall. ROUGE в метрике ROUGE-N F1 использует тот же принцип: объединяет ROUGE-recall и ROUGE-precision. В системе Evaluation (МО) F1 входит в стандартный набор метрик для классификационных задач. Кросс-валидация используется для надёжной оценки F1 на ограниченных датасетах. Регуляризация при обучении модели влияет на порог классификации и, следовательно, на соотношение Precision и Recall.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «F1».

Платформы класса «F1»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

Уникальные возможности ABBYY InfoExtractor SDK по выявлению в текстах объектов, фактов и связей между ними поз...
Цена по запросу
★ 4.5
Подробнее →
ФО

Форпост

Управление городской инфраструктурой
Форпост — программная платформа для построения масштабируемых систем видеонаблюдения и видеоаналитики на нейро...
Цена по запросу
★ 4.8
Подробнее →
Сервис идентификации потенциальных клиентов на сайте
Цена по запросу
Подробнее →
ТРАНСФЛОУ — модульная интеграционная платформа для построения интеллектуальных транспортных систем (ИТС). Разр...
Цена по запросу
★ 4.5
Подробнее →
ИВ

ИКАР видео волл контрол

Управление городской инфраструктурой
ИКАР видео волл контрол — программное обеспечение компании (ИНН 7838404170) для управления видеостенами (video...
Цена по запросу
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «F1».

Где применяется

Отрасли, в которых «F1» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про F1

Зачем использовать F1 вместо accuracy?

При несбалансированных классах accuracy вводит в заблуждение. F1 учитывает ложноположительные и ложноотрицательные ошибки, давая реалистичную оценку классификатора.

Что такое Macro F1 и Micro F1?

Macro F1 – среднее F1 по всем классам с равными весами, учитывает редкие классы. Micro F1 – агрегирует ошибки по всем классам вместе, соответствует accuracy при сбалансированных данных.

Что такое F-beta (F_β)?

Обобщённая версия F-меры: F_β = (1+β²)·P·R / (β²·P + R). При β=2 (F2) вдвое важнее recall; при β=0.5 (F0.5) вдвое важнее precision.

Что значит F1 = 0?

Precision или Recall равны нулю. Модель либо не предсказала ни одного положительного (Recall=0), либо все предсказания ошибочны (Precision=0).

Как F1 применяется в NER?

В NER сущность засчитывается как TP только при точном совпадении типа и границ с эталоном. Macro F1 по типам сущностей – стандартная метрика для задач NER (CoNLL-2003 и др.).