JET School

Что такое F1 Score?

F1 Score — это широко используемый показатель оценки в машинном обучении и статистическом анализе. Он особенно популярен при работе с задачами бинарной классификации, то есть когда модель должна определить, относится ли объект к классу "положительный" или "отрицательный".

F1 Score представляет собой гармоническое среднее между точностью (precision) и полнотой (recall). Его основная цель — дать сбалансированную оценку, учитывающую как способность модели точно классифицировать положительные примеры, так и способность обнаруживать все релевантные случаи.

Это особенно важно при несбалансированных выборках, когда один класс встречается значительно чаще другого.

Ключевые понятия:

Чтобы глубже понять F1 Score, нужно сначала разобраться в нескольких основных терминах:

  • Precision (Точность):
  • Какую долю из всех предсказанных моделью «положительных» случаев действительно составляют истинные положительные?
  • Формула: Precision = TP / (TP + FP)
  • Recall (Полнота):
  • Какую долю из всех реальных положительных примеров модель правильно распознала?
  • Формула: Recall = TP / (TP + FN)
  • TP (True Positive / Истинно положительные):
  • Модель правильно определила положительный класс.
  • FP (False Positive / Ложно положительные):
  • Модель ошибочно определила отрицательный пример как положительный.
  • FN (False Negative / Ложно отрицательные):
  • Модель не распознала настоящий положительный пример и отнесла его к отрицательному.

Формула F1 Score:

F1=2×(Precision×RecallPrecision+Recall)

​Это гармоническое среднее, которое, в отличие от арифметического среднего, сильнее «штрафует» несбалансированность между precision и recall.

Что показывает F1 Score?

  • 1.0 (или 100%) — идеальный результат: модель полностью точна и обнаруживает все положительные случаи.
  • 0.0 — модель совершенно не справляется с задачей классификации положительных примеров.
  • Значения от 0 до 1 — показывают общий баланс между точностью и полнотой. Чем ближе к 1, тем эффективнее модель.

Зачем нужен F1 Score?

F1 Score особенно полезен в следующих ситуациях:

🔹 Несбалансированные данные

Например, 95% объектов — «отрицательные», 5% — «положительные».

Простая точность (accuracy) может ввести в заблуждение: модель, классифицирующая все как «отрицательные», будет иметь 95% точность, но по сути бесполезна.

F1 Score в таких случаях дает более честную оценку.

🔹 Ошибки имеют высокую цену

Например:

  • В диагностике заболеваний (лучше лишний раз заподозрить болезнь, чем её пропустить),
  • В системах выявления мошенничества,
  • В системах безопасности и мониторинга.

Сравнение: F1 Score против Accuracy

ПоказательЧто измеряетКогда уместноAccuracyОбщая доля верных предсказанийКогда классы сбалансированыF1 ScoreБаланс между точностью и полнотойКогда классы несбалансированы или важны FP и FN


Пример:

Предположим, у нас есть 100 тестовых примеров, из которых 10 — положительные.

Модель верно определила 6 из них (TP = 6), ошибочно классифицировала 2 отрицательных как положительные (FP = 2), и пропустила 4 положительных (FN = 4).

  • Precision = 6 / (6 + 2) = 0.75
  • Recall = 6 / (6 + 4) = 0.6
  • F1 Score = 2 × (0.75 × 0.6) / (0.75 + 0.6) = 0.666

Это говорит о том, что модель показывает средний уровень качества и может быть улучшена.

Вывод:

F1 Score — это важный и надежный метрика оценки моделей машинного обучения, особенно когда:

  • Классы распределены неравномерно,
  • Ошибки классификации имеют большую значимость,
  • Требуется баланс между тем, насколько модель "осторожна" (precision) и "чувствительна" (recall).

Он помогает не просто измерить количество верных предсказаний, а оценить реальное качество модели в условиях неопределенности и риска.

Теги:

Присоединяйтесь к нашим курсам для углубленного изучения области ИТ. Отправьте запрос для получения подробной информации!