F1 Score

F1 Score — это широко используемый показатель оценки в машинном обучении и статистическом анализе. Он особенно популярен при работе с задачами бинарной классификации, то есть когда модель должна определить, относится ли объект к классу "положительный" или "отрицательный".

F1 Score представляет собой гармоническое среднее между точностью (precision) и полнотой (recall). Его основная цель — дать сбалансированную оценку, учитывающую как способность модели точно классифицировать положительные примеры, так и способность обнаруживать все релевантные случаи.

Это особенно важно при несбалансированных выборках, когда один класс встречается значительно чаще другого.

Ключевые понятия:

Чтобы глубже понять F1 Score, нужно сначала разобраться в нескольких основных терминах:

Precision (Точность):
Какую долю из всех предсказанных моделью «положительных» случаев действительно составляют истинные положительные?
Формула: Precision = TP / (TP + FP)
Recall (Полнота):
Какую долю из всех реальных положительных примеров модель правильно распознала?
Формула: Recall = TP / (TP + FN)
TP (True Positive / Истинно положительные):
Модель правильно определила положительный класс.
FP (False Positive / Ложно положительные):
Модель ошибочно определила отрицательный пример как положительный.
FN (False Negative / Ложно отрицательные):
Модель не распознала настоящий положительный пример и отнесла его к отрицательному.

Формула F1 Score:

F1=2×(Precision×RecallPrecision+Recall)

Это гармоническое среднее, которое, в отличие от арифметического среднего, сильнее «штрафует» несбалансированность между precision и recall.

Что показывает F1 Score?

1.0 (или 100%) — идеальный результат: модель полностью точна и обнаруживает все положительные случаи.
0.0 — модель совершенно не справляется с задачей классификации положительных примеров.
Значения от 0 до 1 — показывают общий баланс между точностью и полнотой. Чем ближе к 1, тем эффективнее модель.

Зачем нужен F1 Score?

F1 Score особенно полезен в следующих ситуациях:

🔹 Несбалансированные данные

Например, 95% объектов — «отрицательные», 5% — «положительные».

Простая точность (accuracy) может ввести в заблуждение: модель, классифицирующая все как «отрицательные», будет иметь 95% точность, но по сути бесполезна.

F1 Score в таких случаях дает более честную оценку.

🔹 Ошибки имеют высокую цену

Например:

В диагностике заболеваний (лучше лишний раз заподозрить болезнь, чем её пропустить),
В системах выявления мошенничества,
В системах безопасности и мониторинга.

Сравнение: F1 Score против Accuracy

ПоказательЧто измеряетКогда уместноAccuracyОбщая доля верных предсказанийКогда классы сбалансированыF1 ScoreБаланс между точностью и полнотойКогда классы несбалансированы или важны FP и FN

Пример:

Предположим, у нас есть 100 тестовых примеров, из которых 10 — положительные.

Модель верно определила 6 из них (TP = 6), ошибочно классифицировала 2 отрицательных как положительные (FP = 2), и пропустила 4 положительных (FN = 4).

Precision = 6 / (6 + 2) = 0.75
Recall = 6 / (6 + 4) = 0.6
F1 Score = 2 × (0.75 × 0.6) / (0.75 + 0.6) = 0.666

Это говорит о том, что модель показывает средний уровень качества и может быть улучшена.

Вывод:

F1 Score — это важный и надежный метрика оценки моделей машинного обучения, особенно когда:

Классы распределены неравномерно,
Ошибки классификации имеют большую значимость,
Требуется баланс между тем, насколько модель "осторожна" (precision) и "чувствительна" (recall).

Он помогает не просто измерить количество верных предсказаний, а оценить реальное качество модели в условиях неопределенности и риска.

JET School

Что такое F1 Score?

Ключевые понятия:

Формула F1 Score:

Что показывает F1 Score?

Зачем нужен F1 Score?

🔹 Несбалансированные данные

🔹 Ошибки имеют высокую цену

Сравнение: F1 Score против Accuracy

Пример:

Вывод:

Теги:

Телефон

WhatsApp

Эл. почта

Филиал Гянджлик

Филиал Хатаи