Что такое F1 Score?
F1 Score — это широко используемый показатель оценки в машинном обучении и статистическом анализе. Он особенно популярен при работе с задачами бинарной классификации, то есть когда модель должна определить, относится ли объект к классу "положительный" или "отрицательный".
F1 Score представляет собой гармоническое среднее между точностью (precision) и полнотой (recall). Его основная цель — дать сбалансированную оценку, учитывающую как способность модели точно классифицировать положительные примеры, так и способность обнаруживать все релевантные случаи.
Это особенно важно при несбалансированных выборках, когда один класс встречается значительно чаще другого.
Ключевые понятия:
Чтобы глубже понять F1 Score, нужно сначала разобраться в нескольких основных терминах:
- Precision (Точность):
- Какую долю из всех предсказанных моделью «положительных» случаев действительно составляют истинные положительные?
- Формула: Precision = TP / (TP + FP)
- Recall (Полнота):
- Какую долю из всех реальных положительных примеров модель правильно распознала?
- Формула: Recall = TP / (TP + FN)
- TP (True Positive / Истинно положительные):
- Модель правильно определила положительный класс.
- FP (False Positive / Ложно положительные):
- Модель ошибочно определила отрицательный пример как положительный.
- FN (False Negative / Ложно отрицательные):
- Модель не распознала настоящий положительный пример и отнесла его к отрицательному.
Формула F1 Score:
F1=2×(Precision×RecallPrecision+Recall)
Это гармоническое среднее, которое, в отличие от арифметического среднего, сильнее «штрафует» несбалансированность между precision и recall.
Что показывает F1 Score?
- 1.0 (или 100%) — идеальный результат: модель полностью точна и обнаруживает все положительные случаи.
- 0.0 — модель совершенно не справляется с задачей классификации положительных примеров.
- Значения от 0 до 1 — показывают общий баланс между точностью и полнотой. Чем ближе к 1, тем эффективнее модель.
Зачем нужен F1 Score?
F1 Score особенно полезен в следующих ситуациях:
🔹 Несбалансированные данные
Например, 95% объектов — «отрицательные», 5% — «положительные».
Простая точность (accuracy) может ввести в заблуждение: модель, классифицирующая все как «отрицательные», будет иметь 95% точность, но по сути бесполезна.
F1 Score в таких случаях дает более честную оценку.
🔹 Ошибки имеют высокую цену
Например:
- В диагностике заболеваний (лучше лишний раз заподозрить болезнь, чем её пропустить),
- В системах выявления мошенничества,
- В системах безопасности и мониторинга.
Сравнение: F1 Score против Accuracy
ПоказательЧто измеряетКогда уместноAccuracyОбщая доля верных предсказанийКогда классы сбалансированыF1 ScoreБаланс между точностью и полнотойКогда классы несбалансированы или важны FP и FN
Пример:
Предположим, у нас есть 100 тестовых примеров, из которых 10 — положительные.
Модель верно определила 6 из них (TP = 6), ошибочно классифицировала 2 отрицательных как положительные (FP = 2), и пропустила 4 положительных (FN = 4).
- Precision = 6 / (6 + 2) = 0.75
- Recall = 6 / (6 + 4) = 0.6
- F1 Score = 2 × (0.75 × 0.6) / (0.75 + 0.6) = 0.666
Это говорит о том, что модель показывает средний уровень качества и может быть улучшена.
Вывод:
F1 Score — это важный и надежный метрика оценки моделей машинного обучения, особенно когда:
- Классы распределены неравномерно,
- Ошибки классификации имеют большую значимость,
- Требуется баланс между тем, насколько модель "осторожна" (precision) и "чувствительна" (recall).
Он помогает не просто измерить количество верных предсказаний, а оценить реальное качество модели в условиях неопределенности и риска.
singleCoursePage.contactFormTitle
Присоединяйтесь к нашим курсам для углубленного изучения области ИТ. Отправьте запрос для получения подробной информации!