JET School

Что такое Underfitting?

Underfitting (недообучение) — это ситуация, когда модель машинного обучения не может уловить основные закономерности в данных. В результате она показывает низкую точность как на обучающих, так и на тестовых данных. Это означает, что модель слишком простая для решаемой задачи и недостаточно обучена.

Почему возникает underfitting?

Недообучение может возникать по нескольким причинам:

  • Модель слишком простая (например, линейная модель при наличии сложных зависимостей).
  • В данных недостаточно признаков или они плохо отобраны.
  • Модель обучалась слишком мало (например, слишком малое количество эпох).
  • Недостаточная предварительная обработка данных (preprocessing).
  • Плохая настройка гиперпараметров.

Признаки underfitting:

  • Низкая точность (accuracy) как на обучающем, так и на тестовом наборе.
  • Высокая ошибка даже на известных данных.
  • Модель не улавливает даже очевидные тренды.
  • Разница между предсказанными и реальными значениями большая.

Как бороться с underfitting:

  1. Использовать более сложную модель (например, добавить слои в нейронной сети).
  2. Добавить больше информативных признаков (feature engineering).
  3. Увеличить время обучения (больше эпох или итераций).
  4. Настроить гиперпараметры модели.
  5. Проверить качество и полноту данных.

Заключение:

Недообучение — это ситуация, при которой модель не получает достаточно информации из данных и, как следствие, не может делать качественные прогнозы. Идеальная модель должна избегать как переобучения (overfitting), так и недообучения (underfitting) и уметь обобщать знания на новых данных.

Теги:

Присоединяйтесь к нашим курсам для углубленного изучения области ИТ. Отправьте запрос для получения подробной информации!