Overfitting (həddindən artıq uyğunlaşma) — maşın öyrənməsi və data elmi sahəsində modelin məşq (training) məlumatlarına həddindən artıq uyğunlaşdığı vəziyyətdir. Bu zaman model yalnız öyrəndiyi məlumatlara çox yaxşı nəticə verir, lakin yeni və görmədiyi test məlumatları üzərində zəif nəticə göstərir. Yəni, model ümumiləşdirmə qabiliyyətini itirir.
Niyə Overfitting baş verir?
Overfitting-in əsas səbəbi modelin çox kompleks olması və ya məlumatların içindəki təsadüfi səs-küyü (noise) də öyrənməyə çalışmasıdır. Bu, xüsusilə aşağıdakı hallarda baş verə bilər:
- Məlumatların sayı az olduqda
- Model çox mürəkkəb olduqda (məsələn, çox qatlı neyron şəbəkələr)
- Model uzun müddət məşq edildikdə (over-training)
- Məlumatlarda səs-küy və ya uyğunsuzluq olduqda
Overfitting-in əlamətləri:
- Məşq dəqiqliyi çox yüksəkdir, lakin test dəqiqliyi aşağıdır
- Model test məlumatlarında stabil olmayan, dəyişkən nəticələr verir
- Sadə nümunələri belə düzgün proqnozlaşdıra bilmir
Overfitting-in qarşısını alma yolları:
- Daha çox məlumat toplamaq – Modelin ümumiləşdirmə qabiliyyəti artır.
- Regularizasiya üsullarından istifadə etmək – (L1, L2 regularization).
- Modelin mürəkkəbliyini azaltmaq – Daha sadə modellər seçmək.
- Dropout və ya erkən dayandırma (early stopping) kimi texnikalardan istifadə.
- Cross-validation üsulundan istifadə edərək modelin müxtəlif bölmələr üzərində sınaqdan keçirilməsi.