JET School

F1 Score nədir?

F1 Score, maşın öyrənməsi və statistik analiz sahəsində geniş istifadə olunan qiymətləndirmə göstəricisidir. Bu göstərici əsasən ikili təsnifat (binary classification) modellərinin performansını qiymətləndirmək üçün istifadə olunur və dəqiqlik (precision)tamlıq (recall) arasında harmonik orta kimi hesablanır.

F1 Score-un əsas məqsədi – modelin həm düzgün təsnif etmə qabiliyyətini (precision), həm də bütün uyğun nümunələri tapmaq qabiliyyətini (recall) nəzərə alaraq ümumi performansını ölçməkdir. Bu, xüsusilə tarazsız verilənlər toplusu (imbalanced dataset) ilə işləyərkən vacib olur.

Əsas anlayışlar:

F1 Score-u daha yaxşı başa düşmək üçün əvvəlcə üç əsas terminlə tanış olaq:

Precision (dəqiqlik):

Modelin "müsbət" kimi təsnif etdiyi nümunələrdən neçəsi həqiqətən müsbət idi?

Precision = TP / (TP + FP)

Recall (tamlıq):

Həqiqətən müsbət olan nümunələrin neçəsini model düzgün aşkar edə bildi?

Recall = TP / (TP + FN)

TP (True Positive):

Həm modelin, həm də həqiqi nəticənin "müsbət" olduğu hallar.

FP (False Positive):

Modelin "müsbət" dediyi, amma əslində "mənfi" olan hallar.

FN (False Negative):

Modelin "mənfi" dediyi, amma əslində "müsbət" olan hallar.

F1 Score-un riyazi ifadəsi:

F1 Score aşağıdakı formula ilə hesablanır:

F1=2×(Precision×Recall/Precision+Recall)

Bu formul harmonik orta kimi tanınır. Harmonik orta, aritmetik ortadan fərqli olaraq, dəyərlər arasında balans olmadıqda daha ədalətli nəticə verir.

F1 Score nəyi göstərir?

  • 1.0 (yəni 100%): Model həm yüksək dəqiqliyə, həm də yüksək tamlığa malikdir – ideal nəticə.
  • 0.0: Model heç bir düzgün müsbət nümunə tapa bilməyib.
  • Aralıq dəyərlər (0 ilə 1 arasında): Modelin performans səviyyəsini göstərir. Nə qədər yüksəkdirsə, model bir o qədər balanslı və effektivdir.

Nə üçün F1 Score vacibdir?

F1 Score, xüsusilə aşağıdakı hallarda əhəmiyyətlidir:

  • Verilənlər tarazsızdırsa (məsələn, 95% "mənfi", 5% "müsbət")
  • Belə vəziyyətdə sadə dəqiqlik göstəricisi (accuracy) modelin həqiqi performansını düzgün əks etdirməyə bilər. Model yalnız mənfi sinfi tapmaqla 95% dəqiqlik göstərə bilər, amma müsbət halları tamamilə nəzərə almaya bilər.
  • Yanlış mənfi və yanlış müsbət hallar ciddi nəticələr doğura bilərsə
  • Məsələn: tibbi diaqnoz, fırıldaqçılığın aşkarlanması, təhlükəsizlik sistemləri və s.

Müqayisə üçün: F1 vs Accuracy

Ölçü vahidiNəyi ölçür?Uyğun olduğu halAccuracyDüzgün təsnif olunan nümunələrin ümumi faiziniVerilənlər tarazlı olduqdaF1 ScorePrecision və Recall arasında balansıVerilənlər tarazsız olduqda və ya həm FP, həm də FN mühüm əhəmiyyət kəsb etdikdə


Nümunə ilə izah:

Tutaq ki, bir model 100 test nümunəsindən 10 müsbət nümunə var. Model bunlardan 6-nı düzgün tapır (TP), 2 yanlış müsbət verir (FP), 4-ü isə qaçırır (FN).

  • Precision = 6 / (6 + 2) = 0.75
  • Recall = 6 / (6 + 4) = 0.6
  • F1 Score = 2 × (0.75 × 0.6) / (0.75 + 0.6) = 0.666

Bu nəticə modelin həm dəqiqliyinin, həm də tamlığının orta səviyyədə olduğunu göstərir.

Nəticə:

F1 Score – maşın öyrənməsi modellərinin qiymətləndirilməsində balanslı və ədalətli yanaşmanı təmin edən vacib metrikdir. O, yalnız modelin neçə düzgün nəticə verdiyini deyil, həm də neçə mühüm nəticəni qaçırmadığını da əhatə edir. Xüsusilə qeyri-bərabər sinif paylanması olan vəziyyətlərdə və riskli sahələrdə (səhiyyə, təhlükəsizlik, maliyyə) F1 Score ən etibarlı göstəricilərdən biridir.

Teqlər:

IT sahəsini dərindən öyrənmək üçün kurslarımıza qoşulun. Ətraflı məlumat almaq üçün sorğu göndərin!