F1 Score, maşın öyrənməsi və statistik analiz sahəsində geniş istifadə olunan qiymətləndirmə göstəricisidir. Bu göstərici əsasən ikili təsnifat (binary classification) modellərinin performansını qiymətləndirmək üçün istifadə olunur və dəqiqlik (precision) və tamlıq (recall) arasında harmonik orta kimi hesablanır.
F1 Score-un əsas məqsədi – modelin həm düzgün təsnif etmə qabiliyyətini (precision), həm də bütün uyğun nümunələri tapmaq qabiliyyətini (recall) nəzərə alaraq ümumi performansını ölçməkdir. Bu, xüsusilə tarazsız verilənlər toplusu (imbalanced dataset) ilə işləyərkən vacib olur.
F1 Score-u daha yaxşı başa düşmək üçün əvvəlcə üç əsas terminlə tanış olaq:
Precision (dəqiqlik):
Modelin "müsbət" kimi təsnif etdiyi nümunələrdən neçəsi həqiqətən müsbət idi?
Precision = TP / (TP + FP)
Recall (tamlıq):
Həqiqətən müsbət olan nümunələrin neçəsini model düzgün aşkar edə bildi?
Recall = TP / (TP + FN)
TP (True Positive):
Həm modelin, həm də həqiqi nəticənin "müsbət" olduğu hallar.
FP (False Positive):
Modelin "müsbət" dediyi, amma əslində "mənfi" olan hallar.
FN (False Negative):
Modelin "mənfi" dediyi, amma əslində "müsbət" olan hallar.
F1 Score aşağıdakı formula ilə hesablanır:
F1=2×(Precision×Recall/Precision+Recall)
Bu formul harmonik orta kimi tanınır. Harmonik orta, aritmetik ortadan fərqli olaraq, dəyərlər arasında balans olmadıqda daha ədalətli nəticə verir.
F1 Score, xüsusilə aşağıdakı hallarda əhəmiyyətlidir:
Ölçü vahidiNəyi ölçür?Uyğun olduğu halAccuracyDüzgün təsnif olunan nümunələrin ümumi faiziniVerilənlər tarazlı olduqdaF1 ScorePrecision və Recall arasında balansıVerilənlər tarazsız olduqda və ya həm FP, həm də FN mühüm əhəmiyyət kəsb etdikdə
Tutaq ki, bir model 100 test nümunəsindən 10 müsbət nümunə var. Model bunlardan 6-nı düzgün tapır (TP), 2 yanlış müsbət verir (FP), 4-ü isə qaçırır (FN).
Bu nəticə modelin həm dəqiqliyinin, həm də tamlığının orta səviyyədə olduğunu göstərir.
F1 Score – maşın öyrənməsi modellərinin qiymətləndirilməsində balanslı və ədalətli yanaşmanı təmin edən vacib metrikdir. O, yalnız modelin neçə düzgün nəticə verdiyini deyil, həm də neçə mühüm nəticəni qaçırmadığını da əhatə edir. Xüsusilə qeyri-bərabər sinif paylanması olan vəziyyətlərdə və riskli sahələrdə (səhiyyə, təhlükəsizlik, maliyyə) F1 Score ən etibarlı göstəricilərdən biridir.
IT sahəsini dərindən öyrənmək üçün kurslarımıza qoşulun. Ətraflı məlumat almaq üçün sorğu göndərin!