İmputasiya — məlumat elmləri və statistika sahəsində itkin (eksik) dəyərlərin əvəz olunması prosesidir. Real həyat məlumat dəstlərində tez-tez bəzi sütunlarda dəyərlər olmaya bilər. Bu itkin dəyərlərin mövcudluğu analiz və ya model qurulması zamanı problemlərə səbəb ola bilər. İmputasiya isə bu boşluqları müxtəlif statistik və ya maşın öyrənməsi metodları ilə doldurmağı nəzərdə tutur.
Məlumat dəstlərindəki itkin dəyərlər:
Bu səbəbdən, analizdən və modelləşdirmədən əvvəl məlumatların təmizlənməsi və itkin dəyərlərin uyğun şəkildə əvəzlənməsi zəruridir.
Məsələn, bir qrup (cins, region və s.) daxilində ortalama dəyərlə əvəzləmə.
K-ən yaxın qonşu alqoritmi ilə bənzər müşahidələr tapılır və onların dəyərləri ilə əvəzləmə aparılır.
İtkin dəyər olan sütun asılı dəyişən (target) kimi götürülür və digər mövcud sütunlar ilə onun dəyəri proqnozlaşdırılır. (Məsələn, Decision Tree və ya Linear Regression ilə)
İmputasiya — məlumat elmi və data təmizləmə prosesinin ayrılmaz hissəsidir. Doğru metodologiya seçilərsə, bu yanaşma modelin keyfiyyətini artırır, analizlərin daha real nəticələr verməsinə şərait yaradır. Hər bir layihədə tətbiq olunan imputasiya üsulu məlumatın tipi, itkin dəyərlərin miqdarı və problemin məqsədlərinə görə dəyişə bilər.
IT sahəsini dərindən öyrənmək üçün kurslarımıza qoşulun. Ətraflı məlumat almaq üçün sorğu göndərin!