Data Wrangling — müxtəlif mənbələrdən toplanmış xam (emal olunmamış) məlumatların təmizlənməsi, çevrilməsi, standartlaşdırılması və analizə hazır vəziyyətə gətirilməsi prosesidir. Bu proses Data Science, Data Analytics, Machine Learning və Big Data layihələrinin uğurla həyata keçirilməsi üçün ən vacib ilkin mərhələlərdən biridir. Çünki məlumatların keyfiyyəti birbaşa əldə ediləcək nəticələrin dəqiqliyinə təsir edir.
Əgər məlumatlar natamam, səhv dəyərlərlə dolu və ya uyğunsuz formatdadırsa, istənilən analitik hesabat və ya maşın öyrənməsi modeli yalnış nəticələr verə bilər. Buna görə də, Data Wrangling mərhələsi çox zaman layihənin ümumi iş yükünün 60%-dən çoxunu təşkil edir.
Data wrangling anlayışı ilk dəfə 1970-ci illərin sonlarında məlumat bazaları və statistik analiz proqramlarının yayılması ilə daha çox tanınmağa başladı. Lakin termin "data wrangling" kimi daha çox 2000-ci illərdə populyarlaşdı. Bu dövrdə internet və rəqəmsal sistemlərdən toplanan məlumatların həcmi sürətlə artdığı üçün, xam məlumatların emalı daha böyük əhəmiyyət qazandı.
Data Wrangling — müxtəlif mənbələrdən toplanmış xam (emal olunmamış) məlumatların təmizlənməsi, çevrilməsi, standartlaşdırılması və analizə hazır vəziyyətə gətirilməsi prosesidir. Bu proses Data Science, Data Analytics, Machine Learning və Big Data layihələrinin uğurla həyata keçirilməsi üçün ən vacib ilkin mərhələlərdən biridir. Çünki məlumatların keyfiyyəti birbaşa əldə ediləcək nəticələrin dəqiqliyinə təsir edir.
Əgər məlumatlar natamam, səhv dəyərlərlə dolu və ya uyğunsuz formatdadırsa, istənilən analitik hesabat və ya maşın öyrənməsi modeli yalnış nəticələr verə bilər. Buna görə də, Data Wrangling mərhələsi çox zaman layihənin ümumi iş yükünün 60%-dən çoxunu təşkil edir.
Data wrangling anlayışı ilk dəfə 1970-ci illərin sonlarında məlumat bazaları və statistik analiz proqramlarının yayılması ilə daha çox tanınmağa başladı. Lakin termin "data wrangling" kimi daha çox 2000-ci illərdə populyarlaşdı. Bu dövrdə internet və rəqəmsal sistemlərdən toplanan məlumatların həcmi sürətlə artdığı üçün, xam məlumatların emalı daha böyük əhəmiyyət qazandı.