EN | PT | TR | RO | BG | SR
;


NEXT TOPIC

Modul 1: Uvod u R i uvoz/manipulacija podataka




Uvoz i manipulacija podacima: Moć dplyr i tidyr paketa


Efikasan uvoz i manipulacija podacima su temelji efikasne analize podataka. R pruža mnoštvo paketa i funkcija kako biste mogli da pročitate podatke iz spoljnih izvora i pripremite ih za analizu. Dva neophodna paketa za manipulaciju podacima su dplyr i tidyr.

dplyr: Razvijen od strane Hadley Wickhama, dplyr je paket koji nudi gramatiku za manipulaciju podacima. Pruža skup funkcija za obavljanje uobičajenih zadataka manipulacije podataka sa doslednom i intuitivnom sintaksom. Ključne funkcije u dplyr-u uključuju filter() (za filtriranje redova), select() (za izbor kolona), arrange() (za sortiranje), mutate() (za kreiranje novih promenljivih) i summarize() (za sumiranje podataka). Razumevanje i korišćenje funkcija dplyr-a će vam omogućiti efikasno manipulisanje i transformisanje vaših podataka.

tidyr: Dok se dplyr fokusira na manipulaciju podacima, tidyr se bavi organizovanjem podataka. Podaci se smatraju "urednim" kada su organizovani na način koji olakšava rad sa njima. tidyr pruža funkcije poput gather() (za konverziju širokih podataka u duge podatke) i spread() (za konverziju dugih podataka u široke podatke). Organizovanjem vaših podataka pomoću tidyr-a, činite ih pogodnijim za analizu i vizualizaciju.