Paket forcats, koji je razvio Hadley Wickham, nudi različite funkcije za manipulaciju i vizualizaciju kategorijalnih podataka.
Ako već niste, instalirajte i učitajte paket forcats u vašem R okruženju.
install.packages("forcats") library(forcats)
Paket forcats vam omogućava reorderanje nivoa faktora na osnovu određenih kriterijuma, olakšavajući kontrolu redosleda prikaza kategorijalnih promenljivih u grafikama.
your_data$your_factor <- fct_reorder(your_data$your_factor, your_variable)
Možete menjati nivoe faktora, spajajući ili rekodirajući ih radi bolje jasnoće u vizualizacijama.
your_data$your_factor <- fct_collapse(your_data$your_factor, "New Level" = c("Old Level 1", "Old Level 2"))
forcats pruža funkcije poput fct_count() za efikasnu vizualizaciju frekvencije svakog nivoa u kategorijalnoj promenljivoj.
ggplot(data = your_data, aes(x = fct_reorder(your_factor, your_variable))) + geom_bar() + coord_flip()
U nekim slučajevima možete naići na preklapajuće oznake prilikom vizualizacije kategorijalnih podataka. Funkcija fct_lump() vam omogućava grupisanje retkih nivoa u kategoriju "Ostalo", smanjujući nered.
your_data$your_factor <- fct_lump(your_data$your_factor, n = 5)
Paket gridExtra poboljšava vaše sposobnosti vizualizacije podataka omogućavajući vam da rasporedite više grafikona kreiranih sa ggplot2 u jedan vizuelni prikaz. Ovo je neprocenjivo za prenošenje kompleksnih informacija na strukturiran i sveobuhvatan način.
Ako već niste, instalirajte i učitajte paket gridExtra u vašem R okruženju.
install.packages("gridExtra")
library(gridExtra)
Sa gridExtra, možete kreirati kompozitne grafike raspoređujući pojedinačne ggplot2 grafikone u različite rasporede, kao što su redovi ili kolone.
composite_plot <- grid.arrange(plot1, plot2, ncol = 2)
Imate kontrolu nad rasporedom, razmakom i poravnanjem grafikona unutar kompozitnog prikaza, omogućavajući vam da dizajnirate vizuale koji odgovaraju vašim specifičnim potrebama.
composite_plot <- arrangeGrob(plot1, plot2, ncol = 2, top = "Composite Plot Title")
Kada kreirate kompozitni grafikon, možete ga sačuvati kao sliku ili ga uključiti u izveštaje i prezentacije.
ggsave("composite_plot.png", composite_plot, width = 8, height = 6, dpi = 300)
Savladavanjem paketa forcats za manipulaciju kategorijalnim podacima i paketa gridExtra za naprednu vizualizaciju, imaćete alate potrebne za efikasno upravljanje i vizualizaciju vaših podataka, posebno kada se bavite složenim kategorijalnim informacijama.
Tokom ovog modula, stekli ste napredne veštine u manipulaciji i vizualizaciji podataka koje će vam omogućiti da se izvršavate složene zadatke analize podataka, transformišete nesređene, sirove podatke u vredne pregledne podatke i kreirate informativne i napredne vizualizacije. Savladavanjem tidyr, dplyr, ggplot2 i drugig specijalizovanih paketa, vaša sposobnost da radite sa raznovrsnim skupovima podataka i proizvodite informativne vizuale postaće deo vas. Ove veštine će vam poslužiti kao čvrst temelj za naprednu analizu podataka i istraživanje na polju istraživanja podataka.