Elearning CORE Project

» Öğrenme hedefleri

tidyr ve dplyr paketlerini kullanarak gelişmiş veri işleme .

Renkler ve temalar gibi çizim estetiğinin özelleştirilmesi dahil, ggplot2'yi kullanarak karmaşık ve gelişmiş grafikler oluşturma.

Lubridate , forcats ve gridExtra gibi veri işleme ve görselleştirmeye yönelik özel paketler.

» Gelişmiş Veri İşleme ve Grafikler

Veri biliminin sürekli genişleyen alanında, verileri verimli bir şekilde işleme ve görselleştirme yeteneği vazgeçilmezdir. Modül 3, gelişmiş veri işleme tekniklerini ve karmaşık, özelleştirilmiş veri görselleştirmelerinin oluşturulmasını derinlemesine inceleyerek veri analizi becerilerinizi bir sonraki seviyeye taşımak için bir basamak görevi görür. Burada, tidyr ve dplyr paketlerinin veri işlemeye yönelik gelişmiş yeteneklerini keşfediyor ve sizi ggplot2 kullanarak gelişmiş çizim dünyasıyla tanıştırıyoruz. Ek olarak, veri analizi araç setinizi daha da geliştirmek için lubridate, forcats ve gridExtra gibi özel paketlere de gireceğiz.

» tidyr ve dplyr ile Gelişmiş Veri İşleme tidyr’ın Gücü

tidyr toplu paketi, dağınık veri kümelerini düzenleyerek onları analize daha uygun hale getirmek için tasarlandı. Verileri düzenlemek, onu geniş formattan uzun formata yeniden şekillendirmeyi, her değişkenin kendi sütununa ve her gözlemin kendi satırına sahip olmasını sağlamayı içerir (Wickham ve Henry, 2018). Katılımcılar, veri toplama sanatında ustalaşarak veri kümelerini etkili analiz için hazırlamalarına olanak tanıyacaktır.

tidyr paketi, düzensiz veri kümelerini toparlamaya odaklanarak veri analistlerinin ve bilim adamlarının verilerle daha yapılandırılmış ve organize bir şekilde çalışmasına olanak tanır (Wickham ve Henry, 2018). Temel amaç, verileri geniş formattan uzun formata dönüştürerek her değişkenin kendi sütununa ve her gözlemin kendi satırına sahip olmasını sağlamaktır.

İşte R'de tidyr'in gücünden nasıl yararlanılacağına dair adım adım kılavuz

tidyr Paketini Kurun ve Yükleyin

tidyr'i kullanmadan önce paketi kurup yüklemeniz gerekir. Bunu aşağıdaki komutları kullanarak yapabilirsiniz:

install.packages("tidyr")

library(tidyr)

Veri Düzenlemeyi Anlamak

Verileri düzenlemek, Hadley Wickham'ın tanımladığı gibi düzenli veri ilkelerini karşılayacak şekilde yeniden yapılandırılması anlamına gelir. Düzenli bir veri kümesinde:

Her değişken bir sütun oluşturur.

Her gözlem bir sıra oluşturur.

Her değer kendi hücresindedir.

Veriler, veri manipülasyonunu, analizini ve görselleştirmesini basitleştirecek şekilde düzenlenir.

gather() ile Veriyi Yeniden Şekillendirmek

gather() işlevi, verileri geniş biçimden uzun biçime dönüştürmek için temel bir araçtır. Bu işlev birden çok sütunu alır ve bunları anahtar/değer çiftlerine daraltır. Özellikle birden çok sütunun farklı zaman noktalarını, kategorileri veya değişkenleri temsil ettiği veri kümeleriyle uğraşırken kullanışlıdır.

gather() fonksiyonunun temel sözdizimi aşağıdaki gibidir:

gathered_data <- gather(original_data, key = "new_key_column", value = "new_value_column", columns_to_gather)

original_data: Orijinal veri kümeniz.

new_key_column : Değişken adlarını içerecek yeni sütunun adı.

new_value_column : Değerleri içerecek yeni sütunun adı.

columns_to_gather : Anahtar/değer çiftleri halinde yeniden şekillendirmek istediğiniz sütunlar.

Verileri spread() ile yayma

Bunun tersine, anahtar/değer çiftleri olarak depolanan değişkenlerin yeniden ayrı sütunlar olmasını istediğinizde, verileri uzun formattan geniş formata yaymanız gerekebilir. Bunun için spread () fonksiyonu kullanılır.

spread( ) fonksiyonunun temel sözdizimi aşağıdaki gibidir:

spread_data <- spread(original_data, key = "new_key_column", value = "new_value_column")

original_data: Uzun formattaki orijinal veri kümeniz.

new_key_column : Değişken adlarını içeren sütun.

new_value_column : Değerleri içeren sütun.

Eksik Verileri İşleme

Verileri düzenlerken eksik değerlerle karşılaşabilirsiniz. tidyr, eksik değerleri içeren satırları kaldırmak için drop_ na() gibi işlevler sağlar .

Veri Düzenleme Örneği

Sütunların farklı yılları temsil ettiği bir veri kümeniz olduğunu ve onunla daha verimli çalışmak için onu uzun bir biçime dönüştürmek istediğinizi varsayalım. gather( ) işlevini şu şekilde kullanabilirsiniz :

long_data <- gather(original_data, key = "Year", value = "Value", 2000:2020)

Bu kod, orijinal veri kümesini (original_data) alır ve onu "Year" ve "Value" olmak üzere iki yeni sütunla uzun bir biçime dönüştürür. "Year" sütunu yılları (2000-2020) içerecektir ve "Value" sütunu karşılık gelen değerleri içerecektir.

Analiz için Düzenleme

Verilerinizi düzenlemek, veri analizinde çok önemli bir adımdır. Verileriniz düzenli hale geldiğinde, dplyr paketini veri işleme için verimli bir şekilde kullanabilir ve ggplot2 ile anlamlı görselleştirmeler oluşturabilirsiniz.

tidyr'in gücünü keşfettiğimize göre , dplyr paketini kullanarak gelişmiş veri manipülasyonunu inceleyeceğimiz bir sonraki bölüme geçelim .

dplyr ile Verimlilik

Hadley Wickham'ın bir başka eseri olan dplyr paketi, veri manipülasyonunun bir grameridir. Veri dönüşümü için filtreleme, düzenleme, gruplandırma, özetleme ve daha fazlasını içeren bir dizi işlev sağlar (Wickham ve diğerleri, 2021). Kullanıcılar, anlamlı içgörüler elde etmek amacıyla verileri verimli bir şekilde düzenlemek ve dönüştürmek için dplyr'ın gücünden nasıl yararlanacaklarını keşfedeceklerdir.

Belirtildiği gibi, Hadley Wickham tarafından geliştirilen dplyr, veri manipülasyonunu daha sezgisel ve verimli hale getiren bir dizi işlev sunan, veri dönüşümü için güçlü bir araç setidir (Wickham ve diğerleri, 2021).

İşte R'de dplyr verimliliğinden nasıl yararlanılacağına dair kapsamlı bir kılavuz

dplyr Paketini Kurun ve Yükleyin

dplyr'ı kullanmadan önce paketi kurup yüklemeniz gerekir. Bunu aşağıdaki komutlarla yapabilirsiniz:

install.packages("dplyr")

library(dplyr)

Temel Fiiller

dplyr, veri manipülasyonu için yapı taşı görevi gören birkaç temel fiile odaklanır. Bu fiiller şunları içerir:

filter() : Belirli koşulları karşılayan satırları seçer.

arrange(): Satırları bir veya daha fazla sütuna göre sıralar.

select() : Belirli sütunları seçer.

mutate() : Mevcut değişkenlere dayalı olarak yeni değişkenler oluşturur.

summarize() : Özetleme için verileri toplar.

%>% ile Zincirleme İşlemler

dplyr'in sözdizimi, %>% operatörünü ("pipe" olarak telaffuz edilir) kullanarak birden fazla işlemin birlikte zincirlenmesine olanak tanır. Bu, bir dizi veri işleme adımı oluşturmanıza olanak tanıyarak kodunuzu daha okunabilir ve özlü hale getirir. Örneğin:

result <- dataset %>%

filter(condition) %>%

select(columns) %>%

arrange(order) %>%

group_by(grouping) %>%

summarize(summary)

filter( ) ile Verileri Filtreleme

filter() işlevi, belirli koşullara göre satırları seçmenize olanak tanır. Örneğin:

filtered_data <- dataset %>% filter(column > value)

arrange( ) ile Verileri Düzenlemek

arrange ( ) işlevi, satırları bir veya daha fazla sütuna göre sıralamak için kullanılır. Örneğin:

sorted_data <- dataset %>% arrange(column1, column2)

select() ile Sütunları Seçmek

select() veri kümenizden belirli sütunları seçmenizi sağlar. Örneğin:

selected_columns <- dataset %>% select(column1, column2)

mutate() ile Yeni Değişkenler Oluşturma

mutate(), mevcut değişkenleri dönüştürerek yeni değişkenler oluşturmak için kullanılır. Örneğin:

mutated_data <- dataset %>% mutate(new_variable = old_variable * 2)

summarize() ile Verileri Özetlemek

summarize() işlevi, özellikle özet istatistikler oluşturmak için yararlı olan verileri toplamanıza olanak tanır. Örneğin:

summary_data <- dataset %>% group_by(grouping_column) %>% summarize(mean = mean(value), sd = sd(value))

group_by() ile gruplandırma

Verilerin alt kümeleri üzerinde işlemler gerçekleştirmek istediğinizde, verileri group_by() ile gruplandırmak önemlidir. Farklı gruplara ilişkin istatistikleri hesaplamak için sıklıkla summarize() ile birlikte kullanılır.

Verimlilik ve Veri Ayrıntısı

dplyr'ın en önemli avantajlarından biri verimliliğidir. Ek olarak, açık ve özlü sözdizimi veri ayrıntılarını azaltarak kodunuzu daha okunabilir ve kullanılabilir hale getirir.

Hata yönetimi

dplyr, veri işleme kodunuzdaki sorunları hızlı bir şekilde tanımlamanıza ve düzeltmenize yardımcı olabilecek anlamlı hata mesajları sağlar.

Alıştırma ve Uygulama

dplyr kullanımında uzmanlaşmak için gerçek veri kümeleri üzerinde pratik yapın ve çeşitli veri dönüştürme senaryolarını keşfedin. Ne kadar çok kullanırsanız, verimliliğini ve çok yönlülüğünü o kadar çok takdir edeceksiniz.

dplyr'de uzmanlaşarak , verilerinize verimli bir şekilde müdahale etme, bunları işleme ve onlardan içgörüler çıkarma becerisinin kilidini açarak veri analizinizi ve karar verme becerilerinizi geliştireceksiniz.

» Cggplot2 ile Karmaşık Veri Görselleştirme

ggplot2'nin Potansiyelinin Kilidini Açmakomplex Data Visualization with ggplot2

Hadley Wickham tarafından geliştirilen kapsamlı bir veri görselleştirme paketi olan ggplot2, esnekliği ve zarafeti ile bilinmektedir (Wickham, 2016). Karmaşık ve bilgilendirici grafikler oluşturmanıza olanak tanır. ggplot2 ile veri görselleştirmeyi, verileriniz içindeki ilişkileri, eğilimleri ve kalıpları tasvir eden karmaşık grafikleri nasıl oluşturacağınızı öğreneceksiniz.

Belirtildiği gibi, Hadley Wickham tarafından geliştirilen ggplot2, veri görselleştirmeye yönelik güçlü ve esnek bir araç setidir ve karmaşık grafikler oluşturmaya yönelik yapılandırılmış ve katmanlı bir yaklaşım sunar (Wickham, 2016).

R'de ggplot2'nin potansiyelinin kilidini açmaya ilişkin ayrıntılı bir kılavuz

ggplot2 Paketini Kurun ve Yükleyin

Henüz yapmadıysanız ggplot2 paketini kurup yüklemeniz gerekir. Bunu aşağıdaki komutlarla yapabilirsiniz:

install.packages("ggplot2")

library(ggplot2)

Ggplot2'nin Temel Dilbilgisi

ggplot2, olay örgüsü oluşturmak için yapılandırılmış bir yol sağlayan "grafik grameri" kavramı üzerine inşa edilmiştir. Bir ggplot2 grafiğinin temel bileşenleri arasında veriler, estetik eşlemeler, geometrik nesneler (geomlar) ve yüzeyler bulunur. Bir ggplot2 grafiğinin temel yapısı şuna benzer:

ggplot(data = your_data, aes(x = x_variable, y = y_variable)) +

geom_point()

Veri ve Estetik

Veri bağımsız değişkeni, üzerinde çalıştığınız veri kümesini belirtir.

aes() işlevi (estetik eşlemeler), değişkenlerin çizimdeki görsel öğelerle nasıl eşlendiğini tanımlamak için kullanılır. Örneğin verilerinizin x ve y değişkenlerini grafiğin x ve y eksenleriyle eşleyebilirsiniz.

Geometrik Nesneler (Geomlar)

Geometrik nesneler veya geomlar oluşturmak istediğiniz çizimin türünü tanımlar. Bazı yaygın geomlar şunları içerir:

geom_point ( ): Bir dağılım grafiği oluşturur .

geom_ line ( ): Çizgi grafikleri oluşturur.

geom_ bar ( ): Çubuk grafikler oluşturur.

geom_boxplot(): Kutu grafikleri üretir.

Grafiklerinizi Özelleştirme

ggplot2 grafiklerinizin görünümünü özelleştirmek için kapsamlı seçenekler sunar. Çizim başlığını, eksen etiketlerini, açıklamayı, renkleri ve temaları değiştirebilirsiniz. Örneğin:

ggplot(data = your_data, aes(x = x_variable, y = y_variable)) +

geom_point() +

labs(title = "Your Plot Title", x = "X-Axis Label", y = "Y-Axis Label") +

theme_minimal() # Minimal bir tema uygula

Çoklu Geomlar ve Katmanlar

Aynı çizime birden fazla geom ve katman ekleyerek karmaşık grafikler oluşturabilirsiniz . Bu, verilerinizin farklı yönlerini tek bir görselleştirmede temsil etmenize olanak tanır. Örneğin:

ggplot(data = your_data, aes(x = x_variable, y = y_variable)) +

geom_point() +

geom_smooth(method = "lm", color = "red") # Doğrusal bir regresyon çizgisi ekleyin

Fasetleme

Fasetleme, her biri verilerinizin farklı bir alt kümesini gösteren birden fazla grafik oluşturmanıza olanak tanır. Bunu başarmak için facet_ Wrap ( ) veya facet_grid () işlevlerini kullanabilirsiniz . Örneğin:

ggplot(data = your_data, aes(x = x_variable, y = y_variable)) +

geom_point() +

facet_wrap(~category_variable) # Bir kategori değişkenine dayalı olarak birden fazla çizim oluşturun

Grafiğinizi Kaydetmek

ggsave() fonksiyonunu kullanarak bir dosyaya kaydedebilirsiniz . Örneğin:

ggsave("your_plot.png", width = 6, height = 4, dpi = 300)

Uygulama ve Keşif

ggplot2'de uzmanlaşmak için kendi veri kümelerinizle pratik yapın ve mevcut çok sayıda seçeneği ve geom'u keşfedin. Ne kadar çok deney yaparsanız, zengin ve bilgilendirici görselleştirmeler oluşturmada o kadar başarılı olursunuz.

Topluluk ve Kaynaklar

Yardım aramak ve görselleştirmelerinizi paylaşmak için canlı R ve ggplot2 topluluklarına katılın. Bilginizi ilerletmek için ggplot2'ye adanmış çok sayıda çevrimiçi kaynak, eğitim ve kitap bulunmaktadır.

ggplot2'de uzmanlaşarak, karmaşık ve anlaşılır görselleştirmeler oluşturacak araçlara sahip olacak ve veriye dayalı içgörüleri etkili bir şekilde iletme yeteneğinizi geliştireceksiniz.

Konu Estetiğini Özelleştirme

Veri görselleştirmede özelleştirme, etkileyici görseller üretmenin anahtarıdır. Görselleştirmelerinizin yalnızca bilgilendirici değil aynı zamanda görsel olarak çekici olmasını sağlamak için renkler, temalar ve yazı tipleri dahil olmak üzere olay örgüsü estetiğine nasıl ince ayar yapacağımızı keşfedeceğiz.

Veri görselleştirmede özelleştirme, görsel olarak çekici ve bilgilendirici senaryolar oluşturmada hayati bir rol oynar. R'deki güçlü görselleştirme paketi olan ggplot2, renkler, temalar ve yazı tipleri de dahil olmak üzere olay örgüsü estetiğini özelleştirmek için kapsamlı seçenekler sunar.

Temalar

ggplot2, çizimlerinizin genel görünümünü kontrol eden çeşitli temalar sunar. Varsayılan tema oldukça minimalisttir ancak çiziminizin görünümünü değiştirmek için theme_minimal(), theme_bw() veya theme_classic() gibi temalar arasından seçim yapabilirsiniz .

ggplot(data = your_data, aes(x = x_variable, y = y_variable)) + geom_point() + theme_minimal()

Renkler

Veri noktalarının dolgu ve kenarlık renklerinden arka plan ve metin renklerine kadar grafiğinizdeki renkleri özelleştirebilirsiniz. scale_fill_manual() ve scale_color_manual() işlevleri, özel renk paletleri tanımlamanıza olanak tanır.

ggplot(data = your_data, aes(x = x_variable, y = y_variable, color = category_variable)) +

geom_point() +

scale_color_manual(values = c("red", "blue", "green"))

Yazı Tipleri ve Metin

Yazı tipi boyutu, yazı tipi ailesi ve metin yönü gibi metinle ilgili estetiği ayarlayabilirsiniz. theme() fonksiyonu bu amaç için kullanılabilir.

ggplot(data = your_data, aes(x = x_variable, y = y_variable, label = data_labels)) +

geom_text(size = 12, family = "Arial", angle = 45) +

theme(text = element_text(family = "Arial", size = 14))

Lejantlar ve Eksenler

Göstergeleri, başlıkları ve eksen etiketlerini özelleştirmek önemlidir. Grafik başlığını ve eksen etiketlerini değiştirmek için labs() gibi işlevleri kullanabilirsiniz. theme() işlevi aynı zamanda eksen metnini ayarlamak için de kullanışlıdır.

ggplot(data = your_data, aes(x = x_variable, y = y_variable)) +

geom_point() +

labs(title = "Customized Plot Title", x = "X-Axis Label", y = "Y-Axis Label") +

theme(axis.text.x = element_text(size = 12, angle = 45))

Özelleştirilmiş Grafikleri Kaydetme

Grafiğinizin estetiğini uyarladıktan sonra ggsave() işlevini kullanarak grafiğinizi bir dosyaya kaydedebilirsiniz.

ggsave("custom_plot.png", width = 6, height = 4, dpi = 300)

» Özel Veri İşleme ve Görselleştirme

Zaman Yolcusunun Araç Takımı: lubridate

Zamanla ilgili verilerle çalışmak zor olabilir ancak lubridate paketiyle R'deki tarih ve saatleri kolayca yönetebilirsiniz (Spinu ve diğerleri, 2021). Kullanıcılar, zamansal verileri manipüle etme ve analiz etme konusunda uzmanlık kazanarak veri analizinde yeni bir boyut açacaklardır.

Zaman Yolcusunun Araç Takımı: lubridate

Zamanla ilgili verilerle çalışmak zorlayıcı olabilir ancak R'deki yağlama paketi bunu önemli ölçüde kolaylaştırır (Spinu ve diğerleri, 2021). Tarih ve saat verilerini ayrıştırmak, biçimlendirmek ve değiştirmek için işlevler sağlar. lubridate’i şu şekilde kullanabilirsiniz :

Lubridate’in Kurulumu ve Yüklenmesi

Henüz yapmadıysanız lubridate paketini kurun ve R ortamınıza yükleyin.

install.packages("lubridate")

library(lubridate)

Tarihleri Ayrıştırma

lubridate, ymd() (yıl, ay, gün) veya dmy() (gün, ay, yıl) gibi işlevleri kullanarak karakter dizelerini tarih nesnelerine ayrıştırmanıza olanak tanır. Örneğin:

date_string <- "2022-12-31"

date <- ymd(date_string)

Tarih Aritmetiği

Tarih nesneleri üzerinde zaman aralıklarını hesaplamak, günleri eklemek veya çıkarmak, iki tarih arasındaki farkı bulmak gibi çeşitli işlemler yapabilirsiniz.

today <- ymd("2023-03-15")

future_date <- today + days(30)

time_difference <- difftime(future_date, today)

Bileşenleri Çıkarma

lubridate , yıl, ay, gün, saat, dakika ve saniye gibi tarih nesnelerinden belirli bileşenleri çıkarmanıza olanak tanır.

year(today)

month(today)

Tarihleri Biçimlendirme

Tarih nesnelerini sunum için özel dizeler halinde biçimlendirebilirsiniz.

format(today, format = "%B %d, %Y")

Zaman Dilimleriyle Başa Çıkmak

Paket aynı zamanda zaman dilimlerini ve yaz saati uygulamasını da yöneterek farklı zaman dilimlerinde doğru zamansal hesaplamalar yapılmasını sağlar.

lubridate, zaman serisi analizi ve veri manipülasyonu ile ilgili genellikle karmaşık olan görevleri basitleştirdiği için, zamansal verilerle çalışan herhangi bir veri analisti veya araştırmacı için paha biçilmez bir araç setidir.

ggplot2'de özelleştirme konusunda uzmanlaşarak ve zamanla ilgili verileri lubridate ile etkili bir şekilde yöneterek , gelişmiş görselleştirmeler oluşturmak ve zamansal verileri verimli bir şekilde işlemek için iyi bir donanıma sahip olacaksınız.

» Forcats ile Kategorik Verilerde Uzmanlaşma

Hadley Wickham tarafından geliştirilen forcats paketi, kategorik verileri etkili bir şekilde işlemek ve görselleştirmek için sizi çeşitli işlevlerle donatır.

Kurulum ve Yükleme

Henüz yapmadıysanız forcats paketini kurun ve R ortamınıza yükleyin.

install.packages("forcats")

library(forcats)

Faktör Düzeylerini Yeniden Düzenleme

forcats paketi , faktör düzeylerini belirli kriterlere göre yeniden sıralamanıza olanak tanır, böylece kategorik değişkenlerin grafiklerde görüntülenme sırasını kontrol etmeyi kolaylaştırır.

your_data$your_factor <- fct_reorder(your_data$your_factor, your_variable)

Faktör Seviyelerinin Değiştirilmesi

Görselleştirmelerinizde daha iyi netlik sağlamak için faktör düzeylerini değiştirebilir, birleştirebilir veya yeniden kodlayabilirsiniz.

your_data$your_factor <- fct_collapse(your_data$your_factor, "New Level" = c("Old Level 1", "Old Level 2"))

Kategorik Verileri Görselleştirme

forcats, kategorik bir değişkendeki her seviyenin sıklığını verimli bir şekilde görselleştirmek için fct_ count() gibi işlevler sağlar .

ggplot(data = your_data, aes(x = fct_reorder(your_factor, your_variable))) +

geom_bar() +

coord_flip()

Çakışan Etiketlerle Başa Çıkma

Bazı durumlarda kategorik verileri görselleştirirken etiketlerin çakışmasıyla karşılaşabilirsiniz. fct_lump() işlevi, sık olmayan düzeyleri "Other" kategorisinde gruplandırmanıza olanak tanıyarak dağınıklığı azaltır.

your_data$your_factor <- fct_lump(your_data$your_factor, n = 5)

gridExtra ile Ufukları Genişletmek

gridExtra paketi , ggplot2 ile oluşturulan birden fazla grafiği tek bir görsel ekranda düzenlemenizi sağlayarak veri görselleştirme yeteneklerinizi geliştirir. Bu, karmaşık bilgilerin yapılandırılmış ve kapsamlı bir şekilde iletilmesi açısından çok değerlidir.

Kurulum ve Yükleme

Henüz yapmadıysanız gridExtra paketini kurun ve R ortamınıza yükleyin.

install.packages("gridExtra")

library(gridExtra)

Kompozit Grafikler Oluşturma

gridExtra ile bireysel ggplot2 grafiklerini satırlar veya sütunlar gibi çeşitli düzenlerde düzenleyerek bileşik grafikler oluşturabilirsiniz.

composite_plot <- grid.arrange(plot1, plot2, ncol = 2)

Düzenleri Özelleştirme

Bileşik ekrandaki grafiklerin düzenlenmesi, aralıkları ve hizalanması üzerinde kontrole sahip olursunuz; böylece özel ihtiyaçlarınıza uygun görseller tasarlayabilirsiniz.

composite_plot <- arrangeGrob(plot1, plot2, ncol = 2, top = "Composite Plot Title")

Kompozit Grafikleri Kaydetme

Bileşik bir grafik oluşturduğunuzda, bunu bir görüntü olarak kaydedebilir veya raporlara ve sunumlara dahil edebilirsiniz.

ggsave("composite_plot.png", composite_plot, width = 8, height = 6, dpi = 300)

forcats paketine ve gelişmiş görselleştirmeye yönelik gridExtra paketine hakim olarak , özellikle karmaşık kategorik bilgilerle uğraşırken verilerinizi verimli bir şekilde yönetmek ve görselleştirmek için gereken araçlara sahip olacaksınız.

Bu modül boyunca veri işleme ve görselleştirme konusunda ileri düzey beceriler kazanacaksınız. Burada kazanılan bilgi ve araçlar, karmaşık veri analizi görevlerinin üstesinden gelmenize, karmaşık verileri değerli içgörülere dönüştürmenize ve etkili görselleştirmeler oluşturmanıza olanak sağlayacaktır. tidyr , dplyr , ggplot2 ve özel paketlerin dünyasına daldıkça , çeşitli veri kümeleriyle çalışma ve bilgilendirici görseller üretme yeteneğiniz ikinci doğanız haline gelecektir. Bu beceriler, veri bilimi yolculuğunuzda gelişmiş veri analizi ve keşfi için sağlam bir temel oluşturacaktır.

» Referanslar

Auguie, B. (2017). gridExtra: Miscellaneous functions for "Grid" Graphics. R package version 2.3.

Spinu, V., Grolemund, G., & Wickham, H. (2021). lubridate: Make dealing with dates a little easier. R package version 1.8

Wickham, H. (2021). forcats: Tools for working with categorical variables (Factors). R package version 0.5.1.

ÜNİTENİN İÇERİĞİ

Modül 3: Gelişmiş Veri İşleme ve Grafikler