EN | PT | TR | RO | BG | SR
;


NEXT TOPIC

ÜNİTENİN İÇERİĞİ




Modül 1: R ve Veri İçe Aktarma/Manipülasyona Giriş




R programlamaya ve RStudio'ya giriş.

R programlamanın temelleri: veri türleri, değişkenler, temel işlemler.

R'de veri içe aktarma ve işleme: R'ye veri okuma, dplyr , tidyr ve diğer paketleri kullanarak veri işleme.

R'de temel grafikler: ggplot2 kullanarak dağılım grafikleri, çubuk grafikleri ve çizgi grafikleri oluşturma.



Günümüzün veri odaklı dünyasında, verilerden anlamlı içgörüler elde etme yeteneği oldukça aranan bir beceridir. Araştırmacılar, veri bilimcileri ve analistler için R programlama dili ve RStudio, ellerindeki vazgeçilmez araçlardır. R, istatistiksel hesaplama ve veri analizindeki esnekliğiyle ünlüdür; RStudio ise R deneyimini geliştiren kullanıcı dostu bir entegre geliştirme ortamı (IDE) sunar. Bu modül, kullanıcılara sözdiziminden güçlü veri işleme yeteneklerine ve temel veri görselleştirme tekniklerine kadar R'nin temel yönleri hakkında bilgi veren temel bir basamak görevi görür. Ayrıca istatistiksel analiz bağlamında verimli veri aktarımı ve yönetiminin kritik önemine değineceğiz. Bu modülün sonunda katılımcılar aşağıdaki alanlarda yeterlilik kazanmış olacaklardır (R Core Team, 2021).



Hadley Wickham ve Garrett Grolemund tarafından yazılan etkili bir kitap olan Veri Bilimi için R, "R'nin sonuçları tüküren sihirli bir kutu değil, bir araç olduğunu" ileri sürer (Grolemund ve Wickham, 2016). R'nin potansiyelini anlamak ve bundan faydalanmak, arayüze ve sisteme aşinalık ve rahat kullanımı ile başlar. RStudio'nun devreye girdiği yer burasıdır.

RStudio: RStudio, R programlama deneyimini geliştiren entegre bir geliştirme ortamıdır. R ile çalışmak için etkileşimli bir platform sağlayarak R'yi her düzeydeki kullanıcı için erişilebilir hale getirir. R yolculuğunuza başlamak için RStudio'yu tanımanız çok önemlidir.

İşte nasıl başlayacağız:

Kurulum: R ile maceranıza başlamadan önce hem R hem de RStudio'yu yüklemeniz gerekir. Her ikisi de ücretsiz olarak mevcuttur ve Windows, macOS ve Linux dahil olmak üzere çeşitli işletim sistemleriyle uyumludur.

RStudio Arayüzü: R ve RStudio'yu yükledikten sonra RStudio'yu açın. RStudio arayüzü dört bölmeden oluşur: Komut Dosyası Düzenleyicisi (kodunuzu yazacağınız yer), Konsol (kodun yürütüldüğü ve sonuçların görüntülendiği yer), Ortam/Geçmiş bölmesi (mevcut çalışma alanınızı ve komut geçmişinizi gösterir), ve dosyalarda gezinmenize, grafikleri görüntülemenize, paketleri yönetmenize ve yardım belgelerine erişmenize olanak tanıyan Dosyalar/Plotlar/Paketler/Yardım bölmesi.

R Script: Script Düzenleyici'de R kodunuzu yazabilir, düzenleyebilir ve kaydedebilirsiniz. Projeleriniz için R scriptleri oluşturup kaydetmek iyi bir uygulamadır çünkü bu, çalışmanızı çoğaltmanızı ve başkalarıyla paylaşmanızı kolaylaştırır.

Kodu Çalıştırma: R kodunu çalıştırmak için, onu Komut Dosyası Düzenleyicisine yazın ve Ctrl+Enter (veya macOS'ta Command+Enter ) tuşlarına basın veya "Çalıştır" düğmesini tıklayın. Kod Konsolda çalışacak ve tüm çıktılar veya sonuçlar burada görüntülenecektir.

Çalışma Alanı: Ortam/Geçmiş bölmesi, R oturumlarınız sırasında oluşturduğunuz veri çerçeveleri, değişkenler ve işlevler gibi nesneleri içeren mevcut R çalışma alanınızı gösterir. Verilerinizi ve değişkenlerinizi takip etmenin yararlı bir yoludur.

Yardım: Bir işlev veya paketle ilgili yardıma ihtiyacınız olduğunda, R belgelerine erişmek ve belirli işlevler veya paketler hakkında bilgi bulmak için Yardım sekmesini kullanabilirsiniz.



Arayüzünüz RStudio olduğunda, artık R programlama dünyasına dalmaya hazırsınız. Kavramanız gereken bazı temel hususlar şunlardır:

Veri Türleri: R sayısal, karakter, mantıksal ve faktörler dahil olmak üzere çeşitli temel veri türleri sunar (Grolemund ve Wickham, 2016). Bu veri türlerini anlamak, etkili veri manipülasyonu için çok önemlidir.

Değişkenler: R'de değişkenler verileri depolamak için kullanılır. Değişkeni sayı, karakter veya mantıksal (doğru veya yanlış) değer gibi belirli bir değeri tutan bir kapsayıcı olarak düşünebilirsiniz. Değişkenler R'de veri analizi için yaygın olarak kullanılır.

Temel İşlemler: R, verileriniz üzerinde çok çeşitli işlemler gerçekleştirmenize olanak tanır. Buna aritmetik işlemler (toplama, çıkarma, çarpma ve bölme), mantıksal işlemler (karşılaştırmalar) ve daha fazlası dahildir. Bu işlemlerde uzmanlaşmak, veri manipülasyonu için çok önemlidir.

Vektörler : R'de bir vektör, aynı veri türündeki öğeleri tutan temel bir veri yapısıdır. c( ) (combine) gibi işlevlerle veya bir sayı dizisi oluşturmak için iki nokta üst üste : kullanarak vektörler oluşturabilirsiniz. Vektörler veri analizi ve manipülasyonu için temeldir.



Verimli veri aktarımı ve manipülasyonu, etkili veri analizinin temelidir. R, harici kaynaklardan veri okumanıza ve analize hazırlamanıza yardımcı olacak çok sayıda paket ve işlev sağlar. Veri işleme için iki vazgeçilmez paket dplyr ve tidyr'dir .

dplyr : Hadley Wickham tarafından geliştirilen dplyr , veri işleme için temel bilgileri sunan bir pakettir. Tutarlı ve sezgisel bir söz dizimi ile ortak veri işleme görevlerini gerçekleştirmek için bir dizi işlev sağlar. Dplyr'deki temel işlevler arasında filter( ) (satırları filtrelemek için), select() (sütunları seçmek için), arrange() (sıralama için), mutate() (yeni değişkenler oluşturmak için) ve summarize() (verileri özetlemek için) bulunur. dplyr işlevlerini anlamak ve kullanmak, verilerinizi verimli bir şekilde işlemenize ve dönüştürmenize olanak tanır.

tidyr: dplyr veri manipülasyonuna odaklanırken, tidyr tamamen veri düzenlemeyle ilgilidir. Veriler, çalışmayı kolaylaştıracak şekilde düzenlendiğinde "düzenli" kabul edilir. tidyr, gather( ) (geniş veriyi uzun veriye dönüştürmek için) ve spread() (uzun veriyi geniş veriye dönüştürmek için) gibi işlevler sağlar . Verilerinizi tidyr ile düzenleyerek analize ve görselleştirmeye daha uygun hale getirirsiniz.



Etkili veri analizi, verileri manipüle etmenin ve özetlemenin ötesine uzanır. Veri görselleştirme, bulgularınızı anlamada ve iletmede çok önemli bir rol oynar. R, veri görselleştirme için zengin paketler sunar; ggplot2 en popüler ve çok yönlü seçeneklerden biridir.

ggplot2: Hadley Wickham tarafından geliştirilen ggplot2, karmaşık ve özelleştirilmiş veri görselleştirmeleri oluşturmaya yönelik bir pakettir. Görselleştirmeleri adım adım oluşturmanıza olanak tanıyan katmanlı bir grafik grameri kullanır. ggplot2 ile değişkenler arasındaki ilişkileri keşfetmek için dağılım grafikleri, kategorileri karşılaştırmak için çubuk grafikleri ve zaman içindeki eğilimleri görüntülemek için çizgi grafikler dahil olmak üzere çok çeşitli görselleştirmeler oluşturabilirsiniz. ggplot2'yi anlamak, verilerinize hayat veren bilgilendirici ve estetik açıdan hoş görselleştirmeler oluşturmanıza olanak tanır.



R ve veri manipülasyonu dünyasına yolculuğunuza çıktığınızda, veri analizine yönelik çok yönlü ve güçlü bir araçta uzmanlaşmaya doğru ilk adımı attınız. R ve RStudio uyum içinde kullanıldığında veri işleme ve görselleştirme için etkileşimli ve verimli bir ortam sunar. Veri türlerini, değişkenleri, temel işlemleri ve dplyr, tidyr ve ggplot2'nin yeteneklerini anlayarak, başarılı veri analizi için gerekli temel bilgilerle kendinizi donattınız. Bu bilgiyle, değerli içgörüleri ortaya çıkarmak ve bulgularınızı etkili bir şekilde iletmek için verileri keşfetmeye, analiz etmeye ve görselleştirmeye başlayabilirsiniz.



Ücretsiz ve açık kaynaklı bir programlama dili olan R, istatistiksel hesaplama ve veri analizindeki çok yönlülüğüyle ünlüdür (Gentleman ve Temple Lang, 2004). Entegre bir geliştirme ortamı (IDE) olan RStudio, R ile çalışmak için etkileşimli bir platform sağlayarak R'yi her düzeydeki kullanıcılar için erişilebilir hale getirir. Katılımcılar RStudio arayüzüne aşina olacak, R komut dosyalarında nasıl gezinileceğini öğrenecek ve verileri yükleme, işleme ve görselleştirme iş akışını anlayacaktır.



R programlamanın temel bir kavrayışı, veri türlerinin, değişkenlerin ve temel işlemlerin anlaşılmasını gerektirir. R sayısal, karakter, mantıksal ve faktörler dahil olmak üzere çeşitli veri türleri sunar (Grolemund ve Wickham, 2016). Kullanıcılar değişkenleri nasıl bildireceklerini ve değiştireceklerini, aritmetik işlemleri nasıl gerçekleştireceklerini ve belirli görevleri yürütmek için işlevleri nasıl kullanacaklarını öğreneceklerdir. Kullanıcılar bu temel bilgilere hakim olarak veriyle ilgili görevleri verimli bir şekilde gerçekleştirebilirler.

R programlama alanına doğru bir yolculuğa çıkmak, veri analizini ve istatistiksel hesaplamayı destekleyen temel unsurları benimsemektir. R programlamanın temel düzeyde kavranması, veri türlerinin, değişkenlerin ve temel işlemlerin kapsamlı bir şekilde anlaşılmasını gerektirir. Bu modülde, katılımcıları verileri verimli bir şekilde işlemek ve görevleri etkili bir şekilde yürütmek için gerekli bilgi ve becerilerle donatarak bu temel kavramların özünü ortaya çıkaracağız (Grolemund ve Wickham, 2016).



R programlamanın kalbinde veri türleri kavramı yatmaktadır. Temelde veri türleri, R'nin sağladığınız bilgileri nasıl yorumlayacağını ve bu bilgilerle nasıl etkileşime gireceğini tanımlar. R, çok yönlü bir dizi veri türü sunar ve bunların doğasını anlamak, dilin yeteneklerinden yararlanmak için temeldir. En önemli veri türlerini inceleyelim:

  • Sayısal: Sayısal veri türleri çok çeşitli sayısal değerleri kapsar. Bunlar tam sayıları ve gerçek sayıları (ondalık sayılar) içerebilir. Sayısal veri türlerini anlamak, matematiksel ve istatistiksel işlemleri gerçekleştirmek için çok önemlidir.
  • Karakter: Karakter veri türleri metinden oluşur ve kelimeleri, cümleleri veya diğer herhangi bir metinsel bilgiyi temsil etmek için kullanılır. Metin veya etiketlerle çalışırken karakter verilerini işleme yeteneği çok değerlidir.
  • Mantıksal: Mantıksal veri türleri, doğası gereği ikili olup, doğru veya yanlış değerleri temsil eder. R kodunuzda koşullar oluşturmak ve kararlar almak için çok önemlidirler.
  • Faktörler: Faktörler, R'de kategorik verileri temsil eden benzersiz bir veri türüdür. Sonlu sayıda kategori veya seviyeye sahip değişkenlerle uğraşırken özellikle faydalıdırlar.


R'deki değişkenler veriyi tutan kaplara benzer. Herhangi bir R programının temel yapı taşları olarak hizmet ederler. Bir değişkeni, belirli bir bilgi parçası için etiketlenmiş bir depolama konumu olarak düşünebilirsiniz. R'deki değişkenlere, depoladıkları veri türünü yansıtan bilgilendirici adlar verilmelidir. Örneğin, "yaş" adlı bir değişken, bireylerin yaşlarını bir veri kümesinde saklayabilir.

R'de, <- atama operatörünü kullanarak ona bir değer atayarak bir değişken bildirirsiniz. Örneğin, değeri 5 olan bir "x" değişkeni bildirmek için şunu yazarsınız:

x <- 5

Değişkenler farklı veri türlerindeki verileri saklayabilir. Örneğin, şöyle bir karakter değişkeni bildirebilirsiniz:

isim <- "John"

Bir değişken tanımlandığında onu R kodunuzda çeşitli işlemler ve hesaplamalar için kullanabilirsiniz. Değişkenleri manipüle etme yeteneği, R'de veri analizi ve programlamanın merkezinde yer alır.



R, verileriniz üzerinde çok çeşitli işlemleri gerçekleştirmenize olanak tanır. Bu işlemler şunları içerir:

  • Aritmetik İşlemler: R, toplama (+), çıkarma (-), çarpma (*) ve bölme (/) gibi temel aritmetik işlemleri gerçekleştirmenize olanak tanır. Bu işlemler özellikle sayısal verilerle çalışırken faydalıdır.
  • Değerleri karşılaştırmak ve mantıksal koşullar oluşturmak için büyüktür (>), küçüktür (<), eşittir (==) ve eşit değildir (!= ) gibi mantıksal operatörleri kullanabilirsiniz . Mantıksal işlemler kodunuzda karar vermek için gereklidir.
  • İşlevler: İşlevler R'de temel bir kavramdır. R, çeşitli amaçlara hizmet eden çok sayıda yerleşik işlev sağlar. İşlevler, belirli görevleri gerçekleştirmek için kullanabileceğiniz önceden tanımlanmış işlemlerdir. Örneğin, mean( ) işlevi bir sayı kümesinin ortalamasını hesaplar ve paste() işlevi karakter dizelerini birleştirir. İşlevlerin nasıl kullanılacağını anlamak, görevleri otomatikleştirmek ve karmaşık işlemleri gerçekleştirmek için çok önemlidir.

Veri türlerini, değişkenleri ve temel işlemleri sağlam bir şekilde kavramak, R programlamada uzmanlığınızı geliştirebileceğiniz temeldir. Bu temel bilgiyle, basit aritmetik işlemleri gerçekleştirmekten karmaşık mantıksal koşullar oluşturmaya ve kodunuzu kolaylaştırmak için işlevleri kullanmaya kadar, veriyle ilgili çok çeşitli görevleri yerine getirecek donanıma sahip olursunuz.

R programlama dünyasına yolculuğunuza devam ederken, bu temel bilgiler yol gösterici ışığınız olarak hizmet edecek ve verileri verimli bir şekilde yönetmenize, bilinçli kararlar vermenize ve görevleri otomatikleştirmenize olanak tanıyacaktır. Her adımda, veri uzmanlığına bir adım daha yaklaşacak ve derinlemesine veri analizi ve keşfi potansiyelini ortaya çıkaracaksınız.



Verimli veri aktarımı ve manipülasyonu, etkili veri analizinin temel taşıdır. Bu modülde, R ortamında veri işleme alanını inceleyerek kullanıcıları verileri analiz için almak, işlemek ve hazırlamak için gerekli becerilerle donatıyoruz. Veri içe aktarma ve manipülasyonunun sağlam bir şekilde anlaşılması, verilerinizin analiz için uygun bir formda olmasını sağlamak ve tüm veri ön işleme iş akışını kolaylaştırmak için çok önemlidir (Wickham ve diğerleri, 2021).



Herhangi bir veri analizi çabasının ilk adımı veri toplamadır. R, çeşitli harici kaynaklardan verilerin sorunsuz şekilde içe aktarılmasını kolaylaştırmak için çok çeşitli araçlar ve paketler sunar. Verileriniz ister bir CSV dosyasında, ister bir Excel elektronik tablosunda, ister bir veritabanında, ister başka formatlarda bulunsun, R, verilere erişmenin yolunu sağlar. Bu modül, R'deki yaygın veri içe aktarma araçlarını ve yöntemlerini inceleyecektir:

  • csv( ) ve read.table (): Bu işlevler sırasıyla CSV ve sekmeyle ayrılmış dosyalardan veri okumanızı sağlar. Sınırlayıcıları belirlemek ve eksik değerleri işlemek gibi içe aktarma sürecini özelleştirmek için çok sayıda seçenek sunarlar.
  • readxl Paketi: Excel dosyalarıyla uğraşırken readxl paketi başvuracağınız araçtır. Excel çalışma kitaplarından, sayfalarından ve aralıklarından veri çıkarmayı kolaylaştırır.
  • readr Paketi: Yine Hadley Wickham'ın hazırladığı readr paketi, hızlı ve verimli veri aktarımı için bir dizi işlev sunar. Metin tabanlı verilerin okunmasını optimize eden read_csv( ) ve read_delim() gibi işlevler sağlayarak veri içe aktarma sürecini geliştirir .

Veritabanı Bağlantıları: R, DBI ve RODBC gibi paketleri kullanarak veritabanlarına bağlanabilir ve verileri doğrudan veritabanı sistemlerinden almanıza olanak tanır. Bu, özellikle veritabanlarında depolanan büyük veri kümeleriyle çalışırken kullanışlıdır.



Veri işleme genellikle veri kümelerini filtreleme, özetleme, gruplandırma ve birleştirme gibi görevleri gerektirir. Hadley Wickham tarafından yazılan dplyr paketi , veri işleme için tutarlı ve sezgisel bir dilbilgisi sağlayarak bu işlemleri basitleştirir. Beş temel fiili tanıtır:

  • filter( ) : Veri kümenizden belirli koşullara göre belirli satırları çıkarmak için bu fiili kullanın.
  • arrange(): Veri kümenizin satırlarını bir veya daha fazla değişkene göre artan veya azalan sırada düzenleyin.
  • select() : Veri kümenizden bir sütun alt kümesi seçerek ilgili verilere odaklanmayı kolaylaştırır.
  • mutate() : Verilerinize işlevler veya işlemler uygulayarak yeni değişkenler oluşturun veya mevcut değişkenleri değiştirin.
  • summarize() : Bilgilerinizi anlamlı bir şekilde toplayarak verilerinizi özet istatistiklere yoğunlaştırın.


Veriler her zaman analize en elverişli formatta olmayabilir. tidyr paketi, verilerinizi düzenli bir biçimde yeniden şekillendirmenize yardımcı olmak için devreye girer. Düzenli veriler, her değişken bir sütun oluşturacak, her gözlem bir satır oluşturacak ve her gözlem birimi türü bir tablo oluşturacak şekilde yapılandırılmıştır. Bu yapılandırılmış format, veri analizini ve görselleştirmeyi basitleştirir. tidyr ile sütunları anahtar/değer çiftleri halinde toplamak ve bunları tekrar ayrı sütunlara yaymak gibi işlemleri gerçekleştirebilirsiniz.

Bu modülün sonunda, R kullanarak verileri verimli bir şekilde içe aktarma, işleme ve dönüştürme becerilerini edinmiş olacaksınız. Veri içe aktarma ve işleme, veri analizinin ilk yapı taşlarıdır ve bu beceriler, verilerinizi daha derin araştırmaya hazırlamak için gereklidir. R ile veri analizi yolculuğunuzda ilerledikçe, verilerinizin kalitesini ve araştırma veya analiz hedeflerinize uygunluğunu sağlamak için bu yeteneklerin çok değerli olduğunu göreceksiniz.



Veri analizi alanında, verileri etkili bir şekilde görselleştirme yeteneği çok önemli bir beceridir. Veri görselleştirme yalnızca verinin altında yatan yapıyı ve kalıpları anlamaya yardımcı olmakla kalmaz, aynı zamanda bulguları başkalarına aktarmanın güçlü bir yolu olarak da hizmet eder. Bu modülde, çok çeşitli görselleştirmeler oluşturmaya yönelik çok yönlü bir araç olan ggplot2 paketini kullanarak veri görselleştirme dünyasına yolculuk yapacağız (Wickham, 2016).



Hadley Wickham'ın ggplot2'si, R ekosisteminde esnekliği ve zarif söz dizimi ile tanınan, geniş çapta beğenilen bir pakettir. Bazen hantal ve daha az sezgisel olabilen temel R grafiklerinden farklı olarak ggplot2, karmaşık ve estetik açıdan hoş görselleştirmeler oluşturma sürecini basitleştiren bir grafik grameri sunar.

ggplot2'nin temel ilkelerinden biri katmanlama yaklaşımıdır. Grafiğinize katmanları adım adım ekleyerek görselleştirmeyi kademeli olarak oluşturursunuz. Bu yaklaşım özellikle birden fazla bileşenden oluşan karmaşık grafikler oluşturmak istediğinizde faydalıdır. Bu modülde keşfedeceğimiz olay örgüsü türlerine bakalım:



İki sürekli değişken arasındaki ilişkileri anlamanız gerektiğinde dağılım grafikleri çok değerlidir. Bir değişkendeki değişikliklerin diğerini nasıl etkilediğini görselleştirmenize olanak tanır. ggplot2'de dağılım grafikleri oluşturmak basit bir işlemdir. Verileri belirleyecek, değişkenleri estetik özelliklerle (x ve y eksenlerindeki konum gibi) eşleyecek ve verileri temsil etmek için noktalar veya başka geometrik şekiller ekleyeceksiniz.

Çubuk grafikleri, kategorileri veya grupları karşılaştırmak için harika bir seçimdir. Genellikle kategorik verilerin sayımlarını veya oranlarını görüntülemek için kullanılırlar. Tercihlerinize bağlı olarak hem dikey hem de yatay çubuk grafikleri oluşturabilirsiniz. ggplot2'de çubuk çizimleri oluşturmak sezgiseldir ve son derece özelleştirilebilir. Verilerinizi etkili bir şekilde iletmek için çubukların, eksen etiketlerinin ve renklerin görünümünü kontrol edebilirsiniz.

Zaman içindeki eğilimleri ve değişiklikleri görselleştirmek istediğinizde çizgi grafikler ilk tercihinizdir. Bu grafikler özellikle zaman serisi verileri veya doğal bir diziye sahip herhangi bir veri için kullanışlıdır. ggplot2'de çizgi grafikleri oluşturmak hem basit hem de son derece özelleştirilebilirdir. Aynı grafik üzerinde birden fazla çizgi çizebilir, çizgi türlerini ve renklerini özelleştirebilir, bilgilendirici etiketler ve açıklamalar ekleyebilirsiniz.

Bu modülün sonunda ggplot2 kullanarak dağılım grafikleri, çubuk grafikleri ve çizgi grafiklerinin nasıl oluşturulacağı konusunda sağlam bir anlayışa sahip olacaksınız. Burada edinilen beceriler, verilerinizi görsel olarak keşfetmenize ve etkili bir şekilde iletmenize olanak sağlayacaktır. Veri görselleştirme, disiplin sınırlarını aşan evrensel bir dildir ve ilgi çekici ve bilgilendirici görselleştirmeler oluşturmadaki yeterliliğiniz, veri analizi yolculuğunuzda değerli bir varlık olacaktır.

Bu modül, R ve RStudio'nun yetkin kullanımı için temel sağlayarak katılımcıların veri analizi, manipülasyonu ve görselleştirme yolculuğuna çıkmalarını sağlar.



Gentleman, R., & Temple Lang, D. (2004). Statistical analyses and reproducible research. Bioconductor Project. https://bioconductor.org/help/course-materials/2003/RESOURCES/inst/doc/HowTo/curation-1.pdf

Grolemund, G., & Wickham, H. (2016). R for data science. O'Reilly Media.

R Core Team. (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing. https://www.R-project.org/

Wickham, H. (2016). ggplot2: Elegant graphics for data analysis. Springer. https://ggplot2.tidyverse.org /

Wickham, H., Averick, M., Bryan, J., Chang, W., McGowan, L. D., François, R., ... & R Studio. (2021). Welcome to the tidyverse. Journal of Open Source Software, 6(1), 1686.