EN | PT | TR | RO | BG | SR
;

6. Modul: ANALIZA CANTITATIVĂ R TRAINING


REZUMAT

Modulul 1: Introducere în R și import/manipulare de date
Introducere în programarea R și RStudio.

Bazele programării R: tipuri de date, variabile, operații de bază.

Importul și manipularea datelor în R: citirea datelor în R, manipularea datelor utilizând dplyr, tidyr și alte pachete.

Grafice de bază în R: crearea de diagrame de împrăștiere, diagrame de bare și grafice liniare utilizând ggplot2.

 

Modulul 2: Statistici descriptive și inferențiale
Statistici descriptive în R: măsuri ale tendinței centrale, măsuri ale variabilității și reprezentări grafice precum histograme și boxploturi.

Statistici inferențiale în R: testarea ipotezelor, intervale de încredere și valori p.

Efectuarea testelor t și a testelor chi pătrat în R.

Regresia liniară în R: modelarea relației dintre două variabile și interpretarea rezultatelor regresiei.

 

Modulul 3: Manipularea avansată a datelor și grafică
Manipularea avansată a datelor utilizând pachetele tidyr și dplyr.

Crearea de grafice complexe și avansate utilizând ggplot2, inclusiv personalizarea esteticii grafice, cum ar fi culorile și temele.

Pachete specializate pentru manipularea și vizualizarea datelor, cum ar fi lubridate, forcats și gridExtra.

 

Modulul 4: Regresie multiplă și concepte de programare de bază
Regresia multiplă în R: modelarea relației dintre mai multe variabile independente și o variabilă dependentă.

Concepte de programare de bază în R: bucle, instrucțiuni if-else și funcții.

Utilizarea unor pachete precum car și stargazer pentru sarcini de modelare mai avansate, cum ar fi testele de diagnosticare și compararea modelelor.

 

Modulul 5: Analiza statistică avansată și analiza seriilor cronologice
Analiză statistică avansată în R: analiză factorială, analiză cluster și analiza seriilor temporale.

Introducere în analiza seriilor temporale: modelarea și prognoza datelor dependente de timp.

Aplicații ale analizei seriilor temporale în diverse domenii.

 

Autori

conf. univ. dr. Dana RAD

asist.univ.drd. Gavril RAD


OBIECTIVE DE ÎNVĂȚARE

În lumea bazată pe date din zilele noastre, capacitatea de a extrage informații semnificative din date este o abilitate foarte căutată.

Pentru cercetători, oameni de știință în domeniul datelor și analiști, limbajul de programare R și RStudio reprezintă instrumente indispensabile în arsenalul lor.

R este renumit pentru flexibilitatea sa în calculul statistic și analiza datelor, în timp ce RStudio oferă un mediu de dezvoltare integrat (IDE) ușor de utilizat care îmbunătățește experiența R.

Acest modul servește drept piatră de temelie, familiarizând participanții cu aspectele esențiale ale R, de la sintaxa sa până la capacitățile sale puternice de manipulare a datelor și tehnicile de bază de vizualizare a datelor.

În plus, vom analiza importanța critică a importului și gestionării eficiente a datelor în contextul analizei statistice. Până la sfârșitul acestui modul, participanții vor dobândi competențe în următoarele domenii (R Core Team, 2021).


CONȚINUTUL UNITĂȚII






REFERINȚE

Auguie, B. and Antonov, A. (2017). gridExtra: Miscellaneous functions for "Grid" Graphics. R package version 2.3. https://CRAN.R-project.org/package=gridExtra

Dagum, C. (2001). Advanced time series analysis for transport. Journal of the Royal Statistical Society: Series A (Statistics in Society), 164(1), 47-66.

Fox, J. (2021). Car: Companion to applied regression. R package version 3.0-9.

Fox, J., & Weisberg, S. (2019). An R companion to applied regression. Sage.

Gentleman, R., & Temple Lang, D. (2004). R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics, 5(3), 299-314.

Gentleman, R., & Temple Lang, D. (2004). Statistical analyses and reproducible research. Bioconductor Project. https://bioconductor.org/help/course-materials/2003/RESOURCES/inst/doc/HowTo/curation-1.pdf

Grolemund, G., & Wickham, H. (2016). R for data science. O'Reilly Media.

Hlavac, M. (2021). Stargazer: Well-formatted regression and summary statistics tables. R package version 5.2.2.

Lévy, J. B., & Parzen, E. (2013). Smoothing and regression: Approaches, computations, and application. Academic Press.

R Core Team. (2021). Linear models. R: A language and environment for statistical computing. https://cir.nii.ac.jp/crid/1370857669939307264

R Core Team. (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing. https://www.R-project.org/

R Core Team. (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing.

Spinu, V., Grolemund, G., & Wickham, H. (2021). lubridate: Make dealing with dates a little easier. R package version 1.8

Wickham, H. (2016). ggplot2: Elegant graphics for data analysis. Springer. https://ggplot2.tidyverse.org /

Wickham, H. (2021). forecast: Tools for working with categorical variables (Factors). R package version 0.5.1.

Wickham, H., Averick, M., Bryan, J., Chang, W., McGowan, L. D., François, R., ... & R Studio. (2021). Welcome to the tidyverse. Journal of Open Source Software, 6(1), 1686.