1 Що таке R?
R є поширеною мовою програмування для роботи з даними (DataScience
) та машинного навчання (Machine Learning
). Але Ви можете скористатися засобами R
і для простіших задач: обчислення, візуалізація даних.
Синтаксис мови програмування R
є досить простим для вивчення та використання, а широкий набір готових пакетів дозволяє використати готові розробки для вирішення широкого спектру задач від статистичних обчислень до навчання нейронних мереж для розпізнавання/класифікації зображень.
Важливо відмітити, що мова програмування R
є безкоштовною (free
) і має відкритий код (open source
).
R
має ряд корисних властивостей:
Візуалізація даних. Побудова різноманітих видів графіків, робота з мапами, широкий спектр бібліотек та налаштувань до них.
Повторне використання коду. На відміну від електронних таблиць, що мають обмеження на кількість спостережень (наприклад, MS Excel), R дозволяє працювати з великими масивами даних та перезапускати обчислення у потрібний момент, не створюючи додаткових копій даних.
Машинне навчання. R дозволяє використати для побудови, навчання та тестування моделей, а також оптимізації гіперпараметрів та відбору факторів дуже велику кількість алгоритмів. Існують також спеціальні пакети, що об’єднують у собі усі описані функції та алгоритми, наприклад,
caret
(Kuhn 2022) таmlr
(Lang et al. 2019).Автоматизація. Написаний код та проєкти можна перетворити у готові до публікації та впровадження продукти (deployment) або використовувати напрацьовані алгоритми для швидкого вирішення схожих задач (pipeline).
Також можна виділити досить корисні можливості R
як *розробка веб-застосунків та підготовка звітності**, адже, використовуючи спеціальні бібліотеки (shiny
(Chang et al. 2022), shinydashboard
(Chang and Borges Ribeiro 2021), flexdashboard
(Sievert et al. 2022), rmarkdown
(Xie, Dervieux, and Riederer 2020), knitr
(Xie 2015) тощо) результати виконаної роботи можна “оживити” або сформувати “на льоту” готові до презентації документи.