Список використаних джерел
Основи роботи з даними в R
Twitter
Facebook
LinkedIn
Про посібник
Вступ
ТЕМА 1. ВСТУП ДО РОБОТИ З ДАНИМИ
1
Загальна інформація + презентація
ТЕМА 2. ЧИТАННЯ ДАНИХ
2
Загальна інформація + презентація
3
CSV
4
MS Excel (xlsx)
5
XML
6
JSON and API
7
Google Services
8
SQL (with SQLite sample)
9
Web-pages (HTML)
ТЕМА 3. МАНІПУЛЮВАННЯ ДАНИМИ У
dplyr
10
What’s
dplyr
package [EN]
11
Exploring data with
dplyr
12
Subset rows with
slice()
13
Sorting with
arrange()
14
Create new variables with
mutate()
15
Renaming columns with
rename()
16
Grouping columns with
dplyr
17
Binding rows and columns
18
Join()
-ing data
19
Wide-to-long tables
ТЕМА 4. СПОСОБИ ОЧИСТКИ ДАНИХ
20
Оцінки якості даних
21
Робота з неіменованими та “поганоіменованими” даними
22
Підготовка та очистка текстової інформації
23
Заміна пропусків у даних (Missing Value Imputation)
24
Аналіз та обробка статистичних викидів у даних
ТЕМА 5. КОНСТРУЮВАННЯ ОЗНАК
25
Feature engineering in R
ТЕМА 6. ПОДІЛ ВИБІРКИ
26
Data Split: Train, Test and Validation sets
ТЕМА 7. ОГЛЯДОВИЙ АНАЛІЗ ДАНИХ
27
EDA на прикладі вина
28
EDA, робота з ggplot2
29
EDA з dlookR
30
EDA з використанням inspectdf
Список використаних джерел
Список використаних джерел
R Core Team. 2020.
R: A Language and Environment for Statistical Computing
. Vienna, Austria: R Foundation for Statistical Computing.
https://www.R-project.org/
.
30
EDA з використанням inspectdf