Голосов: 0
#1
Программирование на языке R. Уровень 1.
Базовые знания. Александр Кораблин
Целевое предназначение языка программирования R – это статистический анализ данных. Язык содержит широчайший спектр инструментов анализа данных, средств визуализации, создания документов и веб-приложений.
Что удобнее делать в R? В основном отмечают четыре вещи:
В R по сравнению с SPSS есть возможность самому без ограничений создавать какой-то свой фунционал, использовать его и делиться им. В SPSS вы целиком и полностью зависите от разработчиков.
- статистический анализ данных;
- создание высококачественной визуализации данных;
- документирование статистических обсчетов;
- cоздание интерактивных веб-приложений.
Цель курса – дать слушателям знания, которые помогут овладеть базовыми навыками анализа и визуализации данных в среде R.
Курс предназначен для широкого круга специалистов, которым необходимо искать закономерности в большом количестве данных, визуализировать их и строить статистически корректные выводы.
По окончании курса Вы будете уметь:
По окончании курса Вы будете знать:
- создавать/модифицировать вектора, табличные данные, матрицы, списки; рассчитывать статистические метрики для наборов данных;
- строить и диагностировать статистически модели: линейная регрессия (от одной и многих переменных), классификация (kmeans, деревья решений, случайный лес);
- визуализировать данные в R (base plotting, ggplot2);
- создавать текстовые документы с модулями исполняющегося кода (отчеты).
Специалисты, обладающие этими знаниями и навыками, в настоящее время крайне востребованы. Большинство выпускников наших курсов делают успешную карьеру и пользуются уважением работодателей.
- типы данных в R и самые популярные средства инструменты с ними;
- теоретические основы моделей регрессии и классификации; инструменты R для создания таких моделей;
- инструменты визуализации данных, средства документирования отчетов.
Модуль 1. Знакомство с R и RStudio. Основные особенности
Модуль 2. Типы данных в R и работа с ними
- Интерфейс RStudio
- Основные особенности языка R
- RMarkdown
- Практическая работа: Знакомство с интерфейсом RStudio. Создание файлов типа RMarkdown
Модуль 3. Линейная регрессия в R
- Вектора, списки, матрицы, таблицы. И работа с ними
- Загрузка/выгрузка данных в/из R
- Базовые функции R
- Библиотека dplyr
- Условное выполнение кода (if…else)
- Циклы for, while
- Функции семейства *apply
- Практическая работа: Манипуляции с данными в R. Чтение/запись данных
Модуль 4. Алгоритмы классификации в R
- Простая линейная модель в R
- Линейная модель с несколькими переменными
- Диагностика линейных моделей
- t-тест, непараметрические тесты.
- ANOVA
- Практическая работа: Построение и интерпретация моделей линейной регрессии, А/В тесты, применение метода ANOVA на тестовых данных
Модуль 5. Средства визуализации в R
- Постановка задачи классификации
- Линейная классификация в R
- Алгоритмы KNN, деревья решений, случайный лес
- Диагностика моделей классификации, ROC-кривая
- Практическая работа: Построение и интерпретация моделей классификации
- Base plotting
- Библиотека ggplot2
- Практическая работа: Визуализация данных с помощью библиотеки ggplot2 и средствами base plotting
Для просмотра содержимого вам необходимо зарегистрироваться!Для просмотра содержимого вам необходимо зарегистрироваться!
Последнее редактирование модератором:
- Статус
- В этой теме нельзя размещать новые ответы.