Голосов: 0
#1
Курс Data Scientist [2021]
Level UP
Ирина
Курс Data Scientist ориентирован на начинающих разработчиков, знакомых с основами разработки на Python.
Программа обучения Data Science содержит большое количество практических задач на закрепление знаний, а также мини-проекты на протяжении курса.
Целью курса Data Scientist является понимание и умение применять на практике все необходимые технологии связанные с Data Science.
При успешном прохождении курса студент может претендовать на должность Junior Data Scientist или Junior Data Analyst.
Каждая из тем курса содержит практические примеры, а каждое занятие сопровождается домашним заданием для закрепления материала.
В конце курса разберем самые популярные вопросы для собеседования.
1. Введение. Терминология.
2. Python + Git
- Рассмотрение различных ролей в AI-team и их навыков.
- Различия/Сходства программирования и науки о данных.
- Цикл разработки AI продукта.
- Полезные ресурсы.
3. JupyterLab + MarkDown
- Вспоминаем
- Закрепляем
- Решаем задачки
4. Data Engineering
5. Modeling
- Подготовка данных для обучения (feature engineering).
- Способы сбора/поиска данных для обучения.
- Анализ данных (в том числе визуализация).
- Что такое ETL?
- Базы данных
- SQL (на примере MySQL).
- NoSQL (на примере MongoDB).
- Обзор терминов: Hadoop, Spark, Hive.
6. Deployment
- ML (Classic models)
- Типы:
- Logistic Regression
- Linear Regression
- Decision Trees
- Random Forest
- XGBoost
- Support Vector Machines (SVM)
- K-means
- K-Nearest Neighbors (K-NNs)
- Principal Component Analysis (PCA)
- Naive Bayes Classifier
- Lasso/Ridge regression
- Пакеты/Фреймворки для работы
- Methods to train (initialization, optimization, regularization, and hyperparameter tuning).
- Анализ результатов моделей, рекомендации.
- Deep Learning
- Типы:
- Deep Neural Networks (DNNs) | Feed Forward Networks (FFNNs)
- Recurrent Neural Network (RNN)
- Long Short Term Memory (LSTM)
- Convolutional Neural Network (CNN)
- Пакеты/Фреймворки для работы
- Methods to train (initialization, regularization, optimization, and transfer learning).
- Анализ результатов моделей, рекомендации.
- Математика для DS (базовые знания, ничего страшного)
- Статистика (hypothesis testing, bias/variance tradeoffs, mean, variance, and mode).
- Теория вероятностей (distributions, conditional probabilities, independence, Bayes theorem).
- Математический анализ (derivatives, integrals)
- Линейная алгебра (matrix vector operations, eigenvalues, eigenvectors, and combinatorics).
- Математические функции (min/max/argmin/argmax...).
- Математика для анализа данных (preprocessing, visualization and metrics such as
- accuracy, R-squared, residuals, precision, and recall).
- Обзор языка R.
7. Business Analysis
- Что такое рефакторинг. Основные подходы.
- Обзор AWS, Azure и аналогов.
- Preparing files (usually model architecture and parameters) for deployment.
8. Infrastructure
- Визуализация
- Tableau
- matplotlib
- seaborn
- Анализ того, что получилось на графиках (корреляция, среднее...).
9. Разбор классических вопросов на собеседовании
- Базовые понятия GPU / CUDA
- Docker + Linux terminal.
- A/B testing
- Unit & Functional tests
- Классические алгоритмы и структуры данных (О-большое, понятие оптимизации).
Для просмотра содержимого вам необходимо зарегистрироваться!Для просмотра содержимого вам необходимо зарегистрироваться!
Последнее редактирование модератором:
- Статус
- В этой теме нельзя размещать новые ответы.