< Что вы изучите на курсе >
Программа обучения
Чтобы получить подробную информацию о программе обучения Data Science
включая обзор ключевых библиотек, используемых специалистами в работе, — оставьте свою электронную почту
3 урока
Визуализация и разведочный анализ данных
Научитесь строить и анализировать различные графики (гистограммы, диаграммы размаха и рассеяния и др.), а также как их интерпретировать. Освоите процесс первичного анализа данных, который играет первостепенную роль до момента обучения ML-моделей. Научитесь формулировать гипотезы и делать выводы на основании графиков и цифр
/
2 недели
2 практических ДЗ
/
Попрактикуетесь в создании наборов данных для тренировки построения графиков и проведете свой первый анализ кредитной истории клиентов банка
< Раздел №1 >
8 уроков
Машинное обучение. Линейные модели
Подробно изучите процесс разработки и обучения ML-моделей в компании. Освоите методы предобработки данных, генерации признаков, линейные модели и метрики оценки. Научитесь решать задачи классификации, включая многоклассовую классификацию
/
4 недели
2 практических ДЗ
/
Разработаете алгоритм линейной регрессии с нуля. Обучите ML-модель для прогнозирования интереса кандидатов к трудоустройству и построите многоклассовую модель сегментации клиентов
< Раздел №2 >
3 тестовых ДЗ
/
7 уроков
Машинное обучение. Деревья решений и ансамбли
Изучите алгоритм дерева решений и его отличия от линейных моделей. Освоите градиентный бустинг и его реализации, научитесь правильно подбирать гиперпараметры. Познакомитесь со сложными техниками: стекинг и блендинг
/
3 недели
3 практических ДЗ
/
Примените полученные знания для предсказания цен автомобилей и прогнозирования покупки автострахования на основе данных клиентов банка
< Раздел №3 >
2 урока
Машинное обучение. Метрические алгоритмы и кластеризация
Изучите метрические алгоритмы для регрессии и классификации. Освоите решение задач кластеризации: снижение размерности, выбор алгоритма и числа кластеров, интерпретацию результатов
/
1 неделя
1 практическое ДЗ
/
Проведете сегментацию пользователей на основе DMP данных для персонализированной рекламы. Опишете характеристики сегментов и дадите рекомендации по применению результатов
< Раздел №4 >
4 урока
Deep Learning
Узнаете, что такое глубокое обучение, какие задачи решают при помощи него. Разберете как устроены нейросети и как они обучаются. Познакомитесь с основными архитектурами, а также последними технологиями в области DL. Освоите библиотеки для обработки нейросетей
/
1 неделя
< Раздел №7 >
2 урока
Natural Language Processing. Введение
Освоите базовые методы обработки текста, как превратить текст в понятный компьютеру вид. Узнаете о последних технологиях, а также лучших практиках, которые используются при обработке текстов. Разберете как устроены модели на основании архитектуры Transformers
/
1 неделя
< Раздел №5 >
3 урока
MLOps. Введение в интеграцию моделей ML в production
Научитесь писать переиспользуемый и оптимизированный код, изучите работу с REST API. Особое внимание будет уделено Docker, его основным компонентам и Docker Compose. Научитесь самостоятельно развертывать проекты машинного обучения в Docker
/
2неделя
< Раздел №6 >
14 уроков
+ Natural Language Processing. Расширенный блок (тариф Grandmaster)
Изучите задачи и методы NLP: от базовых с регулярными выражениями до продвинутых на базе Transformer. Разберете архитектуры популярных моделей, включая GPT, BERT. Познакомитесь с задачей анализа кода при помощи продвинутых алгоритмов
/
4 недели
3 практических ДЗ
/
Узнаете об анализе диалогов и текстовых расшифровок звонков, а также о практическом применении NLP и внедрении моделей в production
< Раздел №7 >
11 тестовых ДЗ
/
Построите модель определения контактных данных в объявлениях для обнаружения мошенников. Обучите алгоритм перевода с одного языка на другой. Выделите именованные сущности из документов
14 уроков
+ Recommender System. Расширенный блок (тариф Grandmaster)
Изучите методы для построения рекомендательных систем: контентную и коллаборативную фильтрацию, гибридные подходы. Разберете матричную факторизацию, модели на основе соседства, продвинутые техники на базе нейросетей (BERT4REC, SASREC) и графов. Освоите оценку эффективности рекомендательных систем при помощи различных метрик
/
4 недели
4 практических ДЗ
/
< Раздел №8 >
4 тестовых ДЗ
/
Создадите свою первую рекомендательную систему для предсказания наиболее релевантного фильма на основании его интересов и личной информации пользователя. Предскажите следующую покупку клиента на сайте маркетплейса