Курс Data Science для

Реальные задачи и проекты, разбор алгоритмов и методов машинного обучения, пробное собеседование
17.02
Старт второго потока
17 февраля 2022
Длительность 6 месяцев
Уровень с нуля
Старт набора в июле
* количество мест ограничено
# детальнее о курсе
О курсе
Никулина Анастасия
Никулина Анастасия
С каждым годом растет число вакансий по машинному обучению, курсов, которые помогают вам приобрести знания в данной сфере, но и параллельно растет конкуренция. Чтобы оставаться конкурентным, повысить свои шансы на получение работы в Data Science, вы должны знать, что сейчас актуально, какие требования у компаний к специалистам.

Данный курс поможет вам обрести базис, понимание, как работают алгоритмы, что находится у них «под капотом», в каких случаях применять тот или иной метод, также он поможет вам применять полученные знания для собственного проекта, если вы хотите использовать машинное обучение, оставаясь на текущем месте работы.

Мы подготовили не просто программу по классическому машинному обучению, мы поделимся знаниями, какие результаты для компании дает применение модели ML, посмотрим, как проводятся А/Б тестирование на практике, познакомим вас с NLP и Deep Learning, возможно вы захотите в дальнейшем развиваться в одной из этих интереснейших сфер.

Помимо самого материала, подготовим с вами pet-project, поможем со сбором и обработкой данных, поделимся основными фишками, как учить материал, проведем митапы, чтобы лучше разобраться, как устроены алгоритмы, поработаем над soft-skills, а также, что очень важно, сделаем предварительное собеседование с актуальными вопросами на позицию Data Scientist. Это поможет вам в несколько раз увеличить вероятность прохождения собеседования в дальнейшем.
// прочитать полностью
Для кого
# Для кого
Подойдет для начинающих, кто только хочет освоить машинное обучение, не важно, в какой сфере вы работали. Также нужны знания школьной математики, базовых принципов
Что получаете
# Что получаете
Знания, как работают алгоритмы машинного обучения
Практика на реальных данных
Собственный pet-project
Трудоустройство
# Трудоустройство
Помогаем грамотно составить резюме
Проведем тестовое собеседование
Рекомендуем выпускников компаниям-партнерам
# специалисты в своем деле
Преподаватели и эксперты
Анастасия Никулина фото
Анастасия Никулина
CEO & Founder PyMagic
ex-Senior DS Росбанк, OMD Group, МТС
Автор канала про машинное
обучение на YouTube
Ильдар Сафило фото
Ильдар Сафило
Expert Data Scientist МТС (Recommender systems, A/B testing)
HSE Lector, ex-Lead DS Tinkoff
Петр Ермаков фото
Петр Ермаков
Руководитель школы машинного обучения DataGym.ru
Senior Data Scientist Lamoda
Евгений Разников фото
Евгений Разинков
Приглашенный эксперт
AI-евангелист, к.ф.-м.н.
директор по науке в компании Pr3vision
преподает ML с 2015 года
razinkov.ai
>Юлия Морозова фото
Юлия Морозова
HR Manager QIWI
Опыт IT подбора 4 года,
проводит карьерные консультации,
обучает сорсингу
>Александр Рыжков фото
Александр Рыжков
Kaggle Grandmaster
Team Lead команды AutoML
(создателей LightAutoML)
Центра ML Инструментов
# что вы изучите на курсе
Программа
Основы Python
  • Что такое Python?
  • Основные структуры данных и типы переменных
  • Anaconda & Jupyter Notebook
  • Условия
  • Циклы
  • Функциональное программирование
  • Объектно-ориентированное программирование
  • Алгоритмы сортировки
SQL
  • Основы синтаксиса
  • Соединение таблиц
  • Оконные функции
  • Ранжирующие функции
  • Функции смещения
Математический анализ
  • Графики функций
  • Предел и производная
  • Задача нахождения экстремума
  • Интеграл
  • Градиент
Линейная алгебра
  • Векторы и операции над ними
  • Матрицы и операции над ними
  • Системы линейных уравнений (СЛАУ)
  • Методы решения систем линейных алгебраических уравнений
  • Матричные разложения
  • Сингулярное разложение матриц SVD
Статистика
  • Основные определения
  • Описательные статистики
  • Параметры, характеризующие разброс
  • Нормальное распределение
  • Центральная предельная теорема
  • Доверительные интервалы
  • Проверка гипотез. Меры различий
  • Параметрические критерии. Одновыборочный критерий t-Стьюдента
  • Параметрические критерии. Двухвыборочный критерий t-Стьюдента
  • Непараметрические критерии. Критерии Манна-Уитни
  • Корреляция
  • Корреляция Пирсона
  • Корреляция Спирмена
А/Б тестирование
  • Введение
  • Основные статистические критерии
  • Мощность и корректность
  • Что нужно знать перед запуском теста?
  • Метод повышения чувствительности CUPED
Теория вероятностей
  • Основные определения
  • Свойства вероятности
  • Условная вероятность
  • Формула полной вероятности и Теорема Байеса
  • Элементы комбинаторики
Методы оптимизации
  • Градиентный спуск
  • Стохастический градиентный спуск
  • Генетические алгоритмы
  • Алгоритм дифференциальной эволюции
Машинное обучение. Введение
  • Что такое Data Science и для чего он нужен?
  • Подробный процесс разработки моделей
  • Разведочный анализ данных (exploratory data analysis, EDA)
  • Визуализация: библиотеки и методы
  • Обучение с учителем
  • Обучение без учителя
  • Преобразования признаков
  • Методы масштабирования признаков
  • Кодирование категориальных признаков
Линейные алгоритмы
  • Линейная регрессия
  • Метод максимального правдоподобия
  • Метрики качества в задачах регрессии
  • Линейные алгоритмы. Классификация
  • Линейный классификатор
  • Ошибка в задачах классификации. Функция потерь
  • SVM. Нелинейные ядра
  • Спрямляющие пространства
  • Логистическая регрессия
  • Метрики качества в задачах классификации
Способы борьбы с переобучением
  • Регуляризация
  • Оценка работы алгоритма
  • Отложенная выборка
  • Кросс-валидация
  • Кросс-валидация со стратифицированной выборкой
Деревья
  • Решающие деревья
  • Построение деревьев
  • Критерии информативности
  • Критерий информативности для регрессии
  • Критерий информативности для классификации
  • Энтропийный критерий информативности
  • Критерий останова
  • Стрижка деревьев
  • Композиции деревьев
  • Бутстрап
  • Бэггинг
  • Случайные леса
  • Определение бустинга
  • Градиентный бустинг
  • XGBoost
Метрические алгоритмы
  • Метод k-ближайших соседей
  • Метрики
Байесовские модели
Кластерный анализ
  • Метрики качества кластеризации
  • K-means
  • Графовые методы. Spectral Clustering
  • Иерархическая кластеризация
  • DBSCAN
  • Метод главных компонент PCA
Ансамблирование, стекинг и блендинг
  • Блендинг
  • Стэкинг
NLP
  • Быстрое погружение в лингвистику
  • Превращение текста в вектор
  • Морфологический анализ
  • Сравнение текстов
  • Задачи NLP
  • Машинное обучение на текстах
  • Фичи на текстах
  • Задачи машинного обучения на текстах
  • Best practices
  • Альтернативные подходы к подготовке фичей на текстах
  • Задачи выделения фактов
Deep Learning
  • В чем отличия от классического ML?
  • Почему это стало возможным?
  • Преимущества глубокого обучения
  • Сферы применения
  • Ключевые компоненты алгоритма глубокого обучения
  • Основные глубокие архитектуры
  • Подход к изучению: что должен знать специалист по DL?
Kaggle
  • Kaggle-соревнования - как участвовать в них эффективнее?
  • Ключевые моменты, на которые нужно обратить внимание на старте соревнования
  • Продумывание и подготовка скелета пайплайна решения
  • Наращиваем «мясо» на скелет - на что делать акцент, как искать инсайты?
  • Объединение в команду - баг или фича?
  • Дилемма выбора финальных решений
Введение ML в production
  • Написание переиспользуемого кода для production
  • Фреймворк FastAPI / backend для ML
  • Фреймворк streamlit / frontend для ML
  • Развертывание модели машинного обучения с использованием FastAPI и streamlit
  • Что такое Docker? Основные компоненты
  • Развертывание ML проекта в Docker с backend и frontend
Трудоустройство
  • Составление резюме и сопроводительного письма
  • Залог успешной самопрезентации
  • Где искать вакансии и как выходить напрямую в компании
# от теории к практике
Трудоустройство
Подготовка резюме
>> Подготовка резюме
Поможем составить резюме и написать сопроводительное письмо, чтобы выделить вас среди тысячи других кандидатов. Научим грамотно презентовать свои навыки и использовать предыдущий опыт для новой специализации Data Science. Проведет лекцию и проконсультирует HR-эксперт QIWI
Рекомендации
>> Рекомендации
Выпускников, которые успешно закончили курс, рекомендуем компаниям-партнерам среди которых Сбер, МТС, Яндекс, Росбанк и другие
Сопровождение
>> Сопровождение
На всем этапе трудоустройства до момента оффера сопровождаем выпускников, помогаем с разбором ошибок: на какие темы необходимо обратить внимание и как лучше к ним подготовиться, чтобы в дальнейшем увеличить вероятность прохождения собеседования
# if знания бесценны == true: print(”go!”)
Стоимость
Профессиональные навыки:
  • Использую Python для построения моделей машинного обучения и построения алгоритмических конструкций
  • Владею SQL для написания простых и сложных запросов
  • Применяю методы математического анализа, линейной алгебры, статистики и теории вероятности для обработки данных
  • Умею визуализировать данные при помощи Pandas, Matplotlib, Seaborn
  • Разбираюсь в классических алгоритмах машинного обучения и применению их на практике
  • Знаю библиотеки: pandas, numpy, matplotlib, seaborn, scikit-learn, xgboost, lightgbm, catboost
  • Умею оценивать качество работы алгоритма
  • Умею применять стеккинг, блендинг и ансамблирование
  • Знаком с основными подходами в NLP, Deep Learning
  • Понимаю основные принципы организации и проведения А/B-тестирования
  • Умею разворачивать ML модель через REST API с UI в Docker, Docker (FastAPI, Streamlit)
Модули:
#1
Поддержка преподавателей
#2
Реальные данные и задачи
#3
Python
#4
SQL
#5
Математический анализ, статистика
#6
Классические ML-алгоритмы
#7
А/Б тестирование
#8
NLP
#9
Введение в Deep Learning
#10
Kaggle
#11
Введение ML в production
#12
Митапы с разборами алгоритмов
#13
Pet-project
#14
Тестовое собеседование
#15
Трудоустройство
#16
Рекомендации компаниям-партнерам
#17
Доступ к материалам в течение года
#тип оплаты
Помесячно
Оплата только для действующих студентов 2 потока
20 000 ₽рублей
Купить
#тип оплаты
Полная оплата
-20%
95 000 ₽рублей
120 000 ₽рублей
Скидка 25 000 ₽ при полной оплате
SOLD OUT
# что думают люди...
Отзывы участников
pymagic отзыв #0
pymagic отзыв #1
pymagic отзыв #2
pymagic отзыв #3
pymagic отзыв #4
# frequently asked questions
FAQ
Для кого подойдет этот курс?
Курс будет полезен как тем, кто только хочет войти в сферу Data Science, изучить основы и устроиться на позицию Junior Data Science, так и тем, кто хочет изучить машинное обучение для своих профессиональных задач, развивая ту область, где вы сейчас работаете, например в сфере медицины.
Как происходит оплата?
Вы можете оплатить сразу весь курс, либо оплачивать помесячно, цена на первом потоке будет ниже, чем на следующих. Также вы можете взять рассрочку и выплачивать стоимость курса по частям. В случае, если вам не понравится курс в первые 2 недели, мы вернем вам оплату, за вычетом пройденного материала.
Какой уровень подготовки требуется для поступления на курс?
Достаточно иметь базовые знания школьной математики, иметь опыт решения интегралов и производных, но, если вы этого не помните, ничего страшного, главное, что был опыт решения подобных задач.
Устроюсь ли я на работу после прохождения данного курса?
Если вы успешно пройдете курс и как минимум ответите на большинство вопросов на тестовом собеседовании, то ваши шансы на получение работы кратно увеличатся, далее все будет зависеть от того, насколько вы собраны и глубоко погрузились в материал лекций.
Как проходит обучение?
Лекции проходят в формате онлайн. Все материалы и видео-лекции будут доступны на платформе, к которой вы получите доступ после оплаты. Также необходимо зарегистрировать Google аккаунт для получения и отправки материалов. Домашние задания вам будет необходимо загружать на платформу, при проверке материала, в вашем файле мы будем оставлять комментарии по решению. Важным моментом является и самостоятельная работа, мы даем в качестве домашнего задания дополнительную литературу, где помогаем на данном этапе учиться работать со сторонней информацией, также вы постепенно учитесь понимать, какие статьи вам необходимо читать среди всего того, что есть в интернете. Если у вас появляются вопросы, вы можете задавать их на онлайн уроках, а также в Discord, помимо этого можете общаться и с другими учащимися.
Для чего нужен митап?
На митапе мы будем рассказывать друг другу про выбранные алгоритмы, которые попробовали реализовать самостоятельно, темы из линейной алгебры, теории вероятностей и пр. Так вы лучше сможете усвоить информацию и в последующем доносить ее другим людям.
Зачем я должен платить за курс, если в интернете много бесплатных материалов?
Как правило, подобный материал не структурирован, вам будет требоваться больше времени на его изучение, к тому же необходим высокий уровень самоорганизации. На курсе есть поддержка преподавателей, вы можете задавать напрямую вопросы тем, кто уже работает в Data Science несколько лет. Самое главное преимущество — это то, что мы готовим вас к реальному собеседованию, проводим митапы, где вы учитесь лучше усваивать материал и доносить его до других, также мы даем вам поработать с реальными данными и задачами, помогаем с pet-project (финальный проект).
Будете ли вы выдавать сертификат после успешного прохождения?
Да, сертификат будет выдаваться, но необходимо, чтобы вы выполнили не менее половины от практических домашних заданий, сделали pet-project, а также успешно прошли тестовое собеседование (более 70% правильных ответов).
Что, если я не прошел тестовое собеседование? Я не получу сертификат?
Так как собеседование и называется тестовым, вы можете пройти его с 3-х попыток. Так вы обратите внимание на свои пробелы в знаниях и что самое главное, укрепите свои знания, вы будете уже более уверенны на реальном собеседовании. Если вы не получили сертификат, это не означает, что вас не возьмут на работу, вам необходимо еще раз повторить материал, заполнить пробелы в знаниях, тогда результат не заставит себя ждать!
Что будет после прохождения курса, могу ли я задавать вопросы и получать помощь?
Да, первые два месяца после завершения курса, мы будем поддерживать вас, если у вас появятся вопросы по курсу, материалам, необходима будет консультация по pet-project, собеседованиям и т.д., вы смело можете писать свои вопросы в Discord.
# всегда ждем Ваших сообщений
Контакты
+79151670832 annikulina@pymagic.ru miracl6