Тип курса: Онлайн
Уровень: Средний Начальный
Срок обучения: 12 недель
Тестирование:
Сертификат об окончании: Да
Язык: Русский
С 2012 по 2019 годы количество вакансий специалистов по Data Science и машинного обучения выросло в 20 раз. Прямо сейчас стажеров и профессионалов ищут Яндекс, Mail.ru, Сбербанк, Райффайзенбанк, Росбанк, МТС, Tele2, ЦИАН, М-Видео, Северсталь и другие крупные компании.
Совместно с профи из российских Data Science компаний мы разработали курс Machine Learning, ориентированный на практику. Вы изучите принципы математических алгоритмов, современные библиотеки, feature engineering и оценку моделей. В конце обучения на курсе примените все изученные методы на финальном проекте и сможете собрать Git-репозиторий с решенными кейсами.
Краткая программа курса
Модуль 1
Введение в машинное обучение
Знакомимся с основными задачами и методами machine learning , изучаем практические кейсы и применяем базовый алгоритм работы над ml-проектом
Решаем 50+ задач на закрепление темы
Модуль 2
Методы предобработки данных
Изучаем типы данных, учимся очищать и обогащать данные, используем визуализацию для предобработки и осваиваем feature engineering
Решаем 60+ задач на закрепление темы
Модуль 3
Регрессия
Осваиваем линейную и логистическую регрессию, изучаем границы применимости, аналитический вывод и регуляризацию. Обучаем модели регрессии
Решаем 40+ задач на закрепление темы
Модуль 4
Кластеризация
Осваиваем обучение без учителя, практикуемся в его различных методах, работаем с текстами средствами ML
Решаем 50+ задач на закрепление темы
Модуль 5
Tree-based алгоритмы: введение в деревья
Знакомимся с решающими деревьями и их свойствами, осваиваем деревья из библиотеки sklearn и используем деревья для решения задачи регрессии
Решаем 40+ задач на закрепление темы
Модуль 6
Tree-based алгоритмы: ансамбли
Изучаем особенности ансамблей деревьев, практикуемся в бустинге, используем ансамбль для построения логистической регрессии
Решаем 40+ задач на закрепление темы
Участвуем в соревновании на kaggle по обучению tree-based модели
Модуль 7
Оценка качества алгоритмов
Изучаем принципы разбиения выборки, недо- и переобучение, оцениваем модели по различным метрикам качества, учимся визуализировать процесс обучения
Оцениваем качество нескольких моделей ML
Решаем 40+ задач на закрепление темы
Модуль 8
Временные ряды в машинном обучении
Знакомимся с анализом временных рядов в ML, осваиваем линейные модели и XGBoost, изучаем принципы кросс-валидации и подбора параметров
Решаем 50+ задач на закрепление темы
Модуль 9
Рекомендательные системы
Изучаем методы построения рекомендательных систем, осваиваем SVD-алгоритм, оцениваем качество рекомендаций обученной модели
Решаем 50+ задач на закрепление темы
Модуль 10
Финальный хакатон
Применяем все изученные методы для получения максимальной точности предсказаний модели на kaggle
Видео