Математика и Machine Learning для Data Science

Тип курса: Онлайн

Уровень: Средний Начальный

Срок обучения: 20 недель

Тестирование:

Сертификат об окончании: Да

Язык: Русский

Описание и программа курса

Каждый, кто начинает свой путь в Data Science, стремится когда-нибудь дорасти до уровня Senior. Но требования к специалистам такого уровня, особенно в крупных компаниях, очень высоки. Большинство соискателей не могут пройти собеседование.

Чтобы уверенно решать не типовые задачи и создавать собственные архитектуры, мало владеть основными методами машинного обучения и нейронных сетей: важно понимать законы математики и статистики у них "под капотом".

Мы объединили 2 важных курса: вы сможете изучить сначала математику, а затем научитесь строить модели машинного обучения, или проходить два курса параллельно и освоить новую профессию всего за 3 месяца.

Программа курса по математике

Часть 1: Линейная алгебра

  • Изучаем вектора и виды матриц
  • Учимся проводить операции над матрицами
  • Определяем линейную зависимость с помощью матриц
  • Изучаем обратные, вырожденные и невырожденные матрицы
  • Изучаем системы линейных уравнений, собственные и комплексные числа
  • Осваиваем матричное и сингулярное разложение
  • Решаем задачи линейной зависимости с помощью матриц
  • Оптимизируем с помощью метода главных компонент
  • Закрепляем математические основы линейной регрессии

Часть 2: Основы матанализа

  • Изучаем функции одной и многих переменных и производные
  • Осваиваем понятие градиента и градиентного спуска
  • Тренируемся в задачах оптимизации
  • Изучаем метод множителей Лагранжа, метод Ньютона и имитацию отжига
  • Решаем задачи предсказания и поиска выигрышной стратегии с помощью производных и численных методов оптимизации
  • Закрепляем математические основы градиентного спуска и имитации отжига

Часть 3: Основы теории вероятности и статистики

  • Изучаем общие понятия описательной и математической статистики
  • Осваиваем комбинаторику
  • Изучаем основные типы распределений и корреляции
  • Разбираемся в теореме Байеса
  • Изучаем наивный байесовский классификатор
  • Решаем задачи комбинаторики, валидности и прогнозирования методами статистики и теорвера
  • Закрепляем математические основы классификации и логистической регрессии

Часть 4: Временные ряды и прочие математические методы

  • Знакомимся с анализом временных рядов
  • Осваиваем более сложные типы регрессий
  • Прогнозируем бюджет с помощью временных рядов
  • Закрепляем математические основы классических моделей машинного обучения

Краткая программа курса по Machine Learning

Модуль 1: Введение в машинное обучение
Знакомимся с основными задачами и методами machine learning , изучаем практические кейсы и применяем базовый алгоритм работы над ml-проектом
Решаем 50+ задач на закрепление темы

Модуль 2: Методы предобработки данных
Изучаем типы данных, учимся очищать и обогащать данные, используем визуализацию для предобработки и осваиваем feature engineering
Решаем 60+ задач на закрепление темы

Модуль 3: Регрессия
Осваиваем линейную и логистическую регрессию, изучаем границы применимости, аналитический вывод и регуляризацию. Обучаем модели регрессии
Решаем 40+ задач на закрепление темы

Модуль 4: Кластеризация
Осваиваем обучение без учителя, практикуемся в его различных методах, работаем с текстами средствами ML
Решаем 50+ задач на закрепление темы

Модуль 5: Tree-based алгоритмы: введение в деревья
Знакомимся с решающими деревьями и их свойствами, осваиваем деревья из библиотеки sklearn и используем деревья для решения задачи регрессии
Решаем 40+ задач на закрепление темы

Модуль 6: Tree-based алгоритмы: ансамбли
Изучаем особенности ансамблей деревьев, практикуемся в бустинге, используем ансамбль для построения логистической регрессии
Решаем 40+ задач на закрепление темы
Участвуем в соревновании на kaggle по обучению tree-based модели

Модуль 7: Оценка качества алгоритмов
Изучаем принципы разбиения выборки, недо- и переобучение, оцениваем модели по различным метрикам качества, учимся визуализировать процесс обучения
Оцениваем качество нескольких моделей ML
Решаем 40+ задач на закрепление темы

Модуль 8: Временные ряды в машинном обучении
Знакомимся с анализом временных рядов в ML, осваиваем линейные модели и XGBoost, изучаем принципы кросс-валидации и подбора параметров
Решаем 50+ задач на закрепление темы

Модуль 9: Рекомендательные системы
Изучаем методы построения рекомендательных систем, осваиваем SVD-алгоритм, оцениваем качество рекомендаций обученной модели
Решаем 50+ задач на закрепление темы

Модуль 10: Финальный хакатон
Применяем все изученные методы для получения максимальной точности предсказаний модели на kaggle

Фотографии