Основы машинного обучения

Освой прикладные навыки в решении задач машинного обучения и начни карьеру в IT-индустрии.   
13 занятий, 52 ак.часа
Хочу учиться
Что дает курс

Ты научишься извлекать полезную информацию из данных, выбирать оптимальные алгоритмы и пайплайны с использованием Python, обрабатывать изображения с помощью искусственных нейронных сетей и применять алгоритмы машинного обучения к практическим задачам. У студентов, которые успешно пройдут курс, будет шанс попасть на стажировку в МегаФон с последующим трудоустройством.

Какие знания нужны

Понимание основ линейной алгебры: базовых операций, свойств векторов и матриц, таких как скалярное произведение, норма вектора и обусловленность матрицы. Навыки применения математического анализа (производных и интегралов), теорий вероятности (в том числе условной и функций распределения) и математической статистики. Наличие опыта программирования на языке Python (применение стандартных типов данных, модулей Collections, Itertools и других) и владение общей компьютерной грамотностью. Будет преимуществом знание работы Git (Clone, Pull, Fetch, Push, Rebase).

Как проходят занятия


Онлайн-интенсивы проходят в вечернее время. В конце каждой лекции студенты получают домашнее задание на закрепление пройденных тем. 

Как поступить?

Регистрация
Заполни заявку и регистрируйся на курс до 25-го февраля включительно
Тестирование
Ссылка на тест придет на почту до 18:00 26-го февраля. Пройди тест до 18:00 28-го февраля
Зачисление
Письмо о зачислении придет на почту каждому студенту 3-го марта включительно
Начало обучения
Обучение начнется на неделе с 4-го марта по расписанию

Вопросы по обучению

Отборочный тест

Проверка знаний по высшей математике и Python.

Требования к поступающим

Поступить на программу могут студенты НИЯУ МИФИ со второго курса и выше, независимо от профиля обучения.

Оборудование для обучения

Компьютер с системой Windows, возможность подключиться к беспроводной сети для выхода в сеть Internet.

Нагрузка в неделю

4 ак. часа в неделю без учета времени на выполнение домашнего задания.

Место проведения

Онлайн.

Стоимость обучения

Обучение бесплатно.

Моего вопроса тут нет :(

Другие вопросы можно посмотреть здесь.

Программа

Смешанное занятие № 1. Введение в анализ данных и машинное обучение

1) Постановка задачи машинного обучения
2) Классификация задач и их примеры
3) Библиотеки python для анализа данных (matplotlib, pandas, numpy)

Смешанное занятие № 2. Задачи классификации и регрессии

1) Наивный Байесовский классификатор
2) Линейная регрессия
3) Метод ближайших соседей
4) Решающее дерево
5) Логистическая регрессия

Смешанное занятие № 3. Оценка качества моделей и работа с признаками


1) Оценка качества моделей
2) Работа с категориальными данными
3) Работа с пропущенными данными
 

Смешанное занятие № 4. Обучение без учителя

 
1) Алгоритмы кластеризации
2) Kmeans, иерархическая кластеризация, спектральная кластеризация
3) Оценка качества кластеризации
4) Поиск ассоциативных правил
5) Понижение размерности
 

Смешанное занятие № 5. Ансамбли моделей

 
1) Выбор оптимальных параметров модели
2) Ансамбли моделей
3) Бустинг, бегинг, стекинг
4) Случайный лес
5) Градиентный бустинг
 

Смешанное занятие № 6. Работа с текстовыми данными

 
1) Специфика текстовых данных, методы предобработки
2) Извлечение признаков, Supervised ML
3) Word2Vec, Topic Modeling
 

Смешанное занятие № 7. Рекомендательные системы

 
1) Метрики для оценки работы рекомендательных систем. 
2) Виды рекомендательных систем: item2item, совстречаемости, 
неперсонализированные, персонализированные, коллоборативная фильтрация, матричная факторизация.
 

Смешанное занятие № 8. Работа с гео-данными

 
1) Особенности гео-данных
2) Проекции
3) Geo Pandas
4) Spatial joins
5) OSM
6) OSMnx
7) QGiS
 

Смешанное занятие № 9. Анализ графов

 
1) Графы
2) Форматы представления сетевых данных
3) Меры центральности элементов сети
4) Выявление сообществ
 

Смешанное занятие № 10. AB тесты, проведение экспериментов

 
1) Treatment and control groups. Проведение эксперимента. 
Рандомизация, стратификация, кластеризация выборки.
2) Difference in difference, Regression discontinuity, Propensity Score
3) Запуск AB-тестов
 

Смешанное занятие № 11. Базы данных, фреймворки для работы с большими данными

 
1) Реляционные базы данных. 
2) SQL. Аналитический SQL. PL/SQL
3) Big Data
4) Hadoop
 

Смешанное занятие № 12. Инфраструктура и основы Hadoop

 
1) Парадигма MapReduce
2) Компоненты Hadoop
3) Hive
4) PySpark
 

Экзамен № 1. Экзамен

Экзамен