Курс поможет освоить навыки обработки, исследования и визуализации данных с помощью Python и применять математическую статистику для проведения углубленного анализа данных. Студенты научатся работать с источниками, тестировать продуктовые решения и проверять гипотезы, чтобы успешно применять знания в бизнес-процессах.
Базовый уровень владения Python или любого другого языка программирования: переменные, операции, условные операторы, циклы, функции, ввод-вывод. Базовый уровень владения SQL: понимание, что такое базы данных и умение писать простые запросы. Базовые знания статистики: математическое ожидание, дисперсия, выборка, распределение, статистический критерий и P-value.
Онлайн-интенсивы проходят в вечернее время. В конце каждой лекции студенты получают домашнее задание. Участники индивидуально работают над проектом и защищают его в конце курса.
Тест на базовые знания Python и SQL.
Студенты и аспиранты всех курсов и факультетов МИФИ, независимо от профиля обучения.
Наличие компьютера с выходом в Интернет.
4 ак. часа в неделю без учета времени на выполнение домашнего задания.
Онлайн.
Обучение бесплатно.
Другие вопросы можно посмотреть здесь.
-Теоретические основы работы с базами данных;
-SQL:Базовые операции, функции агрегации, работа с несколькими таблицами, вложенные запросы
- Аналитические запросы MySQL
- функции для построения аналитических запросов
Практика:
использование аналитических функций для расчёта продуктовых метрик
- Знакомство с колоночными базами данных на примере ClickHouse. OLAP
- Тренируемся написании запросов, знакомимся с особенностями синтаксиса и существующими функциями.
Теория:
Установка Python и библиотек. Основные типы данных. Функции.
Работа с данными на языке программирования Python:
получение данных из различных источников,
обработка сырых данных (дубликаты, пропуски, типы данных)
Практика: подключение К БД, работа с файлами, агрегация данных для последующего анализа.
Работа с данными на яп Python (часть 2): визуализация данных. Знакомство с Tableu
Работа над проектом: Проведение исследовательского анализа данных (получение данных, обработка, визуализация)
Математическая статистика: основные статистические показатели и их применение в анализе данных
Работа над проектом: Проведение анализа данных с применением знаний основ описательной статистики и основных статистических показателей
Определение статистической гипотезы, ошибок первого и второго рода, уровня значимости и т.д.
Разбор и написание кода статистических критериев (from scratch и с использованием популярных библиотек для проверки гипотез на python).
Множественное сравнение
Практика: реализация критерия Стьюдента с поправками Бонферрони и Холма-Бонферрони, критерия Крускала - Уоллиса
-
Защита финального проекта