В задачах Анализа данных с помощью методов статистического анализа обрабатываются большие массивы структурированных или неструктурированных данных; устанавливаются закономерности и выполняются прогнозы для повышения эффективности бизнес-решений, социальных взаимодействий, научных исследований.
Обучение по специализации Python для анализа данных позволит освоить методы и средства языка программирования Python для решения задач аналитики данных. Вы сможете познакомиться с современными инструментами, используемыми специалистами Data Analytics и Data Science, а также на практике применить полученные навыки для автоматизации аналитических процессов, создания визуализаций и обработки больших объемов данных, что безусловно поможет Вам открыть новые возможности для карьеры в ИТ.
330 ак.часов (5-6 месяцев)
165 000 руб. (в рассрочку) для физ.лиц
190 000 руб. для юр.лиц и иностранных лиц
Дистанционная форма обучения
19 мая 2025 года
Документ об окончании: диплом о профессиональной переподготовке с присвоением квалификации «Специалист по большим данным», удостоверяющей право на ведение деятельности в сфере «Создание и применение технологий больших данных»
1. Основы программирования и алгоритмизации - 50 ак. часов
Модуль 1. Этапы решения задач по обработке и анализу данных;
Модуль 2. Типизация и структуры данных;
Модуль 3. Основы алгоритмизации;
Модуль 4. Встроенные типы данных и операции с ними. Ввод и вывод данных;
Модуль 5. Реализация управляющих конструкций в программах;
Модуль 6. Основные концепции и методы анализа данных;
Модуль 7. Получение данных и работа с ними;
Модуль 8. Принятие решений на основе данных
2. Проектирование и разработка баз данных - 40 ак. часов
Модуль 1. Проектирование баз данных;
Модуль 2. Система управления базами данных PostgreSQL;
Модуль 3. Основные операторы SQL и синтаксис PL/pgSQL;
Модуль 4. Создание и настройка баз данных;
Модуль 5. Создание и настройка индексов, обработка данных;
Модуль 6. Соединения, представления;
Модуль 7. Разработка функций, хранимых процедур и триггеров;
Модуль 8. Обзор и основные подходы в работе с NoSQL базами данных
3. Программирование на Python (базовые возможности) - 40 ак. часов
Модуль 1. Обзор возможностей языка Python при реализации процедурной парадигмы программирования;
Модуль 2. Реализация функций, особенности передачи параметров;
Модуль 3. Модули и пакеты;
Модуль 4. Генераторы. Множества;
Модуль 5. Работа с файловой системой;
Модуль 6. Работа с данными;
Модуль 7. Исключения и обработка ошибок;
Модуль 8. Элементы функционального программирования
4. Основы статистики (теории вероятности) - 20 ак. часов
Модуль 1. Базовые понятия статистики;
Модуль 2. Законы распределения случайных величин;
Модуль 3. Основы математической статистики;
Модуль 4. Основы исследовательского анализа
5. Аналитика - 20 ак. часов
Модуль 1. Основы аналитики данных;
Модуль 2. Основы инференциальной статистики;
Модуль 3. Статистические эксперименты и проверка значимости;
Модуль 4. Практическая реализация алгоритмов аналитики данных
6. Python для анализа данных - 65 ак. часов
Модуль 1. NumPy – библиотека для математических и научных расчетов;
Модуль 2. Pandas – базовые возможности;
Модуль 3. Чтение и запись данных в pandas;
Модуль 4. Препроцессинг и аккуратные данные в pandas;
Модуль 5. Агрегирование данных и групповые операции в pandas;
Модуль 6. Временные ряды в pandas;
Модуль 7. Визуализация с помощью matplotlib и seaborn;
Модуль 8. Scikit-learn. Библиотека для ML;
Модуль 9. Обучение с учителем на Skikit-learn;
Модуль 10. Обучение без учителя на Skikit-learn;
Модуль 11. Обзор полезных библиотек для аналитики данных и ML
7. Визуализация данных- 40 ак. часов
Модуль 1. Понятие и виды дашбордов;
Модуль 2. Основы Tableau;
Модуль 3. Использование Tableau Public для анализа данных;
Модуль 4. Применение Python в BI-системах
8. Работа над проектом – 55 ак. часов
Программа курса может корректироваться