Python для анализа данных
Основы программирования
на Python
Часть 1
ОНЛАЙН
Продолжительность
5 месяцев
(134 академических часа)
Для специалистов
Нужны во всех сферах бизнеса: от маркетинга и продаж до разработки продуктов, от финансов до управленческих решений. Только за последнюю неделю на HH.ru открылось более 1500 вакансий аналитика, при этом инструменты нужны и для многих других позиций.
И многие другие компании ищут специалистов по аналитике. Ритейл, киберспорт, путешествия, образование, медицина — грамотный анализ данных нужен вне зависимости от индустрии.
Вы уже работаете с данными, SQL, хотите расширить набор приемов, сократить время на подготовку отчетов с помощью автоматизации на Python и овладеть новыми подходами к анализу, например, решать задачи с помощью обучения нейронных сетей.
Вы сможете быстрее принимать решения, основанные на актуальной информации и не вовлекать ваших сотрудников. Вы будете готовы к диалогу с экспертами и легко сможете поставить задачи по автоматизации сбора и анализа данных.
- Установка Jupyter Notebook и Anaconda
- Базовый синтаксис Python
- Переменные, циклы, условия
- Списки, срезы, словари
- Строковые величины и регулярные выражения
- Функции: текстовые и lambda-функции
- Работа с датами в Python
- Введение в Pandas: работа с Series и DataFrame, извлечение данных
- Методы группировки данных и сводные таблицы
- Объединение таблиц и датафреймов
- Очистка данных и feature engineering
- Введение в NumPy: работа с массивами и статистическими функциями
- Визуализация данных в Pandas, Matploplib, Seaborn и Plotly
- Какие задачи Data Science решаются средствами линейной алгебры?
- Метод наименьших квадратов
- Классическая линейная регрессия и решение задачи предсказания
- Градиент и градиентный спуск
- Задача классификации в Data Science
- Описательная и математическая статистика
- Нелинейные паттерны и график остатков
- Автокорреляция и частичная автокорреляция
- Типы алгоритмов, задачи и области применения ML
- Этапы решения задач машинного обучения
- Предобработка данных: типы данных, проблемы в данных, очистка и нормализация
- Визуализация для предобработки: гистограмма и корреляции
- Feature engineering: создание признаков, dummy-переменные, статистики
- Поиск выбросов: по отклонению и распределению, методом DBSCAN
Для корпоративных клиентов возможность реализовать групповой проект на решение конкретной задачи. Укажите в заявке и мы все обсудим.
SKILLFACTORY
"Анализ больших данных!
Скидка 20%
40 000
стоимость обучения- Участники рейтинга РБК: 35 крупнейших EdTech-компаний России
- Крупнейший провайдер онлайн-образования в сегменте Data Science
- Выпускники работают в Ростелеком, Яндекс, Mail.Ru, Сбербанк, Альфа-Банк
Ссылка на страницу курса Анализ больших данных