Аналитик данных
Самая востребованная профессия ближайших лет — аналитик данных.
Спрос на специалистов в сфере сбора, обработки и анализа данных растёт с каждым годом. Тем не менее пока лишь 1% данных, хранящихся на предприятиях, используется по назначению. Понимаете, какой потенциал у этой профессии? Исследования показали, что 77% компаний, имеющих в штате аналитика данных, значительно улучшили свои финансовые показатели и обошли конкурентов. Почему? Потому, что когда знаешь, кому, что, когда и по какой цене продавать, стабильные денежные потоки фирме обеспечены.
Аналитики данных — человек, который при помощи структурного подхода к отбору и управлению данными, может многократно повысить эффективность любых бизнес-процессов.
Целевая группа:Руководители предприятий, менеджеры, специалисты по продажам, все лица, заинтересованные в эффективном использовании хранящихся в фирме данных для повышения производительности предприятия. А также лица, заинтересованные в получении новой профессии.
Для кого:
- Для менеджеров и руководителей отделов продаж.
- Для владельцев бизнеса, которые непосредственно отвечают за продажи.
- Для директоров по развитию продукции и предприятия.
- Для специалистов различных сфер, которым важно понимать кто их целевой клиент, находить этих клиентов, максимально использовать информацию об этих клиентах на пользу бизнеса.
Цель обучения: научить участников при помощи структурного подхода собирать, обрабатывать и анализировать данные именно для своей сферы бизнеса. Пояснить, по каким критериям анализировать данные, чтобы этот анализ приносил реальную пользу предприятию.
Программа:
- Mодуль. Введение в специальность аналитик данных. Основы анализа данных.
Любовь Самма Data Architect в Luminor Group.
15 лет опыта работы с данными, дата-инженер.- Чем занимается аналитик данных?
- Основные навыки, которыми должен обладать аналитик данных.
- Различные направления в data-индустрии: (Data Analyst, Data Scientist, Business Intelligence, администратор и инженер Big Data, DevOps-инженер, DataOps, Chief Data
- Officer, специалист по безопасности и др).
- Что такое датасеты?
- Анализ состояния предприятия на предмет необходимости иметь в штате аналитика данных.
- Какие источники данных больше всего подходят для вашего бизнеса?
- Инструменты и техники пассивного сбора информации.
- Mодуль. Фундаментальные основы для анализа данных. Источники данных и работа с ними.
Вячеслав Антипенко Глава IoT в Telia Eesti AS.- Что такое наука о данных(data science)?
- Что входит в процесс анализа данных?
- Данные и их применение в бизнесе;
- Категории бизнес-аналитики;
- Различные применения анализа данных;
- С чего начать внедрение анализа данных в компании?
- Практические примеры сбора, анализа данных и эффективных результатов;
- Mодуль. Excel – основной инструмент для анализа данных.
Екатерина Трунин Присяжный аудитор, член Палаты аудиторов, специалист по корпоративным финансам и хозяйственному учёту- Сводные таблицы – базовый инструмент для работы с большим количеством неструктурированных данных.
- Использование полей и элементов в сводной таблице, в том числе создание новых полей и элементов.
- Группировка полей.
- Систематизация и настройка данных в таблице Excel.
- 4 техники анализа данных в Excel.
- Анализ данных через сводные таблицы Excel.
- Автоматизация анализа данных в Excel.
- Дисперсионный анализ.
- Корреляционный анализ.
- Ковариация.
- Вычисление скользящего среднего. Очень популярный метод в статистике и в трейдинге.
- Случайные числа.
- Операции с выборкой.
- Быстрый анализ баз данных в Excel.
- Лист прогнозов.
- Mодуль. Создание клиентской базы с нуля, исходя из запросов конкретного бизнеса
Любовь Самма Data Architect в Luminor Group.
15 лет опыта работы с данными, дата-инженер.- Как собирать и структурировать элементарные базы данных с нуля?
- Список сайтов, на которых можно собирать данные по запросу.
- Поиск и хранение данных.
- Перевод базы из СSV в Excel.
- Парсинг (web scraping) — это автоматизированный сбор открытой информации в интернете по заданным условиям.
- Примеры парсеров-программ.
- От Excel к CRM. Что такое CRM-система и какие задачи бизнеса решает?
- Mодуль. Python для анализа данных.
Анна Альянаки Tartu Ülikool, Институт компьютерных наук, преподаватель информатики.- В какой степени необходимо владеть Python data-специалисту?
- Устанавливаем Python.
- Рабочая среда аналитика: jupyter и colab.
- Язык разметки Markdown.
- Основной синтаксис языка Python. Синтаксис при сборе данных.
- Методы работы со списками и словарями.
- Методы работы с разными типами данных.
- Работа с файлами.
- Работа со строковыми величинам.
- Работа со временем и датами.
- Распознаем даты в Python.
- Учимся складывать и вычитать даты.
- Объединение данных из разных источников.
- Mодуль. Pandas – библиотека на языке Python для обработки и анализа данных.
Анна Альянаки Tartu Ülikool, Институт компьютерных наук, преподаватель информатики.- Библиотека Pandas: как с ней работать?
- Учимся группировать данные по колонкам средствами Pandas.
- Распределяем датасет поисковых запросов по количеству слов.
- Знакомимся с Pivot и сложной агрегацией средствами Pandas.
- Учимся работать со сводными таблицами.
- Объект DataFrame для манипулирования индексированными массивами двумерных данных.
- Инструменты для обмена данными между структурами в памяти и файлами различных форматов.
- Встроенные средства совмещения данных и способы обработки отсутствующей информации.
- Переформатирование наборов данных, в том числе создание сводных таблиц.
- Срез данных по значениям индекса, расширенные возможности индексирования, выборка из больших наборов данных
- Вставка и удаление столбцов данных.
- Возможности группировки позволяют выполнять трёхэтапные операции типа «разделение, изменение, объединение» (англ. split-apply-combine).
- Слияние и объединение наборов данных.
- Иерархическое индексирование позволяет работать с данными высокой размерности в структурах меньшей размерности.
- Работа с временными рядами: формирование временных периодов и изменение интервалов и т.д.
- Mодуль. Лайфкодинг: анализ реальных данных (EDA – exploratory data analysis).
Глеб Михайлов Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных на Яндекс.Практикум и udemy.com. Создатель системы обучения Python и SQL для начинающих.
Специалист по анализу данных. Имеет опыт работы в сфере сбора, обработки и анализа данных с 2011 года. Глеб работал аналитиком и дата саентистом в Альфабанке, Сбербанке, Ростелекоме. Более 2 лет работает наставником и преподавателем в Яндекс.Практикуме. Автор и ведущий обучений по анализу данных и дата саенс. Глеб пришёл в профессию самоучкой и прекрасно знает, каково это самостоятельно осваивать новую профессию. Ведёт канал по дата-аналитике на youtube и лекции на udemy. Максимально просто, без заумствований делится своими практическими наработками и лайфхаками.- Загрузка данных на Google Drive.
- Чтение данных в Google Colab.
- Подготовка данных к анализу: переименование столбцов, замена форматов данных, проверка на дубликаты, анализ пропущенных значений.
- Первичный анализ: распределение, поиск выбросов.
- Анализ с помощью сводных таблиц.
- Анализ непрерывных переменных с помощью разбиения на диапазоны.
- Анализ с помощью графиков и диаграмм: line plot, bar plot, histogram, scatter plot.
- Принципы проверки своих вычислений и преобразований.
- Принципы написания аналитических выводов.
- Принципы профессионального оформления Jupyter Notebook.
- Практическая часть.
- Mодуль. SQL – незаменимый инструмент при сборе и анализе данных.
Глеб Михайлов Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных на Яндекс.Практикум и udemy.com. Создатель системы обучения Python и SQL для начинающих.- SQL как основной инструмент для создания, модификации и управления данными.
- Какие бывают базы данных?
- Как подключиться к базе данных: SQL + python + jupyter?
- Как при помощи SQL:
- создать в базе данных новую таблицу;
- добавить в таблицу новые записи;
- изменить записи;
- удалить записи;
- сделать выборку записей из одной или нескольких таблиц (в соответствии с заданным условием);
- Можно ли научиться писать простые SQL-запросы без образования программиста?
- Как при помощи SQL-запроса получать данные из баз данных?
- Аналитические функции SQL.
- Оконные функции SQL.
- Где тренировать SQL?
- Mодуль. Статистика и вероятность. Как отличить реальный эффект анализа от простой случайности?
Глеб Михайлов Эксперт международного уровня по анализу данных. Автор и ведущий обучений по анализу данных на Яндекс.Практикум и udemy.com. Создатель системы обучения Python и SQL для начинающих.- Закон больших чисел и Центральная предельная теорема: когда работают, а когда нет?
- Метод Монте-Карло: как взломать вероятность?
- АБ тестировние: как отличить случайное от не случайного?
- Использование статистических калькуляторов.
- Z-test, T-test, Chi-Square test.
- Множественная проверка гипотез: как не стать жертвой случайности?
- Mодуль. BI-аналитика, построение интерактивных отчетов.
Ирина Николаева Дата-инженер в Microsoft Development Center Estonia, отдел Media Call Quality Dashboard.- Введение в BI аналитику.
- Что такое BI системы?
- Обзор продуктов Qlik, Tableau, Power BI.
- Что такое дашборд, их виды и предназначение.
- Story telling (презентация данных).
- Основные элементы интерфейса и типы визуализаций.
- Работа в Power BI:
- Получение и моделирование данных в Power BI. Import и Direct Query.
- Создание модели данных. Таблица фактов и таблицы мер (dimensions).
- Создание отчета
- Основы языка DAX. Создание calculated measures.
- Управление закладками и фильтрами.
- Публикация отчета.
- Основные методы защиты данных и разграничения доступа.
- Mодуль. Автоматизация информации и программы по управлению данными.
Любовь Самма Data Architect в Luminor Group.
15 лет опыта работы с данными, дата-инженер.
- От процесса к технологии. Из чего состоит автоматизация информации? Понимание автоматизации данных.
- Формирование Data Driven в компании и жизненный цикл данных.
- Программы по управлению данными. Разработка решений платформы данных.
- Выбор внешней или разработка собственной платформы для работы с данными.
- Когда нужны облака?
- Коммерческие и открытые платформы управления данными.
- Интеграция. Извлечение данных из различных источников для создания единой среды аналитики.
- Процессы предобработки и автоматизации данных (ETL/ELT, data pre-processing).
- Как реализовать озеро данных (Data Lake) и не утонуть в болоте?
- Использование интерфейса API.
- Mодуль. Что нужно знать аналитикам и data-специалистам о защите личных данных?
Кристина Визнович Адвокат адвокатского бюро Pallo&Partnerid, специалист по защите данных. Тартуский университет право информационных технологий.- Обеспечение конфиденциальности и защиты при сборе и хранении личных данных.
- Какие данные можно собирать и для чего?
- Когда обработка персональных данных является незаконной?
- Сбор, обработка и хранение персональных данных в маркетинговых целях.
- Какие данные нельзя обрабатывать?
- Права лиц, персональные данные которых подвергаются обработке.
- Что такое нарушение личных данных?
- Как должна происходить защита данных?
- Что делать, если права всё же нарушены?
- Кто следит за исполнением регламента? Куда обращаться в случае выявленного нарушения?
- Наказание за нарушение использования личных данных.
- Дигитальное архивирование данных клиентов и партнёров.
Прошедший обучение научится:
- Разбираться в индустрии данных и понимать, кто и чем занимается в этой сфере.
- Работать с данными с нуля.
- Работать с разными источниками данных и собирать данные, которые находятся в открытом доступе.
- Анализировать данные и извлекать из них полезную именно для своей компании информацию.
- Находить закономерности и тенденции, которые помогут принимать взвешенные решения в компании.
- Автоматизировать процесс сбора данных и экономить массу времени на более важные процессы.
- Овладеет Python на уровне, достаточном для анализа данных.
- Сможет работать с различными форматами представления, хранения и передачи данных CSV, XML и XLS.
- Создавать, изменять и управлять базами данных при помощи SQL
Организационная информация:
- В группе 15 мест!
- Возможно покупать учебные дни отдельно.
- Возможна оплата по частям и без %. Начни учиться сразу, плати — потом.
- Один учебный день – 4 академических часа.
- Обучение 1 раз в неделю, в режиме онлайн.
- Доступ к записям всех учебных дней в течение 14 дней.
- Всего 50 академических часов.
- Спросите КОМПЕНСАЦИЮ затрат на обучение персонала от Кассы по безработице.
- По окончанию обучения — сертификат о прохождении программы.
Эстонский центр обучения — партнёр Кассы по безработице. Спросите у своего консультанта, как компенсировать затраты на обучение.
Koolitusfirma tutvustus
Eesti Koolitus- ja Konverentsikeskus korraldab konverentse ja koolitusi, mille sisu loomisel keskendutakse ennekõike kliendi ootustele ning rahulolule. Loome aastas ligikaudu poolsada originaalset koolitust ning kümmekond visiooni- ja erialakonverentsi. Loen koolitusfirma kohta veel...