Курсы

RapidMiner: RapidMiner Basics Pt.1

Код курса: RM-1

Продолжительность обучения (кол-во дней): 2 дня

Стоимость обучения за одного человека: 54 750 руб.

Даты курса Заявка
16-17.10.2017 Заказать
Аудитория:

Целевая аудитория: аналитики, разработчики, администраторы.

Необходимый предварительный уровень: базовые знания компьютерных программ и математики.

Методы: лекции, обсуждения, индивидуальная и групповая работа, упражнения на реалистичных данных.

 

Важно! Обучение проходит на примере использования платформы RapidMiner, но так как у аналогичных программных продуктов схожий функционал и подходы к созданию решений, курс даст полезную информацию и тем пользователям, кто не имеет и не планирует внедрение ПО RapidMiner.

 

Обучение будет интересно представителям разных отраслей, например:

 

1. Автомобилестроение, Промышленность, Металлургия, Строительные компании, Фармацевтика, Нефтегазовый сектор, Энергетика  - слушатели научатся создавать решения для прогнозирования спроса и объемов производства, утилизации производственного оборудования, анализа производственных процессов и многих других аналитических задач.

 

2. Медиа и СМИ, Телекоммуникации и связь - слушатели научатся создавать решения для сегментирования и оценки поведения клиентов, прогнозирования оттока клиентов, расчета и прогнозирования различных метрик (ARPU, DAU и т.п.) в разрезе категорий клиентов, моделирования Customer Lifetime Value и многих других задач.

 

3. Банки, Финансовые компании, Страховые компании, Бизнес-услуги – слушатели научатся создавать решения для сегментирования и оценки поведения клиентов, кредитного скоринга и обнаружения мошенничества, прогнозирования оттока, а также рекомендательных систем.

 

4. Оптовая торговля, Розничная торговля, Транспортные компании, Фармадистрибьюторы - создавать решения для прогнозирования спроса потребления и закупок, сегментирования и моделирования поведения клиентов, моделирования маркетинговых и промо мероприятий, прогнозирования оттока клиентов и многих других задач.

Программа курса:

Этот двухдневный курс познакомит слушателей с основами интеллектуального анализа данных, предиктивного анализа и ПО RapidMiner. В качестве бизнес-канвы мы разработаем специальный бизнес-сценарий и на его основе будем вести весь курс. Занятия построены по модели "учись и делай", что позволяет слушателям фокусироваться на новом материале по мере его объяснения, а затем самостоятельно применять понимание этого материала при выполнении лабораторных упражнений.

 

После успешного окончания этого обучения слушатели поймут, как работают и используются продукты RapidMiner Studio и RapidMiner Server. Они смогут создавать предиктивные модели в стандартных средах обработки данных, в которых работает большинство аналитиков.

 

Практические упражнения подготовят слушателей к передаче полученных знаний и их применению к их собственным задачам интеллектуального анализа данных для ускорения и упрощения их решения.

 

По завершении данного курса участники научатся:

  • выполнять базовую подготовку данных
  • строить начальные предиктивные модели
  • оценивать качество построенных моделей
  • применять модели на новых наборах данных

 

 

Слушатели могут задавать вопросы по своим собственным работам и проектам, чтобы находить конкретные решения вместе с инструктором и другими слушателями. Курс обучения адресован как начинающим, так и тем, у кого уже есть некоторый опыт.

 

Темы

 

Обзор

  • Бизнес-сценарий
  • Аналитика
  • Интеллектуальный анализ данных в современном бизнесе
  • CRISP-DM

 

Основы использования

  • Пользовательский интерфейс
  • Создание репозиториев RapidMiner и работа с ними
  • Создание нового проекта в RapidMiner
  • Операторы и процессы
  • Загрузка данных
  • Хранение данных, процессов и результатов

 

EDA: разведочный анализ данных

  • Типы данных
  • Иерархия данных
  • Быстрые сводные статистики
  • Визуализация данных
  • Построение диаграмм

 

Подготовка данных

  • Нормализация данных
  • Базовые преобразования типов значений
  • Работа при отсутствии нужных значений
  • Сэмплинг
  • Фильтрация записей и атрибутов
  • Работа с ролями атрибутов

 

Совершенствование процессов

  • Организация
  • Переименование
  • Относительный путь
  • Управление потоками
  • Подпроцессы
  • Строительные блоки
  • Контрольные точки

 

Предиктивные модели

  • Корреляции
  • Методы k-ближайших соседей
  • Наивный Байесовский классификатор
  • Линейная регрессия
  • Правила
  • Деревья решений
  • Важность атрибутов

 

Оценка модели

  • Применение моделей
  • Переобучение
  • Расщепление данных
  • Методы оценки
  • Критерии оценки качества моделей

 

Совместное использование

  • Экспорт изображений
  • RapidMiner Server

 

 

 

Обучение проводит тренер, сертифицированный компанией RapidMiner.

Курс читается на русском языке.