Курсы

RapidMiner: RapidMiner Basics Pt.2

Код курса: RM-2

Продолжительность обучения (кол-во дней): 2 дня

Стоимость обучения за одного человека: 54 750 руб.

Даты курса Заявка
11-12.04.2018 Заказать
Аудитория:

Целевая аудитория: аналитики, разработчики, администраторы.

Необходимый предварительный уровень: введение в интеллектуальный анализ данных и предиктивную аналитику или аналогичные знания.

Методы: лекции, обсуждения, индивидуальная и групповая работа, упражнения на реалистичных данных.

 

 

Важно! Обучение проходит на примере использования платформы RapidMiner, но так как у аналогичных программных продуктов схожий функционал и подходы к созданию решений, курс даст полезную информацию и тем пользователям, кто не имеет и не планирует внедрение ПО RapidMiner.

 

Обучение будет интересно представителям разных отраслей, например:

 

1. Автомобилестроение, Промышленность, Металлургия, Строительные компании, Фармацевтика, Нефтегазовый сектор, Энергетика  - слушатели научатся создавать решения для прогнозирования спроса и объемов производства, утилизации производственного оборудования, анализа производственных процессов и многих других аналитических задач.

 

2. Медиа и СМИ, Телекоммуникации и связь - слушатели научатся создавать решения для сегментирования и оценки поведения клиентов, прогнозирования оттока клиентов, расчета и прогнозирования различных метрик (ARPU, DAU и т.п.) в разрезе категорий клиентов, моделирования Customer Lifetime Value и многих других задач.

 

3. Банки, Финансовые компании, Страховые компании, Бизнес-услуги – слушатели научатся создавать решения для сегментирования и оценки поведения клиентов, кредитного скоринга и обнаружения мошенничества, прогнозирования оттока, а также рекомендательных систем.

 

4. Оптовая торговля, Розничная торговля, Транспортные компании, Фармадистрибьюторы - создавать решения для прогнозирования спроса потребления и закупок, сегментирования и моделирования поведения клиентов, моделирования маркетинговых и промо мероприятий, прогнозирования оттока клиентов и многих других задач.

Программа курса:

Во втором двухдневном курсе изучаются дополнительные возможности интеллектуального анализа данных и предиктивного анализа с помощью RapidMiner Studio и RapidMiner Server. Вводный курс проводился на упрощенном бизнес-примере, а в этом Промежуточном курсе мы изучим аналогичный бизнес-кейс, но не "стерильный", а со спецификой реального мира.

 

Необходимым предварительным условием является знание материала, изложенного в курсе "Основы RapidMiner, часть 1". Поэтому обучение в нем проводится в классе не по модели "учитель-ученик", а по модели "наставник-обучаемый", при этом все слушатели действуют как единая группа обработки и анализа данных.

 

После успешного завершения этого курса слушатели получат углубленное понимание того, как работает и используется ПО RapidMiner. Они смогут готовить данные и создавать предиктивные модели в стандартных средах обработки данных, в которых работает большинство аналитиков, а также в других не самых распространенных средах обработки данных.

 

Практические упражнения в ходе обучения подготовят участников к тому, чтобы передавать полученные знания и применять их к их собственным задачам интеллектуального анализа данных, решая их быстрее и легче.

 

По завершении курса участники смогут:

  • выполнять самые необходимые и общие процедуры подготовки данных
  • строить сложные предиктивные модели
  • оценивать качество модели по разным критериям
  • развертывать модели интеллектуального анализа данных

 

Слушатели могут задавать вопросы по своим собственным работам и проектам, чтобы находить конкретные решения вместе с инструктором и другими слушателями. Курс обучения адресован как начинающим, так и тем, у кого уже есть некоторый опыт.

 

Темы

 

Обзор

  • Изменения бизнес-кейсов
  • Краткое повторение вводного курса
  • Загрузка новых данных

 

Разведочный анализ данных

  • Множественные источники
  • Понятие о новых атрибутах
  • Отношения между схемами данных

 

Подготовка данных

  • Соединение различных источников данных
  • Агрегирование
  • Многоуровневое агрегирование
  • Pivot-преобразования
  • Теория множеств
  • Расчетные значения
  • Регулярные выражения
  • Изменения типов значений
  • Балансировка данных
  • Обнаружение выбросов и аномальных значений
  • Отбор характерных признаков
  • Понижение размерности данных

 

Предиктивные модели

  • Машины опорных векторов (SVM)
  • Случайный лес решающих деревьев
  • Кластеризация методом k-средних
  • Нейронные сети
  • Логистическая регрессия
  • Мета-обучение

 

Оценка модели

  • Критерии оценки моделей 
  • ROC-кривые
  • Сравнение моделей
  • Lift-диаграмма
  • Тесты на статистическую значимость
  • Проверка правильности предварительной обработки и модели предварительной обработки
  • Журналирование результатов

 

Развертывание

  • Совместное использование данных, моделей и процессов
  • Экспорт процессов в виде веб-сервисов
  • Основы создания отчетов
  • Управление процессами и сервисами

 

 

Обучение проводит тренер, сертифицированный компанией RapidMiner.

Курс читается на русском языке.