Курсы

Arenadata: Эксплуатация Arenadata DB

Код курса: ADB

Продолжительность обучения (кол-во дней): 4 дня

Стоимость обучения за одного человека: 150 000 руб.

Даты курса Заявка
По запросу Заказать
Аудитория:
Обучающий курс «Эксплуатация Arenadata DB» предназначен для системных администраторов, архитекторов, разработчиков, аналитиков, использующих Arenadata DB (ADB). Курс даёт необходимые знания для эффективной и безопасной эксплуатации ADB в продуктовых средах, загрузке, обработке и выгрузке данных, настройках безопасности и дополнительных расширениях. Освоение каждой практической темы подкрепляется лабораторной работой.

Курс проводится очно. Длительность курса составляет 4 дня. По окончанию курса проводится экзамен, по результатам сдачи которого выдаётся сертификат  от вендора.

Arenadata DB - аналитическая СУБД построенная на базе open source ядра Greenplum Database
Программа курса:
День 1:
  • Обзор архитектуры ADB - 40 минут
    Концепция MPP и её имплементация в ADB. Терминология и архитектура СУБД. Интерконнект. Выполнение запросов. Отказоустойчивость.
  • Окружение СУБД - 30 минут
    Основные директории СУБД. Логи. Конфигурационные файлы. Файлы данных БД. Переменные окружения. Процессы СУБД.
  • Управление БД - 10 минут
    Запуск, остановка, проверка статуса СУБД. 
    Лабораторная работа – 10 минут
  • Подключение к БД - 10 минут
    Реквизиты. Доступы. psql.
    Лабораторная работа – 10 минут
  • GUC - 10 минут
    Управление параметрами СУБД.
    Лабораторная работа – 10 минут
  • Устройство БД - 20 минут
    Шаблоны БД. Логическая схема данных. Обзор дефолтных схем. Основные объекты для работы с БД.
    Лабораторная работа – 20 минут
  • Отказоустойчивость - 20 минут
    Принципы безотказного функционирования БД. Спилл-файлы. Восстановление сегмента. Восстановление мастера.
    Лабораторная работа – 20 минут
  • Создание таблицы в БД - 60 минут
    Основные правила создания таблиц. Типы данных. Распределение таблицы. Skew. Констрейнты. Тип хранения данных. Компрессия.
    Лабораторная работа – 30 минут

День 2:
  • Выполнение запросов - 20 минут
    Получение плана. Оптимизаторы. Статистика выполнения. Разбор плана запроса. Redistribute и Broadcast. Поиск узких мест.
    Лабораторная работа – 20 минут
  • Партиционирование таблицы - 40 минут
    Создание партиционированных таблиц. Ключ партиционирования. Разные типы хранения. Файлспейсы и тейблспейсы. Мульти-партиционирование. Удаление. Разбиение. Обмен партиций. Внешние таблицы. Загрузка в партиционированные таблицы.
    Лабораторная работа – 30 минут
  • Индексы - 20 минут
    Применимость индексов. Типы. Best practices. Управление индексами. Основные параметры управления индексами в запросе.
    Лабораторная работа – 10 минут
  • MVCC - 20 минут
    Цели. Реализация. Bloat. VACUUM. VACUUM FULL. Пример. Регламенты.
    Лабораторная работа – 20 минут
  • Транзакции - 20 минут
    Обзор. Уровни изоляции. CAP-теорема. 
    Лабораторная работа – 10 минут
  • Статистика - 10 минут
    Цели. Сбор статистики.
    Лабораторная работа – 10 минут
  • COPY - 10 минут
    Синтаксис. Пример.
    Лабораторная работа – 10 минут
  • Ресурсные группы - 30 минут
    Обзор. Ограничиваемые ресурсы. Сценарии использования. GUCs.
    Лабораторная работа – 20 минут

День 3: 
  • Внешние таблицы - 10 минут.
    Обычные внешние таблицы. Web-внешние таблицы.
  • GPFDIST - 30 минут
    Сценарии. Сервер gpfdist. Создание внешних таблиц. Опции LOCATION. Достижение лучшей производительности. Параметры GUC. Примеры.
    Лабораторная работа – 20 минут
  • GPLOAD - 20 минут
    Использование утилиты
    Лабораторная работа – 20 минут
  • PXF - 60 минут
    Архитектура. Директории сервиса. Конфигурационные файлы. Логи. Управление сервисом. HDFS. HBASE. Hive. JDBC. Pushdown. Batching. Pooling. User impersonation.
    Лабораторная работа – 30 минут
  • UDF - 40 минут
    Цели. PL/SQL. PL/python. C-функции. PLContainer. Волатильность функций. Доверенность функций. 
    Лабораторная работа – 30 минут
  • Apache Madlib - 20 минут
    Обзор расширения. Пример использования.
    Лабораторная работа – 10 минут
  • PostGIS - 10 минут
    Обзор расширения. Пример использования.

День 4: 
  • Пользователи и группы - 30 минут
    Роль и пользователь, группы. Доступы. Создание пользователей, управление. Интеграция с LDAP.
    Лабораторная работа – 20 минут
  • Бекапы - 30 минут
    Принципы бекапов. gp_dump/gp_restore. gpbackup/gprestore. Директории и файлы. Сжатие бекапов. Перенос бекапов между разными кластерами. Внешние таблицы.
    Лабораторная работа – 20 минут
  • Мониторинг - 60 минут.
    Архитектура. Diamond. Carbon. Graphite. Grafana. Директории. Собираемые метрики. Best practices по анализу данных мониторинга. Алерты.
    Лабораторная работа – 20 минут
  • gpperfmon - 20 минут
    Архитектура. Каталог. Полезные таблицы. 
    Лабораторная работа – 10 минут
  • Консоль администратора (Zeppelin) - 30 минут
    Архитектура. Директории. Конфигурационные файлы. Управление. Обзор ноутбуков. Подсчёт skew на основе ФС.
    Лабораторная работа – 20 минут
  • Обновление СУБД - 10 минут
    Процесс минорного обновления СУБД.
    Лабораторная работа – 10 минут
  • Обзор утилит, входящих в поставку СУБД - 20 минут