• 🔥 Большое обновление PirateHUB Private!

    PirateHUB Private - закрытое сообщество PirateHUB, внутри которого:
    150+ приваток авторов по различным направлениям, 15+ совместных доступов, несколько сотен курсов в день от зарубежных авторов напрямую и многое другое. Нас уже почти 1000 человек!


    Что внутри + отзывы довольных участников:

    Ознакомиться

    *Анонсированы крупные обновления, не пропустите!

    ❗️Вход по старой цене открыт до 7 ноября включительно! Каждый участник получает бесплатный доступ к Web-Master Club от PirateHUB Academy и дополнительные бонусы!

Программирование [ВigData Тeam] Практический курс по Big Data. Часть 2. Spark: from zero to hero (2023)

tttx

Помощник Администратора
Команда форума
Pirate PRO
Премиум
Премиум Лайт
Регистрация
27 Авг 2018
Сообщения
47,073
Реакции
949,447
vl3aY5twQQibdXtSh5Gfcw.png

ОПИСАНИЕ:

Практический курс по Big Data. Часть 2. Spark: from zero to hero [bigdata team]

На протяжении этой части курса вы будете работать со Spark: от основных терминов и RDD до Spark DataFrames и оптимизации Spark вычислений.

В этом модуле вы изучите:

  • cхема выполнения задачи в Spark;
  • основные термины Spark (job, task, stage);
  • представление вычислений в виде графа. Spark Python API. Spark RDD API;
  • Broadcast-сообщения и счетчики.
  • взаимодействие Hive и Spark SQL;
  • отличия DF от RDD.
  • Spark on YARN;
  • типы stage в Spark;
  • оптимизация операции shuffle;
  • настройка Garbage Collection, тюнинг потребления памяти.
ПРОДАЖНИК:

СКАЧАТЬ:
 

Назад
Сверху