Доклад

Путь к модели данных для ежедневного апдейта 100 прошлых дней

  • На русском языке
Презентация pptx

Максим и Таня из команды, которая готовит в Яндексе данные рекламы и поиска. Они расскажут, какой путь прошли, когда выбирали архитектуру, что считали, какую разницу получили между разными подходами, почему отмели популярный Data Vault и как ради экономии отказывались от красивых решений.

Вводные: каждый день с десяток терабайт новых данных после обработки, сжатия и упаковки. Обновления приходят на данные до 100 дней в прошлое. Больше сотни потребителей — как автоматических скриптов, так и внутренних пользователей.

  • #deltalake
  • #mapreduce
  • #архитектура

Спикеры

Приглашенные эксперты

Расписание