Начало основного контента

Тип доклада: Доклад

Путь к модели данных для ежедневного апдейта 100 прошлых дней

  • Доклад на русском языке

Максим и Таня из команды, которая готовит в Яндексе данные рекламы и поиска. Они расскажут, какой путь прошли, когда выбирали архитектуру, что считали, какую разницу получили между разными подходами, почему отмели популярный Data Vault и как ради экономии отказывались от красивых решений.

Вводные: каждый день с десяток терабайт новых данных после обработки, сжатия и упаковки. Обновления приходят на данные до 100 дней в прошлое. Больше сотни потребителей — как автоматических скриптов, так и внутренних пользователей.

  • #архитектура
  • #mapreduce
  • #deltalake

Спикеры

Приглашенные эксперты

Доклады