Start of main content

Talk type: Talk

Path to the data model for the daily update of the past 100 days

  • Talk in Russian

Максим и Таня из команды, которая готовит в Яндексе данные рекламы и поиска. Они расскажут, какой путь прошли, когда выбирали архитектуру, что считали, какую разницу получили между разными подходами, почему отмели популярный Data Vault и как ради экономии отказывались от красивых решений.

Вводные: каждый день с десяток терабайт новых данных после обработки, сжатия и упаковки. Обновления приходят на данные до 100 дней в прошлое. Больше сотни потребителей — как автоматических скриптов, так и внутренних пользователей.

  • #архитектура
  • #mapreduce
  • #deltalake

Speakers

Invited experts

Talks