Рецепт платформы потоковой обработки данных на Apache Flink

Architecture of Data Platforms

Сложность -

Apache Flink в инфраструктуре Яндекс Go работает более 4 лет. Но до недавнего момента воспользоваться им могли лишь некоторые продвинутые разработчики — так как Flink не такой дружелюбный, как может показаться на первый взгляд. Все изменилось, когда спрос на стриминг от различных DWH Яндекс Go побудил нас запустить проект по снижению порога входа в потоковую обработку данных.

Расскажу, какую инфраструктуру мы построили вокруг кластеров Apache Flink, начиная от одной и заканчивая сотней Flink job, и о том, какой API выбрали для описания пайплайнов. В итоге мы получили платформу, в которой DE могут легко создавать поставки, не сталкиваясь со сложностями управления Apache Flink job и используя удобный DSL.

Спикеры

Данил Сабиров
Яндекс.Такси Технологии

Приглашенные эксперты

Владимир Верстов
Яндекс Go

Другие доклады по теме «Architecture of Data Platforms»
- Смотреть запись
  Как кролик съел зеленую сливу и не умер: сказ о миграции на Iceberg
  Валентин Пановский
  BestDoctor
  Зал 3Сложность -
- Смотреть запись
  Data Vault 2.0. В каких случаях внедрять, разбор основных проблем применения методологии при построении DWH на Greenplum
  Денис Лукьянов
  Ecom.tech
  Зал 3Сложность -
- Смотреть запись
  CDC от источника до хранилища: как в банке Синара построили CDC с применением продуктов Arenadata
  Иван Клименко
  Arenadata
  Зал 2

Расписание

Рецепт платформы потоковой обработки данных на Apache Flink

Спикеры

Приглашенные эксперты

Другие доклады по теме «Architecture of Data Platforms»