
Сергей Бойко
Т-Банк
Проект TEDI уже давно служит основой для запуска и оркестрации ETL-задач. Однако рост нагрузки и сложность управления задачами потребовали от команды Т-Банка новой архитектуры.
Расскажу, как в Т-Банке построили инфраструктуру нового поколения поверх Kubernetes — через CRD, Ansible Operator и собственные плагины. Вы узнаете, как выглядит жизненный цикл ETL-задачи от кода в Git до продакшен-артефакта, что такое «пробирки», как устроена доставка DAGов, и как мы интегрировали все это в существующий DataOps.
Покажу и что не получилось: деградации, боттлнеки. Подскажу, на что стоит обратить внимание при внедрении Kubernetes в дата-инфраструктуру.
Технологии: Kubernetes (Ansible Operator, CRD), Apache Airflow (конфигурация внутри «пробирок»), DataOps-инструменты (контроль артефактов через GitLab/S3), TEDI, Kubernetes API.
Аудитория:
Т-Банк