Подать доклад Купить билет

О конференции

11-14 октября пройдет SmartData 2021 — конференция по Data Engineering.

Стриминг

  • Flink
  • Spark
  • Kafka
  • Beam
  • Pulsar

СУБД и хранилища для больших данных

Использование классических реляционных, колоночных, NoSQL, SMP/MPP хранилищ для построения DWH:

  • Hive, Impala, Presto, Vertica, ClickHouse, Cassandra
  • Teradata, Redshift, GreenPlum, Exadata
  • MSSQL, PostgreSQL
  • MongoDB, DynamoDB
  • S3, ADLS, GCS, HDFS

Архитектура DWH

  • Моделирование данных
  • Примеры построения корпоративных хранилищ данных
  • Оперативная аналитика
  • Ad-hoc reporting
  • Hadoop
  • Iceberg, DeltaLake

Data governance

  • Безопасность данных
  • Качество данных
  • Метаданные и управление каталогом
  • Управление основными данными
  • Миграция данных

Технологии построения ETL

  • Spark
  • Hadoop MapReduce
  • Sqoop
  • NiFi
  • Анализ производительности и оптимизация

Оркестрация и MLOps

  • Airflow, Luigi, Oozie
  • MLflow
  • Dagster

Другое

  • Дата инженерия не для дата инженеров
  • CI/CD для пайплайнов данных
  • Тестирование

Cloud solutions

  • Snowflake
  • Databricks
  • AWS, GCP, Azure

Если вы занимаетесь Data Engineering и хотите первыми узнавать о новых технологиях и перспективных направлениях, подписывайтесь на новости конференции.

Фичи конференции

  • Виртуальная площадка и нетворкинг
  • Видео в разрешении 4К
  • Прямой эфир и запись
  • Мы отвечаем за то, что делаем. Если вам не понравится — мы вернем вам деньги
  • Активности и доклады от партнеров
  • Дискуссионные зоны онлайн

Спикеры

Andy Pavlo
Andy Pavlo Carnegie Mellon University
Associate Professor of Databaseology in the Computer Science Department at Carnegie Mellon University. His research interest...
Andy Pavlo

Associate Professor of Databaseology in the Computer Science Department at Carnegie Mellon University. His research interest is in database management systems, specifically main memory systems, self-driving/autonomous architectures, transaction processing systems, and large-scale data analytics. At CMU, Andy is a member of the Database Group and the Parallel Data Laboratory. He's the co-founder and CEO of OtterTune.

Евгений Ермаков
Евгений Ермаков Яндекс Go
Более 10 лет опыта работы в ИТ-сфере. Архитектор хранилищ данных и систем анализа в Mail.ru Group...

Более 10 лет опыта работы в ИТ-сфере. Архитектор хранилищ данных и систем анализа в Mail.ru Group и Яндекс.Go. Кандидат технических наук, автор более 10 работ в области анализа данных, соавтор монографии по теории и практике анализа параллельных баз данных.

Николай Гребенщиков
Николай Гребенщиков Яндекс.Go
Более 15 лет опыта работы в ИТ-сфере. Последние 1.5 года развивает хранилище данных в Яндекс.Go. Специализируется...
Николай Гребенщиков

Более 15 лет опыта работы в ИТ-сфере. Последние 1.5 года развивает хранилище данных в Яндекс.Go. Специализируется на MPP СУБД Greenplum.

Кирилл Рыбачук
Кирилл Рыбачук Cherry Labs
8 лет в индустрии машинного обучения, 4 года в разработке систем компьютерного зрения в Cherry Labs....
Кирилл Рыбачук

8 лет в индустрии машинного обучения, 4 года в разработке систем компьютерного зрения в Cherry Labs. Интересуется созданием пайплайнов ML, оптимизацией моделей, автоматизацией и гибкостью инструментов для нужд разработки и исследований.

Николай Голов
Николай Голов ManyChat
Глава Data Engineering в ManyChat, отвечает за все пайплайны и платформу данных для аналитики (хранилище, BI,...
Николай Голов

Глава Data Engineering в ManyChat, отвечает за все пайплайны и платформу данных для аналитики (хранилище, BI, ETL, интеграционные сервисы). Раньше был руководителем Data Platform в Avito. В область ответственности Data Platform входили системы больших данных, OLTP-базы (PostgreSQL), NoSQL-базы (MongoDB, Redis, Tarantool, VoltDB), а также системы очередей и потоковой обработки данных (RabbitMQ, NSQ, Spark). Также Николай преподает в НИУ ВШЭ, где занимается научными исследованиями в области современных методологий построения хранилищ данных (Data Vault и Anchor Modeling) и изучает BlockChain.

Партнеры

Если бы не компании, которые нас поддерживают, мы не смогли бы проводить для вас SmartData ежегодно на таком высоком уровне. Конференция растет и развивается благодаря нашим партнерам.

Информационные партнеры

Если вы хотите стать партнёром конференции — пишите на partners@cppconf.ru.