К основному контенту
SmartData 2020Сезон: 2020
  • Доклады
  • Спикеры
  • Партнеры
  • О нас
  • Архив
    • Новая SmartData
    • Новая SmartData
    • Доклады
    • Спикеры
    • Партнеры
    • О нас
    • Архив
    EN

    Доклады

    • Доклады
    • Сохраненное
    • Смотреть запись

      Highly Normalized Hybrid Model, Или как мы внедрили свою модель хранения данных

      Структура DWH не очень гибкая и исправить это помогают современные подходы к проектированию: Data Vault и Anchorn modeling. Подробнее о том, что выбрать, в своем докладе расскажут Николай и Евгений.

      • Николай Гребенщиков

        Яндекс Go

      • Евгений Ермаков

        Яндекс Go

      На русском языкеRUСложность -Для практикующих инженеров
    • Смотреть запись

      Открытие

      Узнайте, что вас ждет в ближайшие 4 дня. Члены Программного комитета расскажут о расписании, интересных докладах и о том, в каком формате они пройдут. А команда организаторов конференции в свою очередь расскажет, как работает наша платформа, где будут проходить дискуссионные зоны, как подключаться к чатам и где задавать вопросы спикерам.

      • Алексей Федоров

        JUG Ru Group

      • Виталий Худобахшов

      На русском языкеRU
    • Смотреть запись

      Низкий уровень работы с данными

      Поговорим о нескольких технологиях, которые помогут вам выжать из машины больше — JIT, BLAS и параллельность.

      • Николай Марков

        Aligned Research Group

      На русском языкеRUСложность -Хардкор. Сложный низкоуровневый доклад, требующий от слушателя знаний технологии.
    • Смотреть запись

      Enterprise data platform: Инфраструктура данных как полигон для проверки бизнес-гипотез

      Доклад об опыте S7 в построении платформы данных.

      • Андрей Жуков

        S7 Техлаб

      На русском языкеRUСложность -Введение в технологию
    • Смотреть запись

      How to master time and space

      Applying MLOps to a high-performance geospatial data platform for the edge and cloud.

      • Phil Laszkowicz

        Futurice

      На английском языкеEN
    • Смотреть запись

      How we built Serverless Spark experience on Kubernetes

      During this session, we'll talk about architecture, why Staroid used Kubernetes, what were the challenges, and how the company solved them. You will also see a working demo so you can get an idea of what the Serverless Spark experience looks like and how it benefits in your work.

      • Moon soo Lee

        Staroid, Inc.

      На английском языкеENСложность -Введение в технологию
    • Смотреть запись

      По пути из Kafka в NiFi: Как не сломать и не потерять

      В докладе рассказывается о построении отказоустойчивой схемы работы кластера Apache NiFi при использовании Apache Kafka в качестве источника входных данных.

      • Роман Коробейников

        VirtualHealth

      На русском языкеRUСложность -Для практикующих инженеров
    • Смотреть запись

      Оцифровка рабочего в режиме реального времени

      Какой путь проделывают данные с носимых устройств до пользовательского интерфейса системы Цифровой рабочий.

      • Алексей Коняев

        КРОК

      На русском языкеRUСложность -Введение в технологию
    • Смотреть запись

      Версионирование структуры баз данных на примере хранилища

      Владислав расскажет про версионирование структуры баз данных на примере хранилища в Lamoda.

      • Владислав Шишков

        Lamoda

      На русском языкеRUСложность -Для практикующих инженеров
    • Смотреть запись

      Kusto (Azure Data Explorer): Architecture and internals

      Доклад о принципах построения с нуля новой базы данных для работы с логами и телеметрией.

      • Евгений Рыжик

        Microsoft

      На русском языкеRUСложность -Хардкор. Сложный низкоуровневый доклад, требующий от слушателя знаний технологии.
    • Смотреть запись

      Подходы к построению современной платформы данных. Проблематика и концепция реализации

      Александр расскажет об основных характеристиках современной платформы данных, о различиях в архитектуре DWH, об используемых компонентах и open source дистрибутиве Hadoop.

      • Александр Ермаков

        Arenadata

      На русском языкеRUСложность -Введение в технологию
    • Смотреть запись

      AI-augmented data preparation: Строим technology-agnostic data pipelines для современных стеков данных вместе с AI

      Евгений расскажет о современных тенденциях Modern Data Stack, о преимуществах и недостатках старого (ETL) и нового (ELT) подходов и причинах, которые привели к созданию своего независимого DSL.

      • Евгений Легкий

        Retable

      На русском языкеRUСложность -Введение в технологию
    • Смотреть запись

      Как мы разрабатываем DMP для Такси, Еды и Лавки

      Владимир расскажет про мотивацию, которая нужна для разработки собственного ETL-инструмента, про превращение ETL и DWH в DMP. Спикер поделится тем, какие проблемы возникают в процессе разработки DMP и расскажет про опыт их решения.

      • Владимир Верстов

        Яндекс.Go

      На русском языкеRUСложность -Для практикующих инженеров
    • Смотреть запись

      Kotlin API for Apache Spark: Зачем мы сделали ещё один API для работы со Spark

      Паша с Виталиком поговорят о том, из чего выбирают дата-инженеры и почему решили сделать API для одного из самых популярных фреймворков для построения пайплайнов.

      • Паша Финкельштейн

        JetBrains

      • Виталий Худобахшов

      На русском языкеRUСложность -Введение в технологию
    • Смотреть запись

      How to master time and space

      Applying MLOps to a high-performance geospatial data platform for the edge and cloud.

      • Phil Laszkowicz

        Futurice

      На английском языкеEN
    • Смотреть запись

      Пишем гибкие пайплайны для дата-платформ с Dagster

      Зачем дружить Spark + Scala-джобы и Python-приложения? В докладе Андрей расскажет, зачем это нужно и как писать на Dagster пайплайны с переиспользуемыми блоками и гибкой архитектурой.

      • Андрей Кузнецов

        Одноклассники

      На русском языкеRUСложность -Введение в технологию
    • Смотреть запись

      SQL-миграции в Postgres под нагрузкой

      Сделать миграцию таблицы при остановленной БД не проблема. Но что делать, если нужно сделать миграцию «на горячую»? Николай расскажет вам об этом в виде практических советов для PostgreSQL.

      • Николай Аверин

        Miro

      На русском языкеRUСложность -Введение в технологию
    • Смотреть запись

      Безопасные интерактивные большие данные в банке: Business intelligence на Clickhouse

      В докладе Павел расскажет чем вызвана фрагментация данных в его организации, и какие типичные сценарии аналитики из-за этого страдают. Также он объяснит, почему для Дойче Банка не сработал классический подход, и что они научились делать иначе.

      • Павел Якунин

        ТехЦентр Дойче Банка

      На русском языкеRUСложность -Для практикующих инженеров
    • Смотреть запись

      Stateful streaming: Кейсы, паттерны, реализации

      В докладе мы поговорим о популярном сейчас подходе к обработке данных — обработке потоков, уделив особое внимание работе с состоянием.

      • Дмитрий Бугайченко

        Сбер

      На русском языкеRUСложность -Для практикующих инженеров
    • Смотреть запись

      Инициирующая загрузка в NiFi

      Поговорим о NiFi инициирующей загрузке и о том, как упростить себе жизнь в использовании NiFi.

      • Бронислав Житников

        Тинькофф

      На русском языкеRU
    • Смотреть запись

      CI/CD для Ml-моделей и датасетов

      Существует не очень качественная модель DS в продакшене и теперь нет возможности ее переобучить или обновить. Чтобы избежать такого, приходите послушать доклад Михаила на эту тему.

      • Михаил Марюфич

        Mail.Ru Group

      На русском языкеRUСложность -Для практикующих инженеров
    • Смотреть запись

      Scio — data processing at Spotify

      We'll talk about the evolution of big data at Spotify, from Python, Hadoop, Hive, Storm, Scalding to today's world of cloud, and serverless computing.

      • Neville Li

        Spotify

      На английском языкеENСложность -Для практикующих инженеров
    • Смотреть запись

      NeoFS: Хранение объектных данных по своим правилам

      Станислав хочет поделиться примером того, как можно заменить централизованный S3 для хранения сырых данных более доступным для решением, организовать политики так, чтобы обработка данных стала более эффективной. А также рассказать зачем там мультиграфы, гомоморфная криптография, многоходовые игры, доказательства с нулевым разглашением и прочий матан.

      • Станислав Богатырев

        NEO Saint Petersburg Competence Center

      На русском языкеRUСложность -Хардкор. Сложный низкоуровневый доклад, требующий от слушателя знаний технологии.
    • Смотреть запись

      Круглый стол: Языки программирования в Data Engineering

      Обсуждаем зоопарк языков и технологий, с которыми имеют дело дата-инженеры.

      • Паша Финкельштейн

        JetBrains

      • Виталий Брагилевский

        JetBrains

      • Виталий Худобахшов

      На русском языкеRU
    • Смотреть запись

      The latest and greatest of Delta Lake

      This talk is a gentle introduction to the latest and greatest of Delta Lake. You will learn what Delta Lake is and what challenges it aims to solve.

      На английском языкеENСложность -Введение в технологию
    • Смотреть запись

      Демо: Big Data tools

      Мы представим новый продукт компании JetBrains — Big Data Tools и расскажем, какие задачи он решает, покажем демо, разберем примеры использования. На все ваши вопросы ответят разработчики, непосредственно участвующие в создании BDT.

      • Олег Чирухин

        JetBrains

      На русском языкеRU
    • Смотреть запись

      Обзор технологий хранения больших данных. Плюсы, минусы, кому подойдет

      Доклад Максима будет про плюсы и минусы различных решений для хранения данных: облака или bare metal, Hadoop&CO, Vertica, ClickHouse, ExaSol, GreenPlum (ArenaDataDB), RDBMS, Teradata и др.

      • Максим Стаценко

        Яндекс

      На русском языкеRUСложность -Введение в технологию
    • Смотреть запись

      Kusto (Azure Data Explorer): Интерактивная платформа Big Data Майкрософта

      В докладе Александр расскажет, что отличает Kusto (Azure Data Explorer) от других решений, покажет, как сложная обработка лайв-стримов телеметрии размером в миллиарды строк (терабайты данных) может занимать секунды, и приоткроет занавес архитектуры на которой построен Kusto.

      • Александр Слуцкий

        Microsoft

      • Глеб Лесников

        Dodo Engineering

      На русском языкеRUСложность -Введение в технологию
    • Смотреть запись

      Наше хранилище для веб-аналитики

      На примере истории построения хранилища для сервиса расширенной веб-аналитики, Артур расскажет, как за последние 5 лет эволюционировала система хранения и генерации отчетов в его проекте.

      • Артур Хачуян

        Tazeros

      На русском языкеRUСложность -Для практикующих инженеров
    • Смотреть запись

      Закрытие

      Присоединяйтесь к подведению итогов SmartData вместе с Программным Комитетом: рассмотрим наиболее интересные доклады и обсуждения, а также доклады, к которым стоит вернуться после конференции.

      • Алексей Федоров

        JUG Ru Group

      • Сергей Бойцов

        JetBrains

      На русском языкеRU
    • Смотреть запись

      Сегментация: Единое окно для знаний о пользователе

      Мария и Ольга расскажут, как на JVM стеке и open source-технологиях построить аналитическую систему, многократно расширяющую возможности бизнеса.

      • Мария Носарева

        ivi

      • Ольга Макарова

        ivi

      На русском языкеRUСложность -Для практикующих инженеров
    • Смотреть запись

      Flink + Zeppelin: Streaming data analytics platform

      In this talk, Jeff would talk about how to use Flink on Zeppelin to build your own streaming data analytics platform.

      • Jeff Zhang

        Alibaba Group

      На английском языкеENСложность -Введение в технологию

    Конференция по Data Engineering

    Наши конференции
    • Календарь всех конференций
    • BiasConf
    • C++ Russia
    • КаргоКульт
    • DevOops
    • DotNext
    • Flow
    • GoFunc
    • Heisenbug
    • HolyJS
    • Hydra
    • IML
    • InBetween
    • JPoint
    • Joker
    • Mobius
    • PiterPy
    • SafeCode
    • SmartData
    • TechTrain
    • VideoTech
    • sysconf
    Навигация
    • Новая {name}
    • Доклады
    • Спикеры
    • Партнеры
    • О нас
    • Архив
    • Правовые документы

    JUG Ru Group

    Нужна помощь?

    • Телефон: +7 (812) 313-27-23
    • E-mail: support@smartdataconf.ru
    • Телеграм: @JUGConfSupport_bot

    Мы в социальных сетях

    • Ютуб
    • Икс
    • Телеграм-чат
    • Телеграм-канал
    • ВКонтакте
    • Хабр
    © JUG Ru Group, 2017–2025