Сегментируем 600 миллионов пользователей в режиме реального времени каждый день

День 1 /  / Зал 3  /  RU /

Каждый день пользователи совершают миллионы действий в Интернете. Проекту FACETz DMP необходимо структурировать эти данные и проводить сегментацию для выявления предпочтений пользователей. Расскажем, как мы, используя Kafka и HBase:

  • сегментируем 600 миллионов пользователей после перехода с MapReduce на Realtime и как мы это сделали;
  • обрабатываем 5 миллиардов событий каждый сутки;
  • храним статистику по количеству уникальных пользователей в сегменте при потоковой обработке;
  • отслеживаем влияние изменений параметров сегментации.

Наши контакты