Щи, или Распознавание 330 млн лиц на скорости 1500 фото/сек

День 1 /  / Зал 1  /  Для практикующих инженеров

Высоконагруженное распознавание лиц на фотографиях пользователей в социальной сети. Распознаванием лиц сейчас никого не удивишь, если у вас не:

  • 330 миллионов пользовательских аккаунтов;
  • ежедневно заливается 20 млн пользовательских фотографий;
  • максимальное время на обработку одного фото не должно превышать 0.2 сек (забегая вперед, скажу, что нам удалось сделать это быстрее);
  • ограниченные объемы оборудования для решения задачи.

В докладе будут рассмотрены:

  • pipeline для построения векторов пользователей и поиска пользователя на загруженном фото;
  • обучение нейросети: построение dataset'а > обучение нейросети > построение датасета > варить до готовности;
  • детектор лиц на каскаде нейросетей и его оптимизация;
  • построение нормализованного вектора пользователя на GPU;
  • железо и оптимизации, запуск в облаке, отказоустойчивость.