Доклад

Векторный поиск в PostgreSQL: pgvector изнутри

Векторный поиск давно перестал быть экзотикой: RAG-системы, семантический поиск, рекомендации — всё это работает с эмбеддингами. В PostgreSQL для этого используется расширение pgvector. Но когда данные вырастают до сотен тысяч и миллионов векторов, встает вопрос — как это работает внутри.

В докладе расскажу не только про то, какие бывают индексы, но и про внутреннее устройство pgvector. Разберем, как векторы физически хранятся в PostgreSQL, чем HNSW отличается от IVFFlat на уровне структур данных и алгоритмов, откуда берется потеря точности и как на нее влияют настройки индексов.

Про нагрузочное тестирование как инструмент для проверки гипотез тоже будет. Покажу, при каких объемах данных производительность начинает деградировать, почему фильтрация по метаданным может убить скорость поиска и как ведет себя pgvector под конкурентной нагрузкой.

В результате сформулируем практические рекомендации: для каких сценариев pgvector — подходящее решение, а где применение пока сопряжено с рисками. Доклад будет полезен разработчикам, которые уже пробуют pgvector в деле или только собираются и хотят понимать его реальные границы.

Спикеры

Доклады