Александр Боргардт
Компания: duckstax.com
Колоночные СУБД помогают нам решать проблему быстрой обработки данных за счет колоночного представления данных, компрессии типов и векторизации. Если верить определению из Википедии, то векторизация применяется только в колоночных СУБД.
На самом деле, векторизация окружает дата-инженера повсюду: NumPy, pandas, Apache Spark, Numba.
В докладе разберем основы работы колонок и векторизации. Рассмотрим, где можно еще ощутить мощь векторизации, и узнаем, что мешает ей эффективно работать.
Компания: duckstax.com
Компания: Tarantool Core Team