Доклад
Граф знаний как инфраструктура для AI-агентов: от датасетов к единому графу
Расскажу, как мы построили единый граф знаний поверх десятков разрозненных корпоративных датасетов — инфраструктуру, в которой AI-агент не угадывает ответ по похожим чанкам, а осознанно обходит структуру и связи данных.
В основе подхода:
- извлечение сущностей и связей из текста через LightRAG, self-hosted LLM (Qwen + vLLM) на разнородном GPU-парке (H100/V100);
- хранение в property-graph (LPG): FalkorDB + Cypher для графа, Qdrant для эмбеддингов;
- слоистая архитектура данных: staging → доменные графы → канонический граф, со сквозным слоем качества;
- гибридный поиск — вектор находит похожее, граф находит связанное;
- единый API чтения с выбором режима обхода: агент сам решает, как получить ответ.
В докладе покажу:
- почему векторного RAG недостаточно и где граф реально дает прирост — с результатами эксперимента и честным разбором, где он не помогает;
- почему выбрали LPG, а не RDF, и LightRAG, а не Microsoft GraphRAG;
- как устроен пайплайн построения графа: чанкинг, LLM-экстракция, entity resolution, запись в граф и вектор;
- как из разнородного парка GPU собрать единый слой обработки;
- как устроен read-path — API с режимами local / global / hybrid / mix;
- какую добавочную стоимость дает граф — что нового мы узнаём о самих данных.