Доклад

Граф знаний как инфраструктура для AI-агентов: от датасетов к единому графу

Расскажу, как мы построили единый граф знаний поверх десятков разрозненных корпоративных датасетов — инфраструктуру, в которой AI-агент не угадывает ответ по похожим чанкам, а осознанно обходит структуру и связи данных.

В основе подхода:

  • извлечение сущностей и связей из текста через LightRAG, self-hosted LLM (Qwen + vLLM) на разнородном GPU-парке (H100/V100);
  • хранение в property-graph (LPG): FalkorDB + Cypher для графа, Qdrant для эмбеддингов;
  • слоистая архитектура данных: staging → доменные графы → канонический граф, со сквозным слоем качества;
  • гибридный поиск — вектор находит похожее, граф находит связанное;
  • единый API чтения с выбором режима обхода: агент сам решает, как получить ответ.

В докладе покажу:

  • почему векторного RAG недостаточно и где граф реально дает прирост — с результатами эксперимента и честным разбором, где он не помогает;
  • почему выбрали LPG, а не RDF, и LightRAG, а не Microsoft GraphRAG;
  • как устроен пайплайн построения графа: чанкинг, LLM-экстракция, entity resolution, запись в граф и вектор;
  • как из разнородного парка GPU собрать единый слой обработки;
  • как устроен read-path — API с режимами local / global / hybrid / mix;
  • какую добавочную стоимость дает граф — что нового мы узнаём о самих данных.
Доклады