<- Назад к списку работ

Автоматизация RAG на реальном кейсе

Автоматизация RAG на реальном кейсе Вчера выступал по теме запуска локальных моделей внутри кампании, где работаю. Оказывается тема ИИ интересует гораздо больше людей, чем я предполагал. Продолжая эту тему, разберём крутой кейс по промышленному использованию RAG (Retrieval-Augmen

16-10-2025 06:40 (МСК)

ITИнсайты

Автоматизация RAG на реальном кейсе Вчера выступал по теме запуска локальных моделей внутри кампании, где работаю. Оказывается тема ИИ интересует гораздо больше людей, чем я предполагал. Продолжая эту тему, разберём крутой кейс по промышленному использованию RAG (Retrieval-Augmented Generation) из доклада X5 Tech. Исходная система, начинавшаяся как чат-боты, столкнулась с рядом критических проблем: негибкий и монолитный пайплайн генерации ответов, сложности с управлением данными (множество дублирующихся Excel-файлов), неконтролируемый парсинг входных данных, без возможностей мониторинга и логирования. Это затрудняло эксперименты, согласования и самостоятельную работу заказчиков. Ключевым решением стал переход на модульную и гибкую архитектуру. Основные усилия были направлены на: 🔷 Создание сервиса Data Drive: Этот центральный хаб берет на себя хранение, версионирование и обработку документов. Он позволяет заказчикам самостоятельно обновлять данные, обеспечивает консистентность и управляет парсерами, решая проблему с дубликатами и неструктурированными файлами. 🔷 Внедрение графового пайплайна генерации: Вместо жесткой последовательности шагов, логика преобразована в граф из последовательных и условных блоков (например, перефразировщик, классификаторы). Это позволило устранить дублирование кода, исправить баги и дать возможность гибко настраивать и тестировать различные сценарии обработки запросов через конфигурационные файлы. 🔷 Полный рефакторинг сервиса поиска (Ретривер): Сервис был переписан с нуля за три недели, что позволило добавить ранее недоступную функциональность, такую как поддержка фильтров и тегов, и интегрировать его в новую экосистему. Проект находится в развитии: в планах — внедрение ролевого доступа и аутентификации, улучшение интерфейсов для визуализации пайплайнов и управления коллекциями, а также расширение возможностей логирования и тестирования через чат-интерфейс. Желаю команде создать мощную платформу для быстрого развертывания и экспериментирования с RAG-решениями. Личное впечатление: Понравилось честность и непосредственность докладчика. Слайд с тем как работала система до рефакторинга - просто песня, в целом костыли и болевые точки очень знакомые и отзывающиеся. Также понравилось наполненность доклада и точность в пояснении изменений. ✅Вывод: Этот кейс — отличный пример для всех, кто сталкивается с необходимостью превратить набор скриптов в отказоустойчивый и управляемый продакшен-сервис. 📹 Ссылка для просмотра: https://www.youtube.com/watch?v=JObQiulQe7Y #ITИнсайты

Перейти к источнику