Автоматизация RAG на реальном кейсе
Автоматизация RAG на реальном кейсе Вчера выступал по теме запуска локальных моделей внутри кампании, где работаю. Оказывается тема ИИ интересует гораздо больше людей, чем я предполагал. Продолжая эту тему, разберём крутой кейс по промышленному использованию RAG (Retrieval-Augmen
16-10-2025 06:40 (МСК)
Автоматизация RAG на реальном кейсе Вчера выступал по теме запуска локальных моделей внутри кампании, где работаю. Оказывается тема ИИ интересует гораздо больше людей, чем я предполагал. Продолжая эту тему, разберём крутой кейс по промышленному использованию RAG (Retrieval-Augmented Generation) из доклада X5 Tech. Исходная система, начинавшаяся как чат-боты, столкнулась с рядом критических проблем: негибкий и монолитный пайплайн генерации ответов, сложности с управлением данными (множество дублирующихся Excel-файлов), неконтролируемый парсинг входных данных, без возможностей мониторинга и логирования. Это затрудняло эксперименты, согласования и самостоятельную работу заказчиков. Ключевым решением стал переход на модульную и гибкую архитектуру. Основные усилия были направлены на: 🔷 Создание сервиса Data Drive: Этот центральный хаб берет на себя хранение, версионирование и обработку документов. Он позволяет заказчикам самостоятельно обновлять данные, обеспечивает консистентность и управляет парсерами, решая проблему с дубликатами и неструктурированными файлами. 🔷 Внедрение графового пайплайна генерации: Вместо жесткой последовательности шагов, логика преобразована в граф из последовательных и условных блоков (например, перефразировщик, классификаторы). Это позволило устранить дублирование кода, исправить баги и дать возможность гибко настраивать и тестировать различные сценарии обработки запросов через конфигурационные файлы. 🔷 Полный рефакторинг сервиса поиска (Ретривер): Сервис был переписан с нуля за три недели, что позволило добавить ранее недоступную функциональность, такую как поддержка фильтров и тегов, и интегрировать его в новую экосистему. Проект находится в развитии: в планах — внедрение ролевого доступа и аутентификации, улучшение интерфейсов для визуализации пайплайнов и управления коллекциями, а также расширение возможностей логирования и тестирования через чат-интерфейс. Желаю команде создать мощную платформу для быстрого развертывания и экспериментирования с RAG-решениями. Личное впечатление: Понравилось честность и непосредственность докладчика. Слайд с тем как работала система до рефакторинга - просто песня, в целом костыли и болевые точки очень знакомые и отзывающиеся. Также понравилось наполненность доклада и точность в пояснении изменений. ✅Вывод: Этот кейс — отличный пример для всех, кто сталкивается с необходимостью превратить набор скриптов в отказоустойчивый и управляемый продакшен-сервис. 📹 Ссылка для просмотра: https://www.youtube.com/watch?v=JObQiulQe7Y #ITИнсайты