Что это
Заменяем у клиентов рутинные операции на LLM-ассистентов: поиск ответов в корпоративной базе знаний, классификацию входящих заявок, разбор счетов и договоров, генерацию отчётов. Под нестандартную доменную специфику — дообучение моделей.
Что входит
- RAG-системы: индексирование корпоративных документов в векторной БД (pgvector, Qdrant, Weaviate), поиск по смыслу вместо ключевых слов, ответы с цитированием источников.
- Эмбеддинги: подбор и тонкая настройка моделей (OpenAI, Cohere, BGE, мультиязычные) под язык и предметную область клиента.
- Fine-tuning: дообучение open-source моделей (Llama, Qwen, Mistral) под конкретные задачи на собственном лабораторном стенде с GPU Blackwell-семейства.
- Интеграции: ассистенты работают там, где работает клиент — Telegram, Slack, веб-интерфейс, плагины к 1С и почте.
- Self-hosted развёртывание: для клиентов с требованиями к конфиденциальности — модели локально на их серверах, данные не уходят в публичные API.
Когда нужно
- В компании накопились гигабайты документов (регламенты, инструкции, старая переписка), и сотрудники тратят часы на поиск нужного.
- Есть рутина с понятными правилами, но слишком вариативная для классической автоматизации (RPA): обработка обращений, классификация, первичный разбор документов.
- Готовые SaaS-LLM не подходят по конфиденциальности или дороги при больших объёмах запросов.
Опыт
У нас собственный лабораторный стенд с GPU Blackwell. На нём апробируем дообучение моделей и оцениваем качество результата перед внедрением в инфраструктуру клиента. Развёрнутые RAG-системы работают как на наших серверах (Cloudflare Workers и pgvector), так и в инфраструктуре заказчиков — в зависимости от требований к конфиденциальности данных.