Что это

Заменяем у клиентов рутинные операции на LLM-ассистентов: поиск ответов в корпоративной базе знаний, классификацию входящих заявок, разбор счетов и договоров, генерацию отчётов. Под нестандартную доменную специфику — дообучение моделей.

Что входит

RAG-системы: индексирование корпоративных документов в векторной БД (pgvector, Qdrant, Weaviate), поиск по смыслу вместо ключевых слов, ответы с цитированием источников.
Эмбеддинги: подбор и тонкая настройка моделей (OpenAI, Cohere, BGE, мультиязычные) под язык и предметную область клиента.
Fine-tuning: дообучение open-source моделей (Llama, Qwen, Mistral) под конкретные задачи на собственном лабораторном стенде с GPU Blackwell-семейства.
Интеграции: ассистенты работают там, где работает клиент — Telegram, Slack, веб-интерфейс, плагины к 1С и почте.
Self-hosted развёртывание: для клиентов с требованиями к конфиденциальности — модели локально на их серверах, данные не уходят в публичные API.

Когда нужно

В компании накопились гигабайты документов (регламенты, инструкции, старая переписка), и сотрудники тратят часы на поиск нужного.
Есть рутина с понятными правилами, но слишком вариативная для классической автоматизации (RPA): обработка обращений, классификация, первичный разбор документов.
Готовые SaaS-LLM не подходят по конфиденциальности или дороги при больших объёмах запросов.

Опыт

У нас собственный лабораторный стенд с GPU Blackwell. На нём апробируем дообучение моделей и оцениваем качество результата перед внедрением в инфраструктуру клиента. Развёрнутые RAG-системы работают как на наших серверах (Cloudflare Workers и pgvector), так и в инфраструктуре заказчиков — в зависимости от требований к конфиденциальности данных.

LLM-автоматизации: RAG, эмбеддинги, fine-tuning

Что это

Что входит

Когда нужно

Опыт

Часто берут вместе

Модернизация унаследованного ПО

Умный дом и интеграция legacy-устройств