ProFor.Pro Profor.Pro
profor.pro / услуги / llm-automation
// service · 01 / 16

LLM-автоматизации: RAG, эмбеддинги, fine-tuning

Поиск по смыслу в корпоративной базе, ассистенты для рутины, дообучение моделей под клиентскую специфику.

Все услуги
Иллюстрация: LLM-автоматизации: RAG, эмбеддинги, fine-tuning fig. 01 llm-автоматизации: rag, эмбеддинги, fine-tuning

Что это

Заменяем у клиентов рутинные операции на LLM-ассистентов: поиск ответов в корпоративной базе знаний, классификацию входящих заявок, разбор счетов и договоров, генерацию отчётов. Под нестандартную доменную специфику — дообучение моделей.

Что входит

  • RAG-системы: индексирование корпоративных документов в векторной БД (pgvector, Qdrant, Weaviate), поиск по смыслу вместо ключевых слов, ответы с цитированием источников.
  • Эмбеддинги: подбор и тонкая настройка моделей (OpenAI, Cohere, BGE, мультиязычные) под язык и предметную область клиента.
  • Fine-tuning: дообучение open-source моделей (Llama, Qwen, Mistral) под конкретные задачи на собственном лабораторном стенде с GPU Blackwell-семейства.
  • Интеграции: ассистенты работают там, где работает клиент — Telegram, Slack, веб-интерфейс, плагины к 1С и почте.
  • Self-hosted развёртывание: для клиентов с требованиями к конфиденциальности — модели локально на их серверах, данные не уходят в публичные API.

Когда нужно

  • В компании накопились гигабайты документов (регламенты, инструкции, старая переписка), и сотрудники тратят часы на поиск нужного.
  • Есть рутина с понятными правилами, но слишком вариативная для классической автоматизации (RPA): обработка обращений, классификация, первичный разбор документов.
  • Готовые SaaS-LLM не подходят по конфиденциальности или дороги при больших объёмах запросов.

Опыт

У нас собственный лабораторный стенд с GPU Blackwell. На нём апробируем дообучение моделей и оцениваем качество результата перед внедрением в инфраструктуру клиента. Развёрнутые RAG-системы работают как на наших серверах (Cloudflare Workers и pgvector), так и в инфраструктуре заказчиков — в зависимости от требований к конфиденциальности данных.