AI-чатбот с RAG на Claude или OpenAI

AI / RAG

От 50 000 ₽

Для кого эта услуга

AI чат бот для сайта — это не тот шаблонный «здравствуйте, выберите один из трёх вариантов», а умный консультант, который отвечает на вопросы клиентов на основе вашей базы знаний: документации, каталога, инструкций, договоров. Технически это называется RAG (Retrieval Augmented Generation) — когда нейросеть отвечает не из своей памяти, а на основе ваших документов.

Клиенты: онлайн-школы (ответы на вопросы учеников по курсам), услуговые компании (консультации по прайсу и условиям), B2B-сервисы (ответы по интеграциям и документации), магазины (консультант по каталогу). Запросы: «gpt консультант по каталогу товаров», «rag бот по базе знаний pdf», «чат бот с векторной базой qdrant».

Что входит в работу

  • Сбор и обработка вашей базы знаний: PDF, DOCX, Notion, Confluence, сайт
  • Чанкинг документов: разбиение на смысловые блоки оптимального размера
  • Генерация embeddings и загрузка в векторную базу
  • Настройка RAG-пайплайна: поиск по вопросу → контекст → ответ LLM
  • Промпт-инжиниринг: ассистент отвечает только по базе, не выдумывает
  • Виджет на сайт (HTML/JS, встраивается одной строкой) с настраиваемым дизайном
  • Логирование диалогов, аналитика качества ответов
  • Fallback на оператора — если бот не уверен, переключение на живого менеджера
  • Антиспам и rate-limit — чтобы не разорили API

Как я работаю

  1. Анализ вашей базы знаний — объём, качество, структура.
  2. Подготовка: чистка, конвертация, чанкинг, загрузка в векторную базу.
  3. Подбор модели и промпта, тесты на 30 – 50 реальных вопросах.
  4. Виджет на сайт, тестирование во всех браузерах.
  5. Мониторинг качества первые две недели, корректировка промптов.

Стек и технологии

LLM: OpenAI GPT-4o / GPT-4o-mini, Claude Haiku/Sonnet, YandexGPT или GigaChat. Embeddings: OpenAI text-embedding-3-small или BAAI bge-m3. Векторная база: Qdrant (чаще всего, self-hosted), pgvector (если уже есть PostgreSQL), Pinecone (облако). Фреймворк: LangChain или чистый Python. Backend виджета — FastAPI. Frontend виджета — Vanilla JS, ~10 КБ с gzip.

Результат

Чат-бот на вашем сайте, отвечающий по вашей базе знаний со ссылками на источники. Админка, где вы видите все диалоги и можете переобучать бота. Документация по обновлению базы знаний — когда у вас появится новый контент, вы сами загружаете его в бота. Первый месяц — мониторинг качества и корректировка.

FAQ

Сколько стоит эксплуатация — в смысле API? Зависит от модели и количества диалогов. На GPT-4o-mini один диалог стоит 1 – 5 копеек. Для сайта с 1000 диалогов в месяц — 100 – 500 рублей. Считаем на старте под ваши объёмы.

Что если бот ответит неправильно? Настраиваем так, что при низкой уверенности бот пишет «я не уверен, переключаю на оператора» — не выдумывает. В критичных нишах (медицина, юридика) всегда есть disclaimer.

Можно ли обучить бота на закрытой документации, чтобы её не утекло в OpenAI? Для полностью закрытой информации — использую российские модели (YandexGPT, GigaChat) или self-hosted модели (Llama 3, Mistral). В этом случае данные не уходят за пределы вашего контура.

$ ./contact --new-project

Есть задача? Обсудим

Расскажите, что нужно сделать — отвечу в течение 4 часов в рабочее время. Первая консультация бесплатно.

Самозанятый Калинкин Н. А. · работаю с физлицами и юрлицами
Используем для работы сайта и аналитики посещаемости. Подробнее
Принять
Отказаться