Для кого эта услуга
AI чат бот для сайта — это не тот шаблонный «здравствуйте, выберите один из трёх вариантов», а умный консультант, который отвечает на вопросы клиентов на основе вашей базы знаний: документации, каталога, инструкций, договоров. Технически это называется RAG (Retrieval Augmented Generation) — когда нейросеть отвечает не из своей памяти, а на основе ваших документов.
Клиенты: онлайн-школы (ответы на вопросы учеников по курсам), услуговые компании (консультации по прайсу и условиям), B2B-сервисы (ответы по интеграциям и документации), магазины (консультант по каталогу). Запросы: «gpt консультант по каталогу товаров», «rag бот по базе знаний pdf», «чат бот с векторной базой qdrant».
Что входит в работу
- Сбор и обработка вашей базы знаний: PDF, DOCX, Notion, Confluence, сайт
- Чанкинг документов: разбиение на смысловые блоки оптимального размера
- Генерация embeddings и загрузка в векторную базу
- Настройка RAG-пайплайна: поиск по вопросу → контекст → ответ LLM
- Промпт-инжиниринг: ассистент отвечает только по базе, не выдумывает
- Виджет на сайт (HTML/JS, встраивается одной строкой) с настраиваемым дизайном
- Логирование диалогов, аналитика качества ответов
- Fallback на оператора — если бот не уверен, переключение на живого менеджера
- Антиспам и rate-limit — чтобы не разорили API
Как я работаю
- Анализ вашей базы знаний — объём, качество, структура.
- Подготовка: чистка, конвертация, чанкинг, загрузка в векторную базу.
- Подбор модели и промпта, тесты на 30 – 50 реальных вопросах.
- Виджет на сайт, тестирование во всех браузерах.
- Мониторинг качества первые две недели, корректировка промптов.
Стек и технологии
LLM: OpenAI GPT-4o / GPT-4o-mini, Claude Haiku/Sonnet, YandexGPT или GigaChat. Embeddings: OpenAI text-embedding-3-small или BAAI bge-m3. Векторная база: Qdrant (чаще всего, self-hosted), pgvector (если уже есть PostgreSQL), Pinecone (облако). Фреймворк: LangChain или чистый Python. Backend виджета — FastAPI. Frontend виджета — Vanilla JS, ~10 КБ с gzip.
Результат
Чат-бот на вашем сайте, отвечающий по вашей базе знаний со ссылками на источники. Админка, где вы видите все диалоги и можете переобучать бота. Документация по обновлению базы знаний — когда у вас появится новый контент, вы сами загружаете его в бота. Первый месяц — мониторинг качества и корректировка.
FAQ
Сколько стоит эксплуатация — в смысле API? Зависит от модели и количества диалогов. На GPT-4o-mini один диалог стоит 1 – 5 копеек. Для сайта с 1000 диалогов в месяц — 100 – 500 рублей. Считаем на старте под ваши объёмы.
Что если бот ответит неправильно? Настраиваем так, что при низкой уверенности бот пишет «я не уверен, переключаю на оператора» — не выдумывает. В критичных нишах (медицина, юридика) всегда есть disclaimer.
Можно ли обучить бота на закрытой документации, чтобы её не утекло в OpenAI? Для полностью закрытой информации — использую российские модели (YandexGPT, GigaChat) или self-hosted модели (Llama 3, Mistral). В этом случае данные не уходят за пределы вашего контура.