# Запрос на кластеризацию диалогов

Для того чтобы подготовить данные для обучения Бота, мы можем провести кластеризацию имеющихся диалогов с пользователями и клиентами (майнинг интентов). История диалогов разбивается на тематики, и в каждой тематике оказываются примеры реплик Собеседников и готовые ответы на них Оператора. Примеры высказываний Собеседников в дальнейшем включаются в обучающую выборку фраз для интентов, а ответы Оператора используются при прописывании ответов Бота в Диалоговом Сценарии.Формат данных для кластеризации следующий:

1. Таблица формата CSV;
2. Каждое сообщение (MESSAGE) располагается в отдельной строке таблицы;
3. Каждому диалогу присвоен уникальный ID номер (DIALOG\_ID) – ID диалога должен быть числом;
4. Все сообщения в каждом отдельном диалоге обладают разметкой того, к кому они относятся (к клиенту или к Оператору): MESSAGE\_TYPE равен 0, если это сообщение Собеседника, равен 1, если это сообщение Оператора.
5. Сообщения внутри диалога сопровождаются датой и временем отправки: DIALOG\_DT.
6. Внутри строк сообщения должны быть удалены все кавычки.

![image.png](https://codahosted.io/docs/_pM7PjYCmj/blobs/bl-n8uoTvahS7/ffb166f0cc4c177d4321155a49d4788645e2d15561a39f97e344ac8aa8a598028e7672fa8710d86e6b7e48571f90b7565348d1e1dcfd1f5fbbd79e8b6d45b49176e49a08919a6d6b09c924514d8db8ef48907ebe63592a84b2ddf0c12f8a8d289a501cba)Пример файла с данными в правильном формате доступен по [ссылке](https://docs.google.com/spreadsheets/d/1NQlXsNf7kBO1aD52S5EgKOfmmrbBXu0oLLm5_5IcrFE/edit?usp=sharing).Для отправки запроса на кластеризацию данных напишите нам на <info@chatme.ai>.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://chatme-ai-4.gitbook.io/docs/prilozheniya/zapros-na-klasterizaciyu-dialogov.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
