Распознавание естественного языка
Распознавание естественного языка Агентами выполняется с помощью Слота NLU. Слот NLU обучается на Обучающая выборка включенных в него Интентов.Подробнее о создании Интентов: Вкладка интентов — Intents.Подробнее о работе Слота NLU: Распознавание намерений | Слот NLU и под-слоты Intent и Fallback.
Обучающая выборка Интента
Обучающая выборка — это фразы с одинаковым или близким смыслом, с помощью которых человек может высказать конкретное намерение (Интент), и на которых обучается модель NLU с целью распознавания этих и всех прочих вариантов высказывания того же намерения (Интента). От качества Обучающая выборка напрямую зависит качество распознавания в Агенте.Цель, к которой нужно стремиться при составлении выборки — дать Агенту как можно больше разнообразных вариантов формулировки намерения (но в пределах 30 фраз).Слот NLU, обученный на конкретной Обучающая выборка, будет распознавать не только Реплика Собеседника, полностью повторяющие Обучающая фраза из выборки, но и Реплика, близкие по смыслу.
Рекомендации по наполнению обучающей выборки Интентов
Для успешного распознавания рекомендуется:
Подобрать от 10 до 30 обучающих фраз-примеров к каждому Интенту.
Обучающая фраза одного Интента должны быть синонимичны друг другу – обозначать одно и то же намерение.
Обучающая фраза должны представлять собой набор фраз, осмысленных предложений, а не набор ключевых слов или тематик.
Обучающая выборка должна быть разнообразной. Для этого следует использовать различные синонимы к словам и различные формулировки намерений.
Фразы из Обучающая выборка должны звучать реалистично. Для того чтобы понять, как Собеседники формулируют вопросы, можно, к примеру, просмотреть историю общения Собеседников с консультантом или оператором поддержки в чате.
Рекомендации по списку Интентов
Очень важно не только грамотно наполнить Обучающая выборка Интентов, но и корректно составить список самих Интентов:
Интенты, содержащие различные по смыслу намерения, стоит разделять. Интент, который содержит множество хоть и относящихся к одной тематике, но все же различных намерений, лучше разделить на несколько отдельных. Таким образом NLU Агента сможет более точно составить представление о смысле каждого Интента и более точно распознавать их в будущем.
Залог качественного распознавания в Агенте — это не только грамотно составленный список Интентов и Обучающая выборка, но и тестирование. Подробнее: Тестирование и улучшение распознавания Агента: подбор Confidence threshold
Важно: необходимо избегать случайного совпадения Обучающая фраза в выборках разных Интентов — если в разных Интентах находится одна и та же Обучающая фраза, то совпадающая с ней Реплика Собеседника будет отнесена NLU к одному из этих Интентов случайным образом.
Last updated