onPrem: Resources & infrastructure requirements
Данные требования подходят под “чистую” onPrem установку.
Необходимое ПО
Для установки платформы должен быть развернут KubernetesТребования к Kubernetes
Версия 1.27.x
StorageClass, который поддерживает RWX (ReadWriteMany) — https://kubernetes.io/docs/concepts/storage/persistent-volumes/
Прикладное ПО, необходимое для работы Платформы
Postgres 16.x
Redis 7.x.x
S3 Compatible Storage, ex. Minio
Rabbitmq 3.12.x
Максимальный размер сообщения 512мб
ClickHouse 23.8
Если требуется отказоустойчивость и высокая доступность, то Прикладное ПО должно быть развернуто за пределами Kubernetes (см. Рекомендуемые системные требования для разворачивания). Необходима сетевая доступность между всем необходимым ПО и Kubernetes. Если не требуется отказоустойчивость и высокая доступность, то все сервисы можно разместить в Kubernetes кластере, в таком случае из необходимого ПО для возможности развертывания Платформы будет нужен только Kubernetes, прикладное ПО будет развернуто в процессе установки Платформы автоматически (см. Минимальные системные требования для разворачивания в Kubernetes Cluster)
Требования к среде
Минимальные системные требования для разворачивания в Kubernetes Cluster
Функционал, требующий GPU будет недоступен при работе платформы на минимальных системных требованиях
Недоступен функционал подсистем распознавания (ASR) и генерации голоса (TTS)
Медленная работа встроенного FAQ сервиса (RAG, LLM)
Имя группы серверов
Назначение
Описание
ЦПУ
ОЗУ, Гб
Дисковое пространство, Гб
Количество ВМ
masters
мастер ноды оркестратора Kubernetes
4 ядра, производительность на ядро не менее чем у Intel® Xeon® Gold 6230
4
20
1-3
workers
управляемые ноды оркестратора Kubernetes
сервисы платформы, кроме NLU, LLM
Прикладное ПО
8 потоков, производительность на ядро не менее чем у Intel® Xeon® Gold 6230
32
250
3+
nlu-worker
управляемые ноды оркестратора Kubernetes
NLU сервисы
NER сервисы
не менее 16 ядер, производительность на ядро не менее чем у Intel® Xeon® Gold 6230
64
150
1+
llm-worker
управляемые ноды оркестратора Kubernetes
LLM&RAG сервисы
не менее 16 ядер, производительность на ядро не менее чем у Intel® Xeon® Gold 6230
32
150
1+
Рекомендуемые системные требования
Kubernetes Cluster
Имя группы серверов
Назначение
Описание
ЦПУ
ОЗУ, Гб
Дисковое пространство, Гб
Количество ВМ
GPU
masters
мастер ноды оркестратора Kubernetes
4 ядра, производительность на ядро не менее чем у Intel® Xeon® Gold 6230
4
20
1-3
workers
управляемые ноды оркестратора Kubernetes
сервисы платформы, кроме NLU, LLM
8 потоков, производительность на ядро не менее чем у Intel® Xeon® Gold 6230
32
250
3+
nlu-worker
управляемые ноды оркестратора Kubernetes
NLU сервисы
NER сервисы
не менее 16 ядер, производительность на ядро не менее чем у Intel® Xeon® Gold 6230
64
150
1+
llm-worker
управляемые ноды оркестратора Kubernetes
LLM&RAG сервисы
не менее 8 ядер, производительность на ядро не менее чем у Intel® Xeon® Gold 6230
64
150
1+
GPU видеокарта производительность не менее чем NVIDIA A10 16GB
voice-workers
управляемые ноды оркестратора Kubernetes
Сервисы работы с голосом:
ASR сервис
TTS сервис
не менее 8 ядер, производительность на ядро не менее чем у Intel® Xeon® Gold 6230
64
150
1+
GPU видеокарта производительность не менее чем Nvidia A10 GPU 16GB
Базы данных
Имя группы серверов
ЦПУ, ядра
ОЗУ, Гб
Дисковое пространство, Гб
Количество ВМ
Postgres
16
64
1000
2
Rabbitmq
8
16
300
3
Clickhouse
8
16
1000
2+
Redis
8
16
300
3
GPU requirement calculation
ASR TTS operation
Up to 5 languages
Type
200 sessions
300 sessions
400 sessions
ASR+TTS
Nvidia A10 16GB
2xNvidia A10 16GB
2xNvidia A10 16GB
ASR only
Nvidia A10 16GB
Nvidia A10 16GB
2xNvidia A10 16GB
TTS only
Nvidia A10 16GB
Nvidia A10 16GB
2xNvidia A10 16GB
Рекомендации по мониторингу и логированию
В рамках разворачивания Платформы будут развернуты следующие версии инструментов мониторинга и логирования:
Elastic Stack 8.5.1
Kube Prometheus Stack 61.3.1
Если данные инструменты уже используются у клиента, то они могут быть использованы для мониторинга и логирования Платформы
Результат подготовки среды
Выделены ресурсы и настроено ПО в соответствии с выбранным вариантом отказоустойчивости
Команде Graphlogic предоставлены
Доступ в kubernetes и Kubeconfig
IP адреса и учетные записи администратора в Прикладное ПО, если выбран вариант отказоустойчивой поставки, когда прикладное ПО расположено за пределами Kubernetes Cluster
Организована доступность среды для команды Graphlogic
Выданы данные по подключению к клиентским системам мониторинга и логирования, если предполагается их использование
Создано доменное имя для доступа к UI платформы, опционально, можно создать доменное имя для сервиса хранения объектов S3
Так как платформа работает с внешним окружение по протоколу https, к указанным выше доменным именам необходимо выпустить SSL сертификаты
Тестовое окружение
Предполагается разворачивание тестового окружения на той же среде, что подготовлена для продакшн окружения. В рамках подготовки среды нужны будут только ДНС имена и сертификаты для протокола https для доступа в UI (и s3 опционально)
Last updated