Сервис Directum Classifier Service настраивается в конфигурационном файле app.config.
Структура файла:
[DEFAULT]
debug = {Записывать в лог-файл отладочные сообщения}
area = {Используемый раздел конфигурационного файла}
max_models_in_pool = {Максимальное количество моделей классификации в пуле}
max_pool_model_lifetime = {Время хранения модели классификации в пуле}
dbname = {Имя базы данных PostgreSQL}
dbuser = {Имя пользователя для подключения к СУБД PostgreSQL}
dbhost = {Адрес СУБД PostgreSQL}
dbpass = {Пароль для подключения к СУБД PostgreSQL}
dbport = {Порт для подключения к СУБД PostgreSQL}
csv_text_field = {Название поля для обучения данными в формате CSV}
csv_class_field = {Название поля для обучения данными в формате CSV}
csv_external_id_field = {Название поля для обучения данными в формате CSV}
allow_local_path = {Разрешить обучение из локальной папки}
repository = {Тип репозитория для хранения моделей классификации}
port = {TCP-порт сервиса}
training_service = {Разрешить использовать сервис как сервис обучения классификаторов}
queue_connection = {Строка подключения к RabbitMQ}
message_ttl_seconds = {Время хранения сообщений в RabbitMQ}
prefetch_count = {Количество одновременно обрабатываемых сообщений}
[DEVELOP]
allow_local_path = {Разрешить обучение из локальной папки}
[LOGGING]
period = {Периодичность создания новых лог-файлов}
suffix = {Формат названия лог-файлов}
filename = {Имя лог-файла}
path = {Путь до папки с лог-файлами}
[APM]
server_url = {Адрес сервиса Elastic APM Service}
metrics_interval = {Интервал сбора метрик}
span_frames_min_duration = {Время обработки документа при возникновении ошибки, при котором в лог-файл записывается подробная информация о ней}
DEFAULT – основные настройки сервиса:
• | debug. Записывать в лог-файл отладочные сообщения. Возможные значения: True, False. Значение по умолчанию True. |
• | area. Используемый в данный момент раздел конфигурационного файла. Используется для быстрого переключения между настройками окружения. Если параметр не задан в указанном разделе, используется значение параметра из раздела DEFAULT. Пример значения: DEVELOP. |
• | max_models_in_pool. Максимальное количество моделей классификации, хранящихся в невыгружаемом пуле. Если модель классификации находится в пуле, обращение к ней выполняется быстрее, таким образом ускоряется классификация текстов. Укажите целое число больше нуля. Значение по умолчанию 15. |
• | max_pool_model_lifetime. Время хранения модели классификации в пуле в минутах. Модели, к которым не обращались в течение этого промежутка времени, выгружаются из пула. Укажите целое число больше нуля. Значение по умолчанию 60. |
• | dbname. Имя базы данных PostgreSQL. |
• | dbuser. Имя пользователя для подключения к СУБД PostgreSQL. |
• | dbhost. Адрес СУБД PostgreSQL. |
• | dbpass. Пароль для подключения к СУБД PostgreSQL. |
• | dbport. Порт для подключения к СУБД PostgreSQL. |
Примечание
Параметры подключения к базе данных должны совпадать с параметрами, указанными в конфигурационном файле Directum SmartService.
• | csv_text_field, csv_class_field, csv_external_id_field. Названия полей в csv файле для обучения классификаторов через набор данных в формате CSV. Параметры являются внутренними, изменять не рекомендуется. |
• | allow_local_path. Разрешить обучение классификаторов из локальной папки сервера. Возможные значения: True, False. Если установлено значение False, повышается безопасность работы. Значение по умолчанию True. |
• | repository. Тип репозитория, используемого для хранения моделей классификации. Параметр является внутренним, изменять не рекомендуется. |
• | port. TCP-порт сервиса. Значение по умолчанию 9007. |
• | training_service. Разрешить использовать этот сервис в качестве сервиса обучения классификаторов. Возможные значения: True, False. Значение по умолчанию True. Подробнее см. описание параметра Training в конфигурационном файле Directum SmartService. |
• | queue_connection. Строка подключения к RabbitMQ в формате amqp://{Имя пользователя}:{Пароль}@{Адрес}:{Порт}/{Виртуальный хост}. |
• | message_ttl_seconds. Время хранения сообщений об обработке документа в RabbitMQ в секундах. Значение по умолчанию 86400. |
• | prefetch_count. Количество одновременно обрабатываемых запросов на сервисе. Если параметр отсутствует, равно количеству ядер процессора. Значение по умолчанию 1. |
LOGGING – параметры ведения лог-файлов:
• | period. Периодичность создания новых лог-файлов. Возможные значения: |
• | per_minute – каждую минуту; |
• | per_hour – каждый час; |
• | per_day – каждый день; |
• | midnight – каждый день в полночь. |
Значение по умолчанию midnight.
• | suffix. Формат названия лог-файлов. Значение по умолчанию %%Y%%m%%d. |
• | filename. Имя лог-файла. |
• | path. Путь до папки с лог-файлами. |
APM – настройки сервиса Directum Elastic APM Service:
• | server_url. Адрес сервиса Elastic APM Service. |
• | metrics_interval. Интервал сбора метрик о состоянии памяти и CPU. Значение по умолчанию 0s, при котором метрики не собираются. |
• | span_frames_min_duration. Если при обработке документа возникла ошибка и время обработки превышает значение параметра, в лог-файл записывается не только факт ошибки, но и подробная информация о ней. Значение по умолчанию 0ms, при котором запись в лог-файл отключена. |
© Компания Directum, 2020 | Сообщество пользователей Directum |