Копировать ссылку на страницу Перейти в предыдущий раздел Перейти в следующий раздел

Сервис Directum Classifier Service настраивается в конфигурационном файле app.config.

Структура файла:

[DEFAULT]

debug = {Записывать в лог-файл отладочные сообщения}

area = {Используемый раздел конфигурационного файла}

max_models_in_pool = {Максимальное количество моделей классификации в пуле}

max_pool_model_lifetime = {Время хранения модели классификации в пуле}

dbname = {Имя базы данных PostgreSQL}

dbuser = {Имя пользователя для подключения к СУБД PostgreSQL}

dbhost = {Адрес СУБД PostgreSQL}

dbpass = {Пароль для подключения к СУБД PostgreSQL}

dbport = {Порт для подключения к СУБД PostgreSQL}

csv_text_field = {Название поля для обучения данными в формате CSV}

csv_class_field = {Название поля для обучения данными в формате CSV}

csv_external_id_field = {Название поля для обучения данными в формате CSV}

allow_local_path = {Разрешить обучение из локальной папки}

repository = {Тип репозитория для хранения моделей классификации}

port = {TCP-порт сервиса}

training_service = {Разрешить использовать сервис как сервис обучения классификаторов}

queue_connection = {Строка подключения к RabbitMQ}

message_ttl_seconds = {Время хранения сообщений в RabbitMQ}

prefetch_count = {Количество одновременно обрабатываемых сообщений}

[DEVELOP]

allow_local_path = {Разрешить обучение из локальной папки}

[LOGGING]

period = {Периодичность создания новых лог-файлов}

suffix = {Формат названия лог-файлов}

filename = {Имя лог-файла}

path = {Путь до папки с лог-файлами}

[APM]

server_url = {Адрес сервиса Elastic APM Service}

metrics_interval = {Интервал сбора метрик}

span_frames_min_duration = {Время обработки документа при возникновении ошибки, при котором в лог-файл записывается подробная информация о ней}

DEFAULT – основные настройки сервиса:

debug. Записывать в лог-файл отладочные сообщения. Возможные значения: True, False. Значение по умолчанию True.
area. Используемый в данный момент раздел конфигурационного файла. Используется для быстрого переключения между настройками окружения. Если параметр не задан в указанном разделе, используется значение параметра из раздела DEFAULT. Пример значения: DEVELOP.
max_models_in_pool. Максимальное количество моделей классификации, хранящихся в невыгружаемом пуле. Если модель классификации находится в пуле, обращение к ней выполняется быстрее, таким образом ускоряется классификация текстов. Укажите целое число больше нуля. Значение по умолчанию 15.
max_pool_model_lifetime. Время хранения модели классификации в пуле в минутах. Модели, к которым не обращались в течение этого промежутка времени, выгружаются из пула. Укажите целое число больше нуля. Значение по умолчанию 60.
dbname. Имя базы данных PostgreSQL.
dbuser. Имя пользователя для подключения к СУБД PostgreSQL.
dbhost. Адрес СУБД PostgreSQL.
dbpass. Пароль для подключения к СУБД PostgreSQL.
dbport. Порт для подключения к СУБД PostgreSQL.

Примечание

Параметры подключения к базе данных должны совпадать с параметрами, указанными в конфигурационном файле Directum SmartService.

csv_text_field, csv_class_field, csv_external_id_field. Названия полей в csv файле для обучения классификаторов через набор данных в формате CSV. Параметры являются внутренними, изменять не рекомендуется.
allow_local_path. Разрешить обучение классификаторов из локальной папки сервера. Возможные значения: True, False. Если установлено значение False, повышается безопасность работы. Значение по умолчанию True.
repository. Тип репозитория, используемого для хранения моделей классификации. Параметр является внутренним, изменять не рекомендуется.
port. TCP-порт сервиса. Значение по умолчанию 9007.
training_service. Разрешить использовать этот сервис в качестве сервиса обучения классификаторов. Возможные значения: True, False. Значение по умолчанию True. Подробнее см. описание параметра Training в конфигурационном файле Directum SmartService.
queue_connection. Строка подключения к RabbitMQ в формате amqp://{Имя пользователя}:{Пароль}@{Адрес}:{Порт}/{Виртуальный хост}.
message_ttl_seconds. Время хранения сообщений об обработке документа в RabbitMQ в секундах. Значение по умолчанию 86400.
prefetch_count. Количество одновременно обрабатываемых запросов на сервисе. Если параметр отсутствует, равно количеству ядер процессора. Значение по умолчанию 1.

LOGGING – параметры ведения лог-файлов:

period. Периодичность создания новых лог-файлов. Возможные значения:
per_minute – каждую минуту;
per_hour – каждый час;
per_day – каждый день;
midnight – каждый день в полночь.

Значение по умолчанию midnight.

suffix. Формат названия лог-файлов. Значение по умолчанию %%Y%%m%%d.
filename. Имя лог-файла.
path. Путь до папки с лог-файлами.

APM – настройки сервиса Directum Elastic APM Service:

server_url. Адрес сервиса Elastic APM Service.
metrics_interval. Интервал сбора метрик о состоянии памяти и CPU. Значение по умолчанию 0s, при котором метрики не собираются.
span_frames_min_duration. Если при обработке документа возникла ошибка и время обработки превышает значение параметра, в лог-файл записывается не только факт ошибки, но и подробная информация о ней. Значение по умолчанию 0ms, при котором запись в лог-файл отключена.
© Компания Directum, 2020 Сообщество пользователей Directum
.navbar > a:hover { background: #FFD73B; }