Копировать ссылку на страницу Перейти в предыдущий раздел Перейти в следующий раздел

Сервис Directum FactExtractor Learn Service настраивается в конфигурационном файле app.config.

Структура файла:

[DEFAULT]

debug = {Записывать в лог-файл отладочные сообщения}

port = {TCP-порт сервиса}

training = {Разрешить использовать сервис как сервис обучения}

model_lifetime = {Время хранения модели в пуле}

dbname = {Имя базы данных PostgreSQL}

dbuser = {Имя пользователя для подключения к СУБД PostgreSQL}

dbhost = {Адрес СУБД PostgreSQL}

dbpass = {Пароль для подключения к СУБД PostgreSQL}

dbport = {Порт для подключения к СУБД PostgreSQL}

queue_connection = {Строка подключения к RabbitMQ}

message_ttl_seconds = {Время хранения сообщений в RabbitMQ}

prefetch_count = {Количество одновременно обрабатываемых сообщений}

[LOGGING]

period = {Периодичность создания новых лог-файлов}

suffix = {Формат названия лог-файлов}

filename = {Имя лог-файла}

path = {Путь до папки с лог-файлами}

[CRF]

algorithm = {Алгоритм обучения}

c1 = {Коэффициент L1-регуляризации}

c2 = {Коэффициент L2-регуляризации}

max_iterations = {Максимальное число итераций обучения}

all_possible_transitions = {Генерировать все сочетания классов}

verbose = {Подробный режим вывода}

test_size = {Размер выборки для расчета метрик}

[APM]

server_url = {Адрес сервиса Elastic APM Service}

metrics_interval = {Интервал сбора метрик}

span_frames_min_duration = {Время обработки документа при возникновении ошибки, при котором в лог-файл записывается подробная информация о ней}

DEFAULT – основные настройки сервиса:

debug. Записывать в лог-файл отладочные сообщения. Возможные значения: True, False. Значение по умолчанию True.
port. TCP-порт сервиса. Значение по умолчанию 9019.
training. Разрешить использовать FactExtractor Learn Service в качестве сервиса обучения. Возможные значения: True, False. Значение по умолчанию True. Подробнее см. описание параметра FactExtractorServiceLearn в конфигурационном файле Directum SmartService.
model_lifetime. Время хранения модели в невыгружаемом пуле в минутах. Модели, к которым не обращаются в течение этого времени, выгружаются из пула. Укажите целое число больше нуля. Значение по умолчанию 60.
dbname. Имя базы данных PostgreSQL.
dbuser. Имя пользователя для подключения к СУБД PostgreSQL.
dbhost. Адрес СУБД PostgreSQL.
dbpass. Пароль для подключения к СУБД PostgreSQL.
dbport. Порт для подключения к СУБД PostgreSQL.
queue_connection. Строка подключения к RabbitMQ в формате amqp://{Имя пользователя}:{Пароль}@{Адрес}:{Порт}/{Виртуальный хост}.
message_ttl_seconds. Время хранения сообщений об обработке документа в RabbitMQ в секундах. Значение по умолчанию 86400.
prefetch_count. Количество одновременно обрабатываемых запросов на сервис. Если параметр отсутствует, равно количеству ядер процессора. Значение по умолчанию 1.

Примечание.

Параметры подключения к базе данных должны совпадать с параметрами, указанными в конфигурационном файле Directum SmartService.

LOGGING – параметры ведения лог-файлов:

period. Периодичность создания новых лог-файлов. Возможные значения:
per_minute – каждую минуту;
per_hour – каждый час;
per_day – каждый день;
midnight – каждый день в полночь.

Значение по умолчанию midnight.

suffix. Формат названия лог-файла. Значение по умолчанию %%Y%%m%%d.
filename. Имя лог-файла.
path. Путь до папки с лог-файлами.

CRF – параметры обучения модели. Подробнее описание параметров см. в документации к библиотеке Sklearn-crfsuite. Параметры являются внутренними, изменять не рекомендуется.

algorithm. Поддерживается только lbfgs.
c1, c2. Значение коэффициентов по умолчанию 0,1.
max_iterations. Максимальное количество итераций для обучения. Значение по умолчанию 500.
all_possible_transitions. Значение по умолчанию True.
verbose. Значение по умолчанию 1.
test_size. Значение по умолчанию 0,25.

APM – настройки сервиса Directum Elastic APM Service:

server_url. Адрес сервиса Elastic APM Service.
metrics_interval. Интервал сбора метрик о состоянии памяти и CPU. Значение по умолчанию 0s, при котором метрики не собираются.
span_frames_min_duration. Если при обработке документа возникла ошибка и время обработки превышает значение параметра, в лог-файл записывается не только факт ошибки, но и подробная информация о ней. Значение по умолчанию 0ms, при котором запись в лог-файл отключена.
© Компания Directum, 2020 Сообщество пользователей Directum
.navbar > a:hover { background: #FFD73B; }