Сервис Directum FactExtractor Learn Service настраивается в конфигурационном файле app.config.
Структура файла:
[DEFAULT]
debug = {Записывать в лог-файл отладочные сообщения}
port = {TCP-порт сервиса}
training = {Разрешить использовать сервис как сервис обучения}
model_lifetime = {Время хранения модели в пуле}
dbname = {Имя базы данных PostgreSQL}
dbuser = {Имя пользователя для подключения к СУБД PostgreSQL}
dbhost = {Адрес СУБД PostgreSQL}
dbpass = {Пароль для подключения к СУБД PostgreSQL}
dbport = {Порт для подключения к СУБД PostgreSQL}
queue_connection = {Строка подключения к RabbitMQ}
message_ttl_seconds = {Время хранения сообщений в RabbitMQ}
prefetch_count = {Количество одновременно обрабатываемых сообщений}
[LOGGING]
period = {Периодичность создания новых лог-файлов}
suffix = {Формат названия лог-файлов}
filename = {Имя лог-файла}
path = {Путь до папки с лог-файлами}
[CRF]
algorithm = {Алгоритм обучения}
c1 = {Коэффициент L1-регуляризации}
c2 = {Коэффициент L2-регуляризации}
max_iterations = {Максимальное число итераций обучения}
all_possible_transitions = {Генерировать все сочетания классов}
verbose = {Подробный режим вывода}
test_size = {Размер выборки для расчета метрик}
[APM]
server_url = {Адрес сервиса Elastic APM Service}
metrics_interval = {Интервал сбора метрик}
span_frames_min_duration = {Время обработки документа при возникновении ошибки, при котором в лог-файл записывается подробная информация о ней}
DEFAULT – основные настройки сервиса:
| • | debug. Записывать в лог-файл отладочные сообщения. Возможные значения: True, False. Значение по умолчанию True. |
| • | port. TCP-порт сервиса. Значение по умолчанию 9019. |
| • | training. Разрешить использовать FactExtractor Learn Service в качестве сервиса обучения. Возможные значения: True, False. Значение по умолчанию True. Подробнее см. описание параметра FactExtractorServiceLearn в конфигурационном файле Directum SmartService. |
| • | model_lifetime. Время хранения модели в невыгружаемом пуле в минутах. Модели, к которым не обращаются в течение этого времени, выгружаются из пула. Укажите целое число больше нуля. Значение по умолчанию 60. |
| • | dbname. Имя базы данных PostgreSQL. |
| • | dbuser. Имя пользователя для подключения к СУБД PostgreSQL. |
| • | dbhost. Адрес СУБД PostgreSQL. |
| • | dbpass. Пароль для подключения к СУБД PostgreSQL. |
| • | dbport. Порт для подключения к СУБД PostgreSQL. |
| • | queue_connection. Строка подключения к RabbitMQ в формате amqp://{Имя пользователя}:{Пароль}@{Адрес}:{Порт}/{Виртуальный хост}. |
| • | message_ttl_seconds. Время хранения сообщений об обработке документа в RabbitMQ в секундах. Значение по умолчанию 86400. |
| • | prefetch_count. Количество одновременно обрабатываемых запросов на сервис. Если параметр отсутствует, равно количеству ядер процессора. Значение по умолчанию 1. |
Примечание.
Параметры подключения к базе данных должны совпадать с параметрами, указанными в конфигурационном файле Directum SmartService.
LOGGING – параметры ведения лог-файлов:
| • | period. Периодичность создания новых лог-файлов. Возможные значения: |
| • | per_minute – каждую минуту; |
| • | per_hour – каждый час; |
| • | per_day – каждый день; |
| • | midnight – каждый день в полночь. |
Значение по умолчанию midnight.
| • | suffix. Формат названия лог-файла. Значение по умолчанию %%Y%%m%%d. |
| • | filename. Имя лог-файла. |
| • | path. Путь до папки с лог-файлами. |
CRF – параметры обучения модели. Подробнее описание параметров см. в документации к библиотеке Sklearn-crfsuite. Параметры являются внутренними, изменять не рекомендуется.
| • | algorithm. Поддерживается только lbfgs. |
| • | c1, c2. Значение коэффициентов по умолчанию 0,1. |
| • | max_iterations. Максимальное количество итераций для обучения. Значение по умолчанию 500. |
| • | all_possible_transitions. Значение по умолчанию True. |
| • | verbose. Значение по умолчанию 1. |
| • | test_size. Значение по умолчанию 0,25. |
APM – настройки сервиса Directum Elastic APM Service:
| • | server_url. Адрес сервиса Elastic APM Service. |
| • | metrics_interval. Интервал сбора метрик о состоянии памяти и CPU. Значение по умолчанию 0s, при котором метрики не собираются. |
| • | span_frames_min_duration. Если при обработке документа возникла ошибка и время обработки превышает значение параметра, в лог-файл записывается не только факт ошибки, но и подробная информация о ней. Значение по умолчанию 0ms, при котором запись в лог-файл отключена. |
| © Компания Directum, 2020 | Сообщество пользователей Directum |