Сервис Directum FactExtractor Learn Service настраивается в конфигурационном файле app.config.
Структура файла:
[DEFAULT]
debug = {Записывать в лог-файл отладочные сообщения}
port = {TCP-порт сервиса}
training = {Разрешить использовать сервис как сервис обучения}
model_lifetime = {Время хранения модели в пуле}
dbname = {Имя базы данных PostgreSQL}
dbuser = {Имя пользователя для подключения к СУБД PostgreSQL}
dbhost = {Адрес СУБД PostgreSQL}
dbpass = {Пароль для подключения к СУБД PostgreSQL}
dbport = {Порт для подключения к СУБД PostgreSQL}
queue_connection = {Строка подключения к RabbitMQ}
message_ttl_seconds = {Время хранения сообщений в RabbitMQ}
prefetch_count = {Количество одновременно обрабатываемых сообщений}
[LOGGING]
period = {Периодичность создания новых лог-файлов}
suffix = {Формат названия лог-файлов}
filename = {Имя лог-файла}
path = {Путь до папки с лог-файлами}
[CRF]
algorithm = {Алгоритм обучения}
c1 = {Коэффициент L1-регуляризации}
c2 = {Коэффициент L2-регуляризации}
max_iterations = {Максимальное число итераций обучения}
all_possible_transitions = {Генерировать все сочетания классов}
verbose = {Подробный режим вывода}
test_size = {Размер выборки для расчета метрик}
[APM]
server_url = {Адрес сервиса Elastic APM Service}
metrics_interval = {Интервал сбора метрик}
span_frames_min_duration = {Время обработки документа при возникновении ошибки, при котором в лог-файл записывается подробная информация о ней}
DEFAULT – основные настройки сервиса:
• | debug. Записывать в лог-файл отладочные сообщения. Возможные значения: True, False. Значение по умолчанию True. |
• | port. TCP-порт сервиса. Значение по умолчанию 9019. |
• | training. Разрешить использовать FactExtractor Learn Service в качестве сервиса обучения. Возможные значения: True, False. Значение по умолчанию True. Подробнее см. описание параметра FactExtractorServiceLearn в конфигурационном файле Directum SmartService. |
• | model_lifetime. Время хранения модели в невыгружаемом пуле в минутах. Модели, к которым не обращаются в течение этого времени, выгружаются из пула. Укажите целое число больше нуля. Значение по умолчанию 60. |
• | dbname. Имя базы данных PostgreSQL. |
• | dbuser. Имя пользователя для подключения к СУБД PostgreSQL. |
• | dbhost. Адрес СУБД PostgreSQL. |
• | dbpass. Пароль для подключения к СУБД PostgreSQL. |
• | dbport. Порт для подключения к СУБД PostgreSQL. |
• | queue_connection. Строка подключения к RabbitMQ в формате amqp://{Имя пользователя}:{Пароль}@{Адрес}:{Порт}/{Виртуальный хост}. |
• | message_ttl_seconds. Время хранения сообщений об обработке документа в RabbitMQ в секундах. Значение по умолчанию 86400. |
• | prefetch_count. Количество одновременно обрабатываемых запросов на сервис. Если параметр отсутствует, равно количеству ядер процессора. Значение по умолчанию 1. |
Примечание.
Параметры подключения к базе данных должны совпадать с параметрами, указанными в конфигурационном файле Directum SmartService.
LOGGING – параметры ведения лог-файлов:
• | period. Периодичность создания новых лог-файлов. Возможные значения: |
• | per_minute – каждую минуту; |
• | per_hour – каждый час; |
• | per_day – каждый день; |
• | midnight – каждый день в полночь. |
Значение по умолчанию midnight.
• | suffix. Формат названия лог-файла. Значение по умолчанию %%Y%%m%%d. |
• | filename. Имя лог-файла. |
• | path. Путь до папки с лог-файлами. |
CRF – параметры обучения модели. Подробнее описание параметров см. в документации к библиотеке Sklearn-crfsuite. Параметры являются внутренними, изменять не рекомендуется.
• | algorithm. Поддерживается только lbfgs. |
• | c1, c2. Значение коэффициентов по умолчанию 0,1. |
• | max_iterations. Максимальное количество итераций для обучения. Значение по умолчанию 500. |
• | all_possible_transitions. Значение по умолчанию True. |
• | verbose. Значение по умолчанию 1. |
• | test_size. Значение по умолчанию 0,25. |
APM – настройки сервиса Directum Elastic APM Service:
• | server_url. Адрес сервиса Elastic APM Service. |
• | metrics_interval. Интервал сбора метрик о состоянии памяти и CPU. Значение по умолчанию 0s, при котором метрики не собираются. |
• | span_frames_min_duration. Если при обработке документа возникла ошибка и время обработки превышает значение параметра, в лог-файл записывается не только факт ошибки, но и подробная информация о ней. Значение по умолчанию 0ms, при котором запись в лог-файл отключена. |
© Компания Directum, 2020 | Сообщество пользователей Directum |