Копировать ссылку на страницу Перейти в предыдущий раздел Перейти в следующий раздел

Классификация

Этап обработки документа, при котором сервис по тексту документа определяет, к какому классу относится документ. В качестве классов обычно выделяют виды документов: входящее письмо, договор, акт выполненных работ и т.д. Для правильной классификации документов требуется обучить классификатор, предоставив ему хотя бы по 100 документов каждого класса. В результате классификации формируется модель классификации.

Классификатор

Программный модуль, выполняющий классификацию документов.

Модель извлечения данных

Совокупность файлов, которые содержат набор значимых данных для каждого класса документов, а также скрипты и алгоритмы, выполняющие извлечение фактов.

Модель классификации

Совокупность файлов, содержащих набор признаков, характерных для каждого класса, управляющих скриптов и алгоритмов, выполняющих классификацию.

Чтобы сервис по тексту документа правильно определял его класс, подготовьте документы для обучения, создайте и обучите классификатор. Для обучения потребуется набор документов каждого класса. При необходимости добавьте в обученный классификатор классы для распознавания документов жестких форм.

© Компания Directum, 2020 Сообщество пользователей Directum
.navbar > a:hover { background: #FFD73B; }