Модуль «Инструменты Ario» состоит из сервисов и прикладной разработки Directum. Каждый сервис решает собственные задачи, а прикладная часть обеспечивает визуальный интерфейс для настройки и обучения сервисов.
Система сервисов Ario, основанная на инструментах искусственного интеллекта, позволяет автоматизировать рутинные операции в информационных системах компании (ECM, ERP, CRM и т.п.).
Сервисы обрабатывают как объекты, содержащие текст, так и документы без текстового слоя (отсканированные документы, PDF-документы без текстового слоя и т.д.):
• | извлекают текстовый слой из документов любых форматов; |
• | обучают классификаторы на подготовленном наборе данных: документах, записях справочников и т.п.; |
• | классифицируют документы с помощью обученных классификаторов; |
• | извлекают из текста нужные данные. Например, дату и номер договора; |
• | определяют наличие и координаты печатей и подписей на документах. |
Сервисы Directum Ario:

• | Directum Smart Service – предоставляет API для интеграции с информационной системой организации, управляет лицензированием и обеспечивает взаимодействие с другими сервисами; |
• | Directum TextExtractor Service – извлекает текст из изображений (jpg, jpeg, png, bmp, gif, tif, tiff, pdf без текстового слоя) и текстовых документов (doc, docx, dot, dotx, rtf, odt, ott, txt, xls, xlsx, ods, pdf). А также делит файл на несколько документов, конвертирует документы в формат pdf с текстовым слоем для поиска по тексту документов и определяет местоположение печатей; |
• | Directum Classifier Service – классифицирует документы в разных разрезах. Например, по видам: договоры, служебные записки, акты, приказы и т.д.; |
• | Directum FactExtractor Service – рассчитывает вероятность правильного извлечения данных из текста и приводит факты к единому формату, например, удаляя лишние символы или изменяя регистр текста. Является агрегатором для сервисов: |
• | Directum FactExtractor Rules Service – извлекает факты, в том числе данные таблиц, на основе правил; |
• | Directum FactExtractor Learn Service – извлекает факты на основе обучаемых моделей. Подготовить документы для обучения модели можно с помощью разметки в приложении AVIA; |
• | Directum Object Detection Service – определяет наличие и местоположение подписей на документе. При обработке документа сервис возвращает информацию о позиции объекта в документе: номер страницы, на которой расположен объект, а также его абсолютную позицию в пикселях относительно размера этой страницы; |
• | Directum Storage Service хранит большие объемы данных, за счет чего уменьшается размер сообщений, которые сервисы Ario передают друг другу. Таким образом ускоряется работа очередей в RabbitMQ; |
• | Directum Elastic APM Service отслеживает запросы между всеми перечисленными сервисами при обработке документов и измеряет скорость работы. |
Описание методов API сервисов Ario, примеры запросов и ответов доступны по ссылке.