Чтобы факты корректно извлекались из скан-копий бумажных документов, убедитесь, что они соответствуют требованиям:
Требование |
Возможные проблемы, если требование не соблюдено |
---|---|
Минимальное разрешение изображения – 300DPI |
Не распознаны отдельные слова или символы или распознаны некорректно |
Качество печати оригинального документа обеспечивает читабельность символов |
|
Текст документа имеет нулевой или положительный кернинг (межбуквенный интервал) |
|
Текст документа имеет как минимум единичный интерлиньяж (междустрочный интервал) |
|
Текст документа не перекрыт графическими элементами: подписями, печатями, штампами, резолюциями и т.п. |
|
Скан-копия документа не содержит физических повреждений: загибов, пятен, отверстий от дыроколов, степлерных скоб, скрепок и т.п. |
Не распознаны отдельные слова или символы или распознаны некорректно. При загибе угла страницы возможно некорректное определение формата таблиц документов, что приводит к некорректному извлечению фактов из таблиц |
Таблицы имеют замкнутую границу. Границы таблиц и ячеек хорошо пропечатаны и не имеют пропусков |
Таблица не извлечена в структурированном виде. Пропущены некоторые ячейки таблицы |
Ячейки таблицы не содержат графических элементов: подписей, печатей, штампов, резолюций и т.п. |
Содержание ячейки не распознано или распознано некорректно |
Паспорт на странице расположен параллельно границам изображения |
Не извлечены факты из паспорта или извлечены некорректно |
Изображение документа имеет сбалансированную яркость и контрастность в части четкости и цветности изображения |
Не распознаны отдельные слова или символы или распознаны некорректно Не извлечены факты из паспорта или извлечены некорректно |
© Компания Directum, 2020 | Сообщество пользователей Directum |