Архитектура интеллектуальных сервисов Ario

Ario — это система сервисов, выполняющих обработку документов и текстовой информации в прикладных решениях Directum RX. Новые интеллектуальные инструменты можно добавлять в систему постепенно, улучшая скорость и качество обработки корпоративного контента.

Информационная система передаёт документ сервисам Ario.
При работе с Directum RX документ можно захватить из папки на компьютере или с выделенной электронной почты.
С помощью нейросети определяет ориентацию страниц относительно расположенного на них текста. При необходимости корректирует положение на 90, 180 и 270 градусов.
Проводит предобработку изображения: стабилизирует яркость, контраст, выравнивает текст, поворачивая изображение на небольшие углы (до 5 градусов). Извлекает текст документа с применением компьютерного зрения и нейросетей.
Использует модели машинного обучения и инструменты обработки естественного языка. На основании созданных моделей разметки определяет и возвращает необходимые реквизиты документа.
Управляющий сервис
Отвечает за подключение к внешним системам через API. Собирает статистику запросов. Проверяет действительность лицензионного ключа.
Сервис
Классификации изображений
С помощью нейросети определяет ориентацию страниц относительно расположенного на них текста. При необходимости корректирует положение на 90, 180 и 270 градусов.
Сервис
Поиска объектов
Находит все подписи и печати в документе, возвращает их количество и координаты на странице.
Сервис
Извлечения текста
Проводит предобработку изображения: стабилизирует яркость, контраст, выравнивает текст, поворачивая изображение на небольшие углы (до 5 градусов). Извлекает текст документа с применением компьютерного зрения и нейросетей.
Сервис
Классификации текста
Классифицирует документ и любую текстовую информацию, определяет вид документа, ответственного исполнителя, группу номенклатурных позиций. Выполняет другие разрезы классификации с помощью моделей машинного обучения.
Сервис
Извлечения фактов
Использует модели машинного обучения и инструменты обработки естественного языка. На основании созданных моделей разметки определяет и возвращает необходимые реквизиты документа.
Отвечает за подключение к внешним системам через API. Собирает статистику запросов. Проверяет действительность лицензионного ключа.
Находит все подписи и печати в документе, возвращает их количество и координаты на странице.
Классифицирует документ и любую текстовую информацию, определяет вид документа, ответственного исполнителя, группу номенклатурных позиций. Выполняет другие разрезы классификации с помощью моделей машинного обучения.
PDF-файл и набор
извлеченных реквизитов
После того как сервисы завершают обработку, в целевую внешнюю систему возвращаются разделенные документы, которые содержались в исходном файле, а также их метаданные с указанием вида, реквизитов, подписей и печатей.

Обучение моделей

Обучение моделей извлечения фактов, подписей, печатей штампов и любых других элементов документа реализовано с помощью первоначальной визуальной разметки документа.

Оставьте свои контактные данные, и мы свяжемся с вами

Россия (+7)
Азербайджан (+994)
Армения (+374)
Беларусь (+375)
Казахстан (+997)
Кыргызстан (+996)
Молдова (+373)
Таджикистан (+992)
Туркменистан (+993)
Узбекистан (+998)
Другая страна