Ввода и распознавание различных документов
Этот особый класс документов стоит немного особняком – документы там достаточно формализованы, распознаваемых данных немного, присутствуют графические объекты, такие как подпись и фотография. Тексты на удостоверяющих документах слабо верифицируются по словарям, так как содержат фамилии, имена, топонимы, наименования пунктов выдачи. При этом, в распознавании удостоверяющих документов важна точность и минимизация ошибок, так как эти данные могут поступать напрямую в учётные системы.
Также, распознавание удостоверяющих документов может быть использовано в банковской сфере, в присутственных местах, где требуется предъявление документов. Посетитель предъявляет паспорт или иное удостоверение, система распознавания определяет ключевые параметры документа:
• ФИО;
• номер, серию;
• дату выдачи, орган выдавший документ;
• MRZ – machine-readable zone (машинно-читаемая зона для паспортов) и др.
Клиент автоматически находится в базе данных, сравниваются его предыдущие данные с паспортными, изменения, производится проверка на корректность данных. При необходимости можно сравнивать или демонстрировать оператору фотографию с паспорта и фото, сохранённое ранее – это позволит повысить защиту от мошенничеств, связанных с подделкой документов (хотя и не исключит возможность подделки полностью, на 100%). Интернет при первом же запросе выдает нам сайт
topfakeid.com , где как утверждают авторы, мы можем купить поддельные удостоверения личности с возможностью сканирования. Законно ли это – сомневаюсь. И работает ли – не знаю, но факт остается фактом, если есть спрос – будет и предложение.
На российском рынке сегодня представлено два основных решения по распознаванию удостоверений личности:
• ABBYY PassportReader SDK. Комплексное решение от известного разработчика систем распознавания, компании Аби.
• Smart IDReader. Достаточно новое на рынке, встраиваемое решение от компании SmartEngines.