geektimes

Автоматизация секс-индустрии или госуслуги по-немецки

  • воскресенье, 14 октября 2018 г. в 00:13:35
https://habr.com/company/smartengines/blog/425775/
  • Разработка под iOS
  • Разработка под Android
  • Обработка изображений
  • Искусственный интеллект
  • Блог компании Smart Engines


С момента, когда мы вслух заявили о распознавании паспорта гражданина РФ на мобильном телефоне прошло уже более трех лет. За это время мы научили наш движок распознавать различные документы, удостоверяющие личность, для более, чем 165 стран мира. Но в этой статье мы решили не писать про высокую важность и сложность технологии, грандиозные масштабы разработки, а сосредоточиться на описании интересного с точки зрения автоматизации народного хозяйства варианта использования нашего движка. Если вам 18+, а также интересны подробности, добро пожаловать под кат.


Итак, в этой статье мы будем рассказывать про автоматизацию такого социального института Германии – сферы оказания сексуальных услуг. Несмотря на то, что проституция в этой стране разрешена официально, этот бизнес остается слабо контролируемым со стороны государства и, как результат, довольно опасным для всех участников процесса.


В 2017 году вступил в силу Закон о защите секс-работников, который призван навести порядок в профессиональной отрасли и отчасти бюрократизировать процедуру оказания интимных услуг. Так, немецкие гетеры будут обязаны раз в два года продлевать разрешение на работу, регистрироваться в городе, где они трудятся и проходить регулярное медицинское обследование. Клиенты, в свою очередь, получают доступ к полной базе высококачественных проверенных специалистов.


Логичным инструментом перевода Закона в практическое русло стала разработка мобильного приложения, которое помогает сотрудникам отрасли Германии успешно работать в новых условиях, не блуждая по путям бюрократической паутины. Приложение помогает девушкам разобраться со всеми тонкостями закона, полностью контролируя процедуру прохождения медицинских сертификатов и необходимых аккредитаций. Закон также подразумевает оперативный доступ к списку государственных услуг, для доступа к которым необходимо ввести данные документов, удостоверяющих личность. Именно здесь и нашло свое применение гибкое в плане настройки решение от Smart Engines, которое дает возможность быстро и качественно распознать документ и автоматически заполнить все необходимые поля в мобильном приложении.


Что ж, перейдем непосредственно к документу. Сертификат регистрации проституток изготавливается на специальной бумаге и складывается в компактную книжечку для удобства ношения (см. рисунок 1). В отличие от классического документа, удостоверяющего личность, Сертификат регистрации проституток допускает указание псевдонима, используемого деятелями сексуальной отрасли, вместо действительного имени. Дополнительно сертификат в обязательном порядке содержит номер документа, место и дату рождения, национальность, фотографию, срок действия, а также сведения об органе, выдавшем документ и контролирующим деятельность конкретного работника.



Рисунок 1 — Пример Сертификата регистрации проституток в Германии


Исходя из описанной структуры, задача распознавания такого документа осложняется следующими проблемами:


1. Независимая привязка каждой страницы. Из-за «книжной» структуры основной разворот при фотографировании не плоский, каждая страница геометрически искажена по-своему. Поэтому необходимо решать проблему привязки каждой страницы в отдельности (см. рисунок 2).



Рисунок 2 — Независимая привязка страниц Сертификата


2. Вариативность в заполнении. По желанию, в Сертификате может быть указано на выбор либо настоящее имя, либо псевдоним. В редких случаях может быть указана вся информация. Поэтому система должна быть готова к таким вариациям и не допускать путаницы во избежание недоразумений.


3. Неоднозначность в языке написания имени. Сертификат регистрации проститутки допускает написание имени на родном языке (а не только на немецком). Поэтому мы распознаем текст имени с помощью специальной нейронной сети, которая готова к расширенному латинскому алфавиту (включающему помимо стандартных букв соответствующие модификации букв, характерные для польского, венгерского, турецкого, испанского и т.п. языков) и далее, принимая в расчет указанную в документе национальность, принимаем решение о «правильных» для данного случая результатах распознавания.


В результате мы подготовили специальную сборку ядра распознавания для наших немецких коллег, встраивание которой в мобильное приложение упростило и ускорило ввод данных с Сертификата, о чем немецкие коллеги пишут в своем [пресс-релизе].


Вместо заключения


Помните, не так давно, в начале 2000-х, многие взрослые ругали своих детей, что из-за этих компьютеров они совсем разучатся писать простой шариковой ручкой. Но такими разговорами технологическое развитие не остановить! Сегодня, с появлением айфонов и андройдов с их бесконечно умными ассистентами, много-мегапиксельными камерами и чудовищно мощными процессорами печатать текст уже совсем не хочется. Именно поэтому технология распознавания паспортов так активно внедряется, позволяя нам тем самым получить от обычных мобильных приложений целое море новых ощущений, которые мы не испытывали ранее («…enable us to have so many great new experiences not possible before», (с) Apple September 12, 2018 Event Keynote).