Актуальность задачи ученых
На сегодняшний день языковые технологии искусственного интеллекта поддерживают лишь небольшую часть из более чем 7000 языков мира. Алфавиты на основе латиницы уже давно освоены системами ИИ, в то время как обучение систем распознавания языкам с другими системами письменности происходит значительно медленнее. Особенно остро проблема обстоит с урду и персидским (фарси) – государственными языками Пакистана и Ирана. Оба языка используют модифицированный арабский алфавит и отличаются сложными лигатурами.
До настоящего времени существующие датасеты документов оставляли практически без внимания удостоверения личности на урду и персидском. Это препятствовало разработке технологий распознавания, способных работать с документами Пакистана и Ирана. Представленный Smart Engines датасет MIDV-UP впервые изменил эту ситуацию, обеспечив разработчиков качественными данными для обучения ИИ. В состав MIDV-UP вошли 1000 уникальных образцов удостоверений нескольких типов документов – ID-карт, водительских удостоверений и свидетельств о рождении Ирана, а также ID-карт Пакистана. В общей сложности в датасете содержится 9000 полностью аннотированных изображений, полученных безопасным методом синтеза – новым способом создания обучающих данных без использования документов реальных людей.
MIDV-UP охватывает широкий спектр сценариев предъявления документов – от сканов до фотографий и видеоклипов с естественными помехами: тенями, бликами и искаженной перспективой. Специалисты Smart Engines использовали MIDV-UP для обучения нейросетевого ансамбля «Шерлок», предназначенного для распознавания и комплексной проверки физических и цифровых документов.
«Шерлок» выходит на новые рынки
«Шерлок» способен работать одновременно в видимом, ультрафиолетовом и инфракрасном диапазонах, анализировать голограммы и другие защитные элементы, осуществляя в общей сложности более 600 проверок. Это дает возможность детектировать подделки любой сложности и качества, начиная с паспортов с измененными и переклееными фотографиями и заканчивая муляжами и дипфейками. Решение было разработано при финансовой поддержке Фонда содействия инновациям и используется в пунктах автоматического паспортного контроля в аэропортах «Шереметьево», «Внуково» и «Кольцово», а также в РЖД, ФНС и банковском секторе.
«Отсутствие надежных ИИ-решений долгое время оставляло неавтоматизированным огромный рынок цифровых услуг, требующих ввод данных из документов на урду и фарси. Благодаря нашему новому датасету эти документы больше не является преградой для «Шерлока». Сегодня устойчивый спрос на технологии распознавания наблюдается не только в самих Пакистане и Иране, но и в России и других государствах – чему способствуют значительные миграционные и образовательные потоки. Теперь стало возможным масштабировать «Шерлока» как внутри страны, так и на международных рынках», – отмечает один из авторов MIDV-UP, генеральный директор Smart Engines, д.т.н. Владимир Арлазаров.
О конференции
Международная презентация MIDV-UP состоялась на главном мировом научном форуме в области анализа и распознавания документов – конференции ICDAR. Это ключевая площадка, где ежегодно собираются ведущие эксперты и исследователи со всего мира, чтобы обсудить передовые достижения и новые вызовы технологий распознавания и обработки изображений. Ученые Smart Engines ежегодно принимают участие в ICDAR, где представляют свои новейшие разработки.
Никто пока не комментировал эту страницу.